美研究员开发新算法打击学术造假用AI查重论文图片

作者:  时间:2019-01-16  热度:

  来自美国纽约雪城大学(Syracuse University)的机器学习研究员丹尼尔·阿库纳(Daniel Acuna)等在2018年开发出一套算法,能利用人工智能(AI)识别学术论文中的图像造假,对论文图片进行查重。

  他们分析了生命科学领域来自4324本期刊的76万篇开放获取(Open Access)论文,并从中提出有效的263万张图片。其中,约有9%的图像存在高度重复。该团队又在其中选取了约4000张可疑图片进行人工核查。经测算,在所有论文中,约1.5%存在学术不端的嫌疑,0.6%确认存在图像方面的论文造假。

  在学术造假上,图片是藏污纳垢的死角。《科学》(Science)杂志和《撤稿观察》(Retraction Watch)2018年发布报告称,在过去10年里,学术期刊撤回的论文数量增加了10倍。这些论文中,约有1.7%是因为篡改了论文图像被撤回。

  美国宾夕法尼亚大学生物工程副教授阿荣·拉杰(Arjun Raj)早在2012年就指出,一篇生命科学领域的研究论文背后的科学成本约为30万-50万美元。2012年全年,美国研究人员共发表该领域论文15.2万篇。如果其中1.7%因图片造假需要被撤回,则仅在2012年,因此造成的损失就接近10亿美元。

  过去,图片审核工作往往要靠人力完成,几乎没有自动化的流程。《自然》(Nature)杂志会对收到的稿件随机抽样进行检查,并要求作者提供未编辑的图像作参考;生命科学领域的重要刊物《细胞生物学杂志》(Journal of Cell Biology)和《欧洲分子生物学组织杂志》(The EMBO Journal)会对图片进行手动查重。

  2018年6月,来自斯坦福大学的微生物学家分析了2009-2016年发表在《分子与细胞生物学》(Molecular and Cellular Biology)上的960篇论文,发现其中59篇含有“不适当的”重复图像,约有2%值得再去进行图像证伪。他们将情况反映给出版机构后,42篇论文更正了图片,5篇被撤稿。

  图片查重费时费力,以至于多数刊物都没有这项流程。《欧洲分子生物学组织杂志》主编表示,人工筛选非常耗时,早就应该有一个常规的、自动化的工具简化这一过程。

  但即使是ORI,每年也仅报告了10例图片造假的行为。因为成本过高,他们不会主动审查学术不端,仅在有举报的情况下进行。

  自诞生起,学术论文就承担着描述科研成果、进行学术交流的重任。它还被用来衡量学者的学术水平,是评定职称、获取科研经费等环节中考察的重要的内容。因此,判断一篇学术论文是否由抄袭、造假得来至关重要。

  在计算机技术不够发达、数据库尚未开放共享的时代,识别学术不端不得不依靠评审编辑慧眼如炬。在中国,论文文字查重体系一直到2005年前后才建立。后来,人们又不断优化这个系统,从能识别“复制粘贴型”抄袭,到能识别改变用词和句法的抄袭,但图片重复一直是论文查重的死角。

  道高一尺,魔高一丈,心怀不轨的研究人员已经学会了应付能识别文字抄袭的系统。在生命科学等依赖图像实物的研究领域,图片造假的难度和成本会更高。

  2014年轰动学术圈的小保方晴子学术造假丑闻中,她的团队被发现使用了小保方晴子博士学位论文中的图片,用来证明新的发现。更多时候,造假来得更隐秘,研究人员用旋转、裁剪、调整大小和对比度的方式调整图片。它们常常难以被察觉,直到前赴后继的科研人员发现研究成果无法复现。此时,大量的人力和资金成本都被浪费了。

  如何解决这个问题,仍然是摆在我们面前的一座大山。即使是丹尼尔·阿库纳等人开发出的算法,也面临很大的困难。在每一个领域,我们需要专业人士进行足够数量的前期人工标注。

  这套算法的运算速度也有限,目前只能考察作者自己发表的诸多论文中是否存在重复,尚无法应对以亿为单位的出版文献库。出版巨头爱思唯尔(Elsevier)诚信部门主管也表示,出版商需要创建一个共享的数据库,以便进行相关检索,查实论文图片重复使用的情况。

  1月15日,在英国伦敦,民众在议会大厦外的英国前首相丘吉尔雕像前参加集会。在经过5天辩论后,英国议会下院15日以432票反对、202票支持的投票结果否决了“脱欧”协议。在经过5天辩论后,英国议会下院15日以432票反对、202票支持的投票结果否决了“脱欧”协议。

  据肯尼亚媒体报道,首都内罗毕市区一商业综合体15日遭爆炸袭击,目前已造成3人死亡,另有多人受伤。据肯尼亚媒体报道,首都内罗毕市区一商业综合体15日遭爆炸袭击,目前已造成3人死亡,另有多人受伤。

  为解决燃油短缺问题,津巴布韦政府12日决定,自13日零时起大幅上调汽柴油价格。津巴布韦工会等组织动员民众上街游行示威,抗议政府上调汽柴油价格并要求执政党为津日益恶化的经济形势负责。

  2019年北美国际汽车展14日在美国“汽车之都”底特律开幕,现代汽车的捷恩斯G70夺得今年北美车展年度轿车大奖。

  1月14日,香港理工大学参与探月工程嫦娥四号任务的科研人员合影。新华社记者 吴晓初 摄1月14日,香港理工大学工业及系统工程学系讲座教授(精密工程)兼副系主任容启亮(左)在记者会上。

  位于重庆市渝中区朝天门码头的重庆来福士项目建筑由八栋修长塔楼、商业裙楼和一座约300米长的“空中连廊”组成。

  近日,在贵州省福泉市陆坪镇罗坳村,茶叶种植户抢抓时节平整土地、扦插茶苗,以保障茶苗供应市场,促进茶园新旧更替。新华社发(肖伟 摄)1月14日,在福泉市陆坪镇罗坳村茶叶育苗基地,村民在扦插茶苗(无人机拍摄)。

  黑老锅景区位于甘肃省庆阳市显胜乡,峡谷长千余米,每年冬季泉水结成冰瀑,景色壮观,吸引众多游客前来游玩。新华社记者李笑摄1月14日拍摄的甘肃省庆阳市黑老锅景区。

  1月14日,在马来西亚吉隆坡附近的马来西亚国家动物园,大熊猫宝宝品尝“生日蛋糕”。马来西亚国家动物园14日为中国旅马大熊猫“兴兴”和“靓靓”所生的第二只雌性大熊猫宝宝庆祝一周岁生日。

  1月13日,在乌兹别克斯坦撒马尔罕,印度外长斯瓦拉杰(中)在首次“印度—中亚”外长对话会议上讲话。首次“印度—中亚”外长对线日在乌兹别克斯坦第二大城市撒马尔罕举行,印度、中亚五国和阿富汗外长参加对线

  国家发展改革委当日发布消息,按照现行成品油价格形成机制,自2019年1月14日24时起,国内汽油、柴油价格每吨均上调105元。新华社发(宋杰 摄)1月14日,车辆在江苏省连云港市连云区一加油站等待加油。

  1月14日,人们在广西融水苗族自治县红水乡举行的芦笙节上赛芦笙。新华社记者 陈君清 摄1月14日,人们在广西融水苗族自治县红水乡观看芦笙吹奏比赛。新华社记者 陈君清 摄1月14日,人们在广西融水苗族自治县红水乡举行的芦笙节上赛芦笙。

  1月10日,在爱尔兰北部的德拉姆利波利普地区,埃蒙·菲茨帕特里克站在他经营的汽车补给站内的五金商店与加油区域之间,他脚下水泥地上的缝隙就是爱尔兰和英国分界线的大致所在。新华社发这是1月10日在爱尔兰北部的德拉姆利波利普地区用无人机拍摄的埃蒙·菲茨帕特里克经营的汽车补给站,爱尔兰和英国分界线在汽车补给站内的五金商店与加油区之间穿过。

  1月14日,在美国纽约举行的全国零售商联合会年度大会上,厦门容大合众电子科技有限公司的工作人员向参观者介绍产品。美国全国零售商联合会年度大会于1月13日至15日在纽约举行,众多中国零售企业和设备厂商参加大会,分享发展经验的同时拓展商机。

  1月13日,天津市蓟州区出现雾凇景观,树木仿佛披上了银色盛装,美如画卷。

  强军步伐铿锵向前,开训动员鼓舞人心。连日来,从南海之滨到雪域高原、繁华都市到荒芜戈壁,新年度备战打仗之火持续升温。驻守在天山北麓的某部官兵不畏严寒,在风雪中奏响强军之歌,持续展开一系列常态化练兵备战活动:长途野营拉练、军事比武竞赛……

  国家发展改革委当日发布消息,按照现行成品油价格形成机制,自2019年1月14日24时起,国内汽油、柴油价格每吨均上调105元。新华社发(宋杰 摄)1月14日,车辆在江苏省连云港市连云区一加油站等待加油。

  这是1月14日拍摄的重庆来福士广场“空中连廊”幕墙工程施工现场(无人机拍摄)。位于重庆市渝中区朝天门码头的重庆来福士项目建筑由八栋修长塔楼、商业裙楼和一座约300米长的“空中连廊”组成。

  近日,“曲韵雅艺·新春戏曲民俗月”活动在上海举行,帮助市民和游客了解剧种知识,体验传统文化魅力。

美文.分享

人喜欢

上一篇下一篇
猜你喜欢
点击加载更多内容  ↓