加载中 ...
首页 > 科技 > 科技要闻 > 正文

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

2019-11-18 13:09:13 来源:medium编辑:张佳、大明论文抄袭乃学术大忌,前段时间传闻有一篇SIGIR 2019的论文抄袭了一篇RecSys 20

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

新智元报导 来源:medium编辑:张佳、大明论文抄袭乃学术大忌,前段时间传闻有1篇SIGIR 2019的论文抄袭了1篇RecSys 2018的论文,在Reddit上炸开了锅,连SIGIR主席Ben Carterette也被惊动了。他代表SIGIR发了1封公然信回应当事件,表示正在调查,对公然匿名指控不予回应,并号令大家不要参与Reddit上的公然讨论。你怎样看,来新智元 AI 朋友圈说说你的观点~

论文抄袭1直是学术届的1个大忌,前段时间传闻有1篇SIGIR 2019的论文抄袭了1篇RecSys 2018的论文,被吵得沸沸扬扬。最近,SIGIR主席Ben Carterette代表SIGIR发了1封公然信回应当事件。

我们先来回顾1下事情的来龙去脉。Reddit网友扒出SIGIR 2019论文抄袭:模型几近完全是复制

这次的论文抄袭开始是网友joyyeki在Reddit上发起的讨论,他表示:SIGIR 2019论文中提出的模型几近是RecSys 2018论文中模型的复制品,并给出5个理由:

两篇论文都使用了矩阵分解框架上的对抗性序列到序列学习模型。对生成器和辨别器部份,两篇论文都使用GRU作为生成器,使用CNN作为鉴别器。优化方法相同,即两部份交替优化。评估相同,即评估MSE的推荐性能和评估辨别器的准确性,以表明生成器已学会生成相干的评论。这两篇论文所用的符号和公式看起来极为类似。

Reddit讨论地址:https://www.reddit.com/r/MachineLearning/comments/dq82x7/discussion_a_questionable_sigir_2019_paper/

另外,这位网友还举了3个例子,来证明这两篇论文措辞很类似,另外一位Reddit网友索性在论文里进行了标注:

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

彩色标示出的是两篇论文不1样的部份,其余部份则相同(左为SIGIR 2019论文,右为RecSys 2018论文)

此次事件触及的抄袭论文的两位作者,分别来自荷兰马斯特里赫特大学的Dimitrios Rafailidis和瑞士提契诺大学(USI)的Fabio Crestani,他们都是该领域的教授/助理教授。

原作者回应:论文都是基于对抗训练,所以符号/公式看起来很类似

而触及的作者也在帖子下方对网友joyyeki指控抄袭的5个理由进行了回应:

1. 两篇论文都使用了矩阵分解框架上的对抗性序列到序列学习模型。

回应:这两篇论文都对1篇 WWW‘18 论文《Co-Evolutionary Recommendation Model: Mutual Learning between Ratings and Reviews》进行了拓展(这篇的作者也是 RecSys 2018 论文的作者)。SIGIR 2019 论文的作者在研究中援用了 WWW‘18 的论文(但很奇怪,那篇 RecSys 18 论文并没有援用他们自己之前的这项工作)。

2. 对生成器和辨别器部份,两篇论文都使用GRU作为生成器,使用CNN作为鉴别器。

回应:SIGIR和RecSys的论文都基于对抗训练,WWW"18的论文也是如此。在句子结构中,GRU / CNN是相当普遍的序列到序列学习策略。实际上,其他许多论文也都将 GRU 和 CNN 用于文本表示/文档分类的序列到序列学习。因此,成心义的是,SIGIR和RecSys论文在生成器和鉴别器部份都遵守类似的策略。

3. 优化方法相同,即两部份交替优化。

回应:这只是部份正确。确切,在我们的SIGIR论文中,我们采取了与RecSys论文相同的交替优化方法。但是请注意,这类方法已被广泛使用。实际上,我们在之前的ECML / PKDD 2016的论文中也使用了它。另外一方面,为了建模用户偏好,我们使用了非负矩阵分解,而不是RecSys论文中使用的几率矩阵分解。这是1个很大的差异。

4. 评估相同,即评估MSE的推荐性能和评估辨别器的准确性,以表明生成器已学会生成相干的评论。

回应:这是不准确的;评估确切有所不同。虽然MSE是用于评级预测的广泛使用的度量,但在我们的论文中,我们评估了我们的方法在4个与RecSys论文不同的数据集上的性能。请注意,我们在实验部份援用了WWW"18论文,以明确说明我们遵守了相同的评估方案(其他基于评论的推荐系统的研究所使用)。除在 RecSys2018 论文和其他基于评论的推荐系统的论文中广泛使用的 PMF 和 HFT 两种基线策略以外,我们还针对DeepCoNN,TNET和WWW"18论文提出的TARMF方法评估了我们的方法。在我们的实验中,我们还评估了RecSys论文中未报告的潜伏因素数量的影响。这些都是成心义的差异。

5. 这两篇论文所用的符号和公式看起来极为类似。

回应:正如我们之前所说,SIGIR和RecSys的论文都是基于对抗训练的,就像WWW"18的论文1样,所以符号/公式看起来很类似。但是,除使用不同的矩阵分解技术外,对抗训练进程也存在差异……

Reddit网友不买账:您的回答漏洞百出,这里的人不是傻瓜

但是,对这些解释,原帖楼主其实不买账:感谢您为证明自己清白所做的努力,但不幸的是,您的回答漏洞百出。

首先,您在回答中两次提到“ SIGIR和RecSys的论文都是基于对抗训练的,就像WWW"18的论文1样 ”。我刚刚浏览了WWW"18的论文,却找不到任何地方表明它是基于对抗训练的。请不要以虚假的陈说欺骗读者。

其次,您宣称“ 在本文中,我们遵守本文中援用为[2]的RecGAN 2018策略,并在援用中援用了[18]援用了IRGAN 2017策略,以减少训练期间的差异 ”。请明确说明您在论文中用来减少训练方差的策略并不是 RecSys‘18 论文中的策略。您宣称这是“ 实质性差异 ”,但终究我只看到参考文献有所不同,其基本理论几近相同。请对此进行详细说明。

第3,您宣称“ 就对用户偏好进行建模而言,我们使用了非负矩阵分解,而不是RecSys论文中使用的几率矩阵分解 ”。我相信几率矩阵分解属于非负矩阵分解的1类。另外,如果您终究在论文中取得了等式(5),几近可以与RecSys"18论文中的等式(10)相同,那末您说的“实质差异”的确切含义是什么。

第4,关于论文措词。正如 u / eamonnkeogh 所指出的,不但复制了描写DeepCoNN模型的语句,而且还复制了描写TNet模型的语句。再次,我想你会说这是另外一个偶合?另外,您还宣称,由于论文中的术语在文献中很常见,因此使两个以上的段落看起来类似是成心义的。请找到最少1个其他示例,以证明在同行评审的出版物之间可能会产生这类极端类似性。

再次,我要强调,亲爱的作者,请确保您不要做出虚假的陈说,乃至不能说服只从事信息检索工作3个月的本科生。这里的人不是傻瓜,他们有自己的判断力。

原作者附上查重报告,Reddit网友:你的数字比错了

对楼主的再次质疑,原作者索性附上了查重报告:

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

查重报告地址:https://drive.google.com/file/d/18tQXFTJX3FCiAO1hlQqrm9eX0aSC⑸mc/view

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

查重结果

结果显示,SIGIR19 论文与 RecSys18 论文之间的类似度为 7%,而根据软件公司的说法,24% 及以下的类似度都是很低的。

即使如此,原帖楼主仍不买账,他认为:1个经过同行评审的论文有这类程度的堆叠是不可接受的,而且作者比错了数据,实际上应当比similarity index这个数字,也就是23%,这只比 24% 低1点。

双方僵持不下,ACM SIGIR 主席、SIGIR 大会指点委员会主席 Ben Carterette也被惊动了,他在帖子下面评论道:“我们已知晓此事。ACM 有明确的规定和程序来报告和判定可能的剽窃事件。尽人皆知,这是1项非常严重的指控,最好由具有经验和专业知识的中立第3方来判决。如果您要提出正式投诉,可以。”并附上1个 ACM 关于剽窃规定的文件链接。

ACM SIGIR主席公然信:正在调查,对公然匿名指控不予回应

自此事件由Reddit暴光以来,热度1直不减,面对压力,ACM SIGIR主席Ben Carterette近日发表了1封公然信,对此事进行了回应。

信中首先回顾了ACM为避免抄袭制定了规章和流程,重申了ACM对抄袭的“零容忍”。但信中并未就两篇涉事论文的内容比较是不是构成抄袭做出实质性回应。全文大部份篇幅在叙述ACM的规章和处理流程。

Ben Carterette表示,举报抄袭需要通过正式的渠道向ACM官方或会议主办方反应,可以要求匿名,但ACM不会回应在公然网络平台上的抄袭指控。由于对“抄袭举报处理流程的尊重是10分必要的”。

最后,信中号令大家不要参与Reddit上的公然讨论,近期也会在Reddit上专门发帖说明情况,并联系Reddit站方对原贴进行锁定。

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

Ben Carterette以下为公然信全文:

尊重的IR社区: 最近,1位Reddit用户发布了1个匿名帖子,指控SIGIR 2019上的1篇论文抄袭了RecSys 2018上的论文。我之所以写这封信,是想解释1下我们为避免论文抄袭而采取的措施,我们如何与ACM合作解决这个问题,和我们在目前这类特殊情况下要做些什么。 SIGIR会议由ACM SIGIR团队主持,ACM SIGIR隶属于非营利组织美国计算机协会(ACM)。SIGIR必须遵照ACM的所有政策和章程,由于ACM对SIGIR采取的任何行动或SIGIR会议上产生的任何事情负有法律责任。 我们对抄袭是零容忍的

首先必须澄清1点:SIGIR对抄袭、捏造或虚假陈说零容忍。SIG和ACM均制定了发现和响应类似事件的许多策略和进程,具体请见:

https://www.acm.org/publications/policies/plagiarism-overview 会议对论文均有发布前检查环节,以发现背规情况,包括使用iThenticate查重工具将提交的内容与已发表的论文进行比较。审查阶段触及的会议乃至超越了ACM的范围。另外一项检查是同行评议。在论文被接受以后,但终究发表之前,还需要通过另外一项关于虚假陈说的检查,由于作者可以对进行修改,直到终究版本截止时间为止。 1旦论文在发布前检查阶段被标记异常,必须立行将其从论文提交库中移除。会议组织者对此进程具有完全的酌情处理权。会议还可以和ACM和其他组织合作,以确保相应作者遭到处罚。在过去,作者肯定会面临背规行动的惩罚。再次重申,我们非常重视这1点。 虽然如此,有时有问题的论文还是会被通过。这是1个IR问题,因此也要面对精度——准确率的权衡选择问题!当论文通过发布前检查后,被推荐给同行评审员进行评审,通过评审落后行收稿后检查,并终究以印刷版情势发表。到了这1步,会议组织者再想采取措施,将遭到严重限制。实际上,他们唯1可以采取的正式行动是向ACM反应。 他们也确切这样做了:ACM每一年要处理数百项抄袭指控。ACM具有专业知识和经验,可以公正地处理这些反应。但处理这些问题需要时间。反应发表后论文作者的抄袭必须依照适当程序:ACM相干政策依照严重程度将抄袭分为5个级别,每一个级别都对应相应的处罚,并赋予了被告上诉权。对这1进程的尊重非常重要。 我们不会参与公然的匿名抄袭指控

抄袭是非常严重的指控。它会对作者的职业生涯造成相当大的破坏。不应当轻易提出这类指控,也不应进行公然质疑。遗憾的是,通过在线社交媒体平台上的免费匿名帐户,从完全无风险的立场进行破坏性的指控非常容易。

我们不会参与公然的匿名指控。我们不能禁止他人提出这些指控,但我们不会对此做出回应。 实际上,ACM政策要求举报人提供真实姓名,并许诺对举报人的身份信息保密,上面给出的链接中详细介绍了这些政策。即便有这些保证,人们也可能有理由不愿流露自己的身份。匿名多是1项重要的保护措施,但匿名举报确切不具有构成正式观点的资历。 但是,有1种情况不需要公然举报:和人私下谈论此事。与当地同事和资深人士谈谈这件事,或许你会发现有人愿意提出正式举报。如果没人愿意这样做,而且你依然肯定此文确属抄袭,可以本地人士以外的范围扩大,但要私下进行。比如联系会议的PC主席、联系SIG履行委员会成员等。

如果所有其他方法都不管用,请与ACM联系并解释为何你希望匿名,ACM还将调查相干的道德问题,这些问题可能致使人们希望保持匿名。但不管如何,提出公然指控的理由都是不充分的。 事件正在调查,论文没法撤稿,已联系Reddit锁帖

我们现在在做什么? 我们现在并没闲着。本着上文中的精神,我们做出大部份的答复是私下进行的。

重新进行发布前检查。经验证,本文没有触发任何发布前检查中的抄袭警报。我们对论文进行了重新审阅。这是为了肯定我们向ACM提交标记的论文部份,ACM不会接受匿名报告。在Reddit上发帖,告知其他人ACM官方政策和程序,并约请任何希望举报抄袭的人。要求Reddit版主锁定原帖。 Reddit论坛需要遵守其社区标准,原贴内容仿佛不符合该标准。截止本文发布时,该贴还没有锁定。亲身与ACM出版委员会联席chairman获得联系。该团队负责处理抄袭指控。他重申,我们唯1可以采取的正式行动就是提出声明。撰写1份正式声明。此事我正在与ACM联系,但是我没法谈论细节。

下面的事情是我们没法做的: 我们没法断言抄袭是不是真正存在,由谁负责。自从论文发表以来,这件事情我们还没法肯定。ACM政策对此非常明确。制定这项政策的缘由也很明确:如果我们说的话或基于我们的信心采取的任何行动与ACM的判决相冲突,ACM就要承当责任。另外,即便我们想发表声明,也不能对社区中受人尊重的成员有所偏向。 此案审理期间,论文没法撤稿。此文已由ACM发布,只有ACM才能将其撤下。 我们不能禁止人们在公共论坛上匿名讨论这1抄袭指控。但是,我们强烈建议各位不要参加此类讨论,由于参与此类讨论会进1步鼓励匿名的指控。我们没法禁止人们进行匿名公然指控,但我们不会对这些指控做出公道回应。 SIGIR和ACM10分关注抄袭和各种虚假陈说问题。该问题在数10个ACM SIG和更多会议中日趋严重。要保证做出正确的决定需要时间。退1步,耐心等待永久不会有坏处。 谢谢大家! Ben CarteretteACM SIGIR主席

参考链接:

https://medium.com/@carteret.acm/sigir-and-plagiarism-e23bc2b79948

SIGIR主席公开信回应抄袭事件:正调查但无法撤稿,已联系Reddit锁帖

新智元AI朋友圈详细使用教程,8000名AI大玩家和实践者都在这里!

“掌阅财经”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服邮箱99686143@qq.com,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。

  • 声音提醒
  • 60秒后自动更新
  • 中国8月CPI年率2.3%,预期2.1%,前值2.1%。中国8月PPI年率4.1%,预期4.0%,前值4.6%。

    08:00
  • 【统计局解读8月CPI:主要受食品价格上涨较多影响】从环比看,CPI上涨0.7%,涨幅比上月扩大0.4个百分点,主要受食品价格上涨较多影响。食品价格上涨2.4%,涨幅比上月扩大2.3个百分点,影响CPI上涨约0.46个百分点。从同比看,CPI上涨2.3%,涨幅比上月扩大0.2个百分点。1-8月平均,CPI上涨2.0%,与1-7月平均涨幅相同,表现出稳定态势。

    08:00
  • 【 统计局:从调查的40个行业大类看,8月价格上涨的有30个 】统计局:从环比看,PPI上涨0.4%,涨幅比上月扩大0.3个百分点。生产资料价格上涨0.5%,涨幅比上月扩大0.4个百分点;生活资料价格上涨0.3%,扩大0.1个百分点。从调查的40个行业大类看,价格上涨的有30个,持平的有4个,下降的有6个。 在主要行业中,涨幅扩大的有黑色金属冶炼和压延加工业,上涨2.1%,比上月扩大1.6个百分点;石油、煤炭及其他燃料加工业,上涨1.7%,扩大0.8个百分点。化学原料和化学制品制造业价格由降转升,上涨0.6%。

    08:00
  • 【日本经济已重回增长轨道】日本政府公布的数据显示,第二季度经济扩张速度明显快于最初估值,因企业在劳动力严重短缺的情况下支出超预期。第二季度日本经济折合成年率增长3.0%,高于1.9%的初步估计。经济数据证实,该全球第三大经济体已重回增长轨道。(华尔街日报)

    08:00
  • 工信部:1-7月我国规模以上互联网和相关服务企业完成业务收入4965亿元,同比增长25.9%。

    08:00
  • 【华泰宏观:通胀短期快速上行风险因素主要在猪价】华泰宏观李超团队点评8月通胀数据称,今年二、三季度全国部分地区的异常天气(霜冻、降雨等)因素触发了粮食、鲜菜和鲜果价格的波动预期,但这些因素对整体通胀影响有限,未来重点关注的通胀风险因素仍然是猪价和油价,短期尤其需要关注生猪疫情的传播情况。中性预测下半年通胀高点可能在+2.5%附近,年底前有望从高点小幅回落。

    08:00
  • 【中国信通院:8月国内市场手机出货量同比环比均下降】中国信通院公布数据显示:2018年8月,国内手机市场出货量3259.5万部,同比下降20.9%,环比下降11.8%,其中智能手机出货量为3044.8万部,同比下降 17.4%; 2018年1-8月,国内手机市场出货量2.66亿部,同比下降17.7%。

    08:00
  • 土耳其第二季度经济同比增长5.2%。

    08:00
  • 乘联会:中国8月份广义乘用车零售销量176万辆,同比减少7.4%。

    08:00
  • 央行连续第十四个交易日不开展逆回购操作,今日无逆回购到期。

    08:00
  • 【黑田东彦:日本央行需要维持宽松政策一段时间】日本央行已经做出调整,以灵活地解决副作用和长期收益率的变化。央行在7月政策会议的决定中明确承诺将利率在更长时间内维持在低水平。(日本静冈新闻)

    08:00
  • 澳洲联储助理主席Bullock:广泛的家庭财务压力并非迫在眉睫,只有少数借贷者发现难以偿还本金和利息贷款。大部分家庭能够偿还债务。

    08:00
  • 【 美联储罗森格伦:9月很可能加息 】美联储罗森格伦:经济表现强劲,未来或需采取“温和紧缩”的政策。美联储若调高对中性利率的预估,从而调升对利率路径的预估,并不会感到意外。

    08:00
  • 美联储罗森格伦:经济表现强劲,未来或需采取“温和紧缩”的政策。美联储若调高对中性利率的预估,从而调升对利率路径的预估,并不会感到意外。

    08:00
  • 美联储罗森格伦:鉴于经济表现强劲,未来或需采取“温和紧缩的”政策。

    08:00