原標(biāo)題:智源“抄襲門(mén)”最新通報(bào):2處抄襲4處引用不規(guī)范,相關(guān)責(zé)任人均已主動(dòng)離職
(資料圖片僅供參考)
“2處屬于抄襲,4處引用不規(guī)范?!?/p>
“相關(guān)責(zé)任人均已主動(dòng)離職?!?/p>
“大模型研究中心部門(mén)重組?!?/p>
……
一篇名為A Roadmap for Big Model、由百人聯(lián)合完成的綜述報(bào)告,因涉嫌抄襲在國(guó)內(nèi)外學(xué)術(shù)圈引發(fā)了不小的關(guān)注。
對(duì)此,涉事單位北京智源人工智能研究院,通報(bào)了事件調(diào)查后的最新結(jié)果。
除了剛才提到的幾點(diǎn)外,通報(bào)還指出了擔(dān)負(fù)這次“抄襲門(mén)”事件的主要組織責(zé)任人,是智源大模型研究中心人員。
那么引發(fā)國(guó)內(nèi)外熱議的學(xué)術(shù)抄襲事件背后,到底發(fā)生了什么?
2處抄襲,4處引用不規(guī)范
此次“抄襲門(mén)”的焦點(diǎn),即這篇綜述報(bào)告是由智源研究院大模型研究中心牽頭,并邀請(qǐng)了國(guó)內(nèi)外19個(gè)機(jī)構(gòu)共100位科研人員撰寫(xiě)。
根據(jù)通報(bào)的介紹,綜述共由16篇獨(dú)立專題文章組成。
除了第12篇之外,每篇文章都都有其對(duì)應(yīng)的撰寫(xiě)作者和通訊作者。
而一個(gè)核心的問(wèn)題便出在了“協(xié)作”的過(guò)程中。
在通報(bào)里的“組織失察責(zé)任認(rèn)定”中,智源研究院表示:
智源大模型研究中心人員未嚴(yán)格按照學(xué)術(shù)出版規(guī)范的流程執(zhí)行,在未與其他作者確認(rèn)的情況下,于2022年3月26日將綜述報(bào)告上傳至arXiv,負(fù)有主要組織責(zé)任。
除此之外,這次的通報(bào)還對(duì)此前網(wǎng)友們對(duì)于綜述內(nèi)容的質(zhì)疑片段做了回應(yīng)。
首先,智源研究院承認(rèn)有2處質(zhì)疑片段屬于抄襲。
第一個(gè)抄襲片段是綜述報(bào)告第2篇文章的2.3.1節(jié),存在共計(jì)179個(gè)單詞的多句重復(fù)。
根據(jù)《學(xué)術(shù)出版規(guī)范:期刊學(xué)術(shù)不端行為界定》中的“論文作者學(xué)術(shù)不端行為類型”規(guī)定:
文字表述剽竊:成段使用他人已發(fā)表文獻(xiàn)中的文字表述,雖然進(jìn)行了引注,但對(duì)所使用文字不加引號(hào),或者不改變字體,或者不使用特定的排列方式顯示。
這個(gè)抄襲片段屬于這種規(guī)定的類型,而且也達(dá)到了《IEEE出版物服務(wù)和產(chǎn)品委員會(huì)操作手冊(cè)》中,“對(duì)不同等級(jí)的抄襲行為進(jìn)行判定的指南”的第5級(jí)。
判定的要點(diǎn)是:對(duì)一篇文章的主要部分逐字復(fù)制,雖有引注但缺乏清晰區(qū)分。
(注:抄襲共分5級(jí),第1級(jí)最嚴(yán)重,第5級(jí)最輕微)
對(duì)此,通報(bào)表示,這篇文章中的兩位作者(均為智源大模型研究中心人員)分別擔(dān)負(fù)直接責(zé)任和失察責(zé)任。
第二處抄襲片段,是第8篇文章的8.3.1節(jié),存在74個(gè)單詞的整句重復(fù)。
負(fù)責(zé)該段落的作者也是來(lái)自智源大模型研究中心的人員,文章發(fā)布前未與通訊作者確認(rèn),應(yīng)負(fù)直接責(zé)任。
對(duì)此,智源研究院表示:
上述兩名作者已經(jīng)按照IEEE手冊(cè)的對(duì)應(yīng)糾正措施向原作者致歉,并得到原作者諒解,履行了應(yīng)該承擔(dān)的相關(guān)學(xué)術(shù)責(zé)任。
除此之外,通報(bào)還表示,質(zhì)疑片段中的4處屬于引用不規(guī)范。
它們分別是:
第10篇文章:存在少數(shù)重復(fù)文字
第12篇文章:12.2.3節(jié)存在共計(jì)36個(gè)單詞的重復(fù),無(wú)整句重復(fù)
第14篇文章:14.2.2節(jié)一處多句63個(gè)單詞重復(fù)
第16篇文章:16.1節(jié)一處存在多句重復(fù)
并且智源研究院對(duì)于上述問(wèn)題所對(duì)應(yīng)的作者也做了通報(bào)。
至于剩下的被質(zhì)疑片段,通報(bào)表示“屬于規(guī)范引用”。
“相關(guān)責(zé)任人均已離職”
在通報(bào)的最后,智源研究院還公布了“處理和整改結(jié)果”。
首先,智源研究院要求可能存在問(wèn)題文章的作者,向原作者做書(shū)面致歉,并且表示“均已得到原作者反饋和諒解”。
其次,由于“2處抄襲”的涉事人員均是來(lái)自智源研究院大模型研究中心的人員,因此通報(bào)決定:
重組該部門(mén)。
并且相關(guān)責(zé)任人均已主動(dòng)離職。
而對(duì)于此次發(fā)表流程中存在的漏洞,智源研究院表示“已經(jīng)整改了論文發(fā)表流程,并修訂完善了科研誠(chéng)信與學(xué)風(fēng)建設(shè)制度”。
與此同時(shí),鑒于此次的事件,智源研究院還做了后續(xù)的相關(guān)計(jì)劃:
智源研究院計(jì)劃與學(xué)界和業(yè)界合作,制定更嚴(yán)謹(jǐn)?shù)奈墨I(xiàn)引用規(guī)范,開(kāi)發(fā)論文和代碼開(kāi)源檢測(cè)工具和系統(tǒng),避免再次出現(xiàn)類似問(wèn)題。
事件回顧
在看完最新通報(bào)之后,我們也來(lái)一起回顧下這件事情的始末。
4月8日,谷歌大腦研究員Nicholas Carlini發(fā)文指出:
A Roadmap for Big Model這篇文章抄襲了自己最近發(fā)表的一篇論文。
他列舉了10個(gè)抄襲得比較明顯的段落,并用綠色標(biāo)出文字一致的部分。
Carlini發(fā)現(xiàn)這個(gè)情況的經(jīng)歷也挺戲劇的:他的一個(gè)論文合作者本來(lái)想看看智源這篇文章有什么值得學(xué)習(xí)的,結(jié)果有些部分越看越奇怪,最后發(fā)現(xiàn)原來(lái)該論文有些段落直接照搬了他們自己的文章。
(吃瓜吃到自己頭上 .jpg)
同時(shí)通過(guò)收集數(shù)據(jù)初步核查,Carlini發(fā)現(xiàn)這篇論文還涉嫌抄襲十余篇來(lái)自其他作者的論文。
在Carlini曝光智源這篇文章涉嫌抄襲后,很快引起國(guó)內(nèi)外的廣泛關(guān)注。
連LeCun都評(píng)價(jià)道:
有網(wǎng)友認(rèn)為這是一個(gè)團(tuán)隊(duì)的學(xué)生寫(xiě)的,這些學(xué)生可能不夠清楚學(xué)術(shù)規(guī)范,而其他大部分人都是掛個(gè)名。
還有人分享了自己遇到過(guò)的學(xué)術(shù)不端的事情。
一位疑似涉事論文的作者出來(lái)爆料說(shuō),當(dāng)時(shí)留給自己的撰稿時(shí)間非常緊迫,只有一周多,他猜留給學(xué)生的時(shí)間可能更少,所以就出現(xiàn)了大段照搬的情況。
想要解決問(wèn)題,應(yīng)該給作者們更充裕的時(shí)間和更多機(jī)會(huì)。
隨著事情發(fā)酵,智源官方也很快做出了回應(yīng)。
4月13日智源發(fā)布了《關(guān)于“A Roadmap for Big Model”綜述報(bào)告問(wèn)題的致歉信》;兩天后又宣布成立調(diào)查組,就涉事論文開(kāi)展獨(dú)立調(diào)查。
7月15日,智源官方通報(bào)了調(diào)查結(jié)果。
智源這次的排查機(jī)制,以及最后這種公開(kāi)透明的結(jié)果公布,也算是比較妥當(dāng)?shù)奶幚矸绞搅恕?/p>
起初爆料智源論文涉嫌抄襲的Carlini后來(lái)也說(shuō),這篇文章受到的關(guān)注比自己的預(yù)期要多得多,所以懇請(qǐng)大家不要把這變成一場(chǎng)“獵巫行動(dòng)”。
Carlini反對(duì)有人提出的“此類事情件中所有相關(guān)人員應(yīng)當(dāng)立即被解雇、應(yīng)該被arXiv封禁等”,他勸各位不要對(duì)這篇文章的作者們過(guò)分苛責(zé),而應(yīng)該把更多目光投在整個(gè)學(xué)術(shù)領(lǐng)域的風(fēng)氣上。
也正如智源在此次通告中所述:
除上述智源研究院相關(guān)責(zé)任人外,綜述報(bào)告其他所有作者沒(méi)有抄襲及學(xué)術(shù)不端行為。在此對(duì)此次事件給這些作者造成的負(fù)面影響和困擾表示誠(chéng)摯歉意!
再次誠(chéng)摯感謝各界朋友對(duì)智源研究院的監(jiān)督和批評(píng)!
關(guān)鍵詞: carlini
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 hngelin.com All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書(shū)面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
香港| 五台县| 东乌珠穆沁旗| 即墨市| 津市市| 弋阳县| 海淀区| 石门县| 定襄县| 威海市| 海兴县| 遂溪县| 新野县| 延川县| 鄂温| 东乡族自治县| 水城县| 五寨县| 嵊州市| 响水县| 襄城县| 义乌市| 宝鸡市| 石门县| 灌南县| 扶风县| 桐城市| 元氏县| 双牌县| 时尚| 泌阳县| 神木县| 兖州市| 山东| 三河市| 金溪县| 云龙县| 喜德县| 盐池县| 安平县| 江城|