(聲明:刊用《中國新聞周刊》稿件務經(jīng)書面授權)
本刊特約撰稿/凌冰 李渝
國內對學術論文“造假”的監(jiān)督并非始自今日。2000年3月,上海師范大學法商學院的何云峰教授單槍匹馬地建了一個“好漢網(wǎng)”,豪氣十足地叫板校園里勢頭漸旺的剽竊抄襲等不良學風。
同年,著名“打假斗士”方舟子也創(chuàng)辦了中文學術打假網(wǎng)站“新語絲立此存照”,陸續(xù)揭露了500多起學術涉假案例,其中包括“核糖核酸”、清華大學醫(yī)學院“劉輝造假事件”等引起廣泛關注的學術造假和腐敗事件。方舟子們的學術打假多通過網(wǎng)友檢舉,并沒有專業(yè)的儀器進行技術支撐。
2003年,武漢大學信息管理學院副教授沈陽在國家自然科學基金的資助下,研發(fā)了一套與“學位論文學術不端檢測系統(tǒng)”功能相似的系統(tǒng)——ROST反剽竊系統(tǒng),也稱為“學術不端行為檢測系統(tǒng)”,并于2008年4月研制成功,目前已在全國20多所高校院系推廣和100多家期刊社使用,但沒有大規(guī)模推廣。用沈陽的話說,“就像原子彈一樣,它是大規(guī)模殺傷性武器,這需要核軍控的”。
在2009年“兩會”前夕,爆出兩起院士涉嫌學術不端行為的事件。6名教授聯(lián)名投訴中國工程院院士劉興土涉嫌“抄襲剽竊”。此前不久,浙江大學原副教授賀海波盜用他人研究結果發(fā)表多篇論文。賀海波的博士后合作導師、中國工程院院士、浙江大學藥學院院長李連達的名字也出現(xiàn)在這些“問題論文”上。隨后,教育部部長周濟就“賀海波論文造假”事件及處理結果表示,對學術不端行為要像體育界反興奮劑一樣“零容忍”。
2009年3月19日,教育部發(fā)出了《關于嚴肅處理高等學校學術不端行為的通知》,這是我國教育部門首次就處理學術不端行為發(fā)出通知。通知明確高校對本校有關機構或者個人的學術不端行為的查處負有直接責任,應建立健全處理學術不端行為的工作機構。整個學術界頗有山雨欲來的感覺。
正是在這樣的背景下,由中國學術期刊(光盤版)電子雜志社與清華同方知網(wǎng)共同研制的“學位論文學術不端檢測系統(tǒng)”(簡稱“TMLC”)開始在高校推廣。
檢測的方法涉及一個專業(yè)術語——“自適應多階指紋”。什么是信息指紋?沈陽副教授打了個比方,就是每個人說話都有口頭禪,這個口頭禪就是你的一個特征,這個特征就叫信息指紋。具體到一篇文章來說,比如研究金庸小說,金庸喜歡用什么字,用字的規(guī)律是多少,每個字在整個文章出現(xiàn)的概率是多少,這就是一個指紋。CNKI科研誠信管理系統(tǒng)研究中心主任孫雄勇向《中國新聞周刊》記者介紹,如果說得通俗一點,就是兩篇文章,如果有一個句子相同,哪怕有一些改寫,都能檢測出來。
“測謊”工具的檢測工作需要強大的后臺數(shù)據(jù)庫支持,TMLC的后臺是覆蓋了超過5000萬的學術文獻數(shù)據(jù)庫。
“測謊”技術在目前來說,已經(jīng)是一個成熟技術了,國外早已廣泛應用于多所高校及科研機構。
在一系列反剽竊網(wǎng)站中,最為出色、應用最廣泛的莫過于“Turnitin”,中文意思是“交上來”,它也是全球第一個檢測剽竊行為的網(wǎng)站。該網(wǎng)站目前已阻止了世界范圍內將近600萬的學生和教育者的剽竊行為,在使用高峰期,每天可收到2萬篇論文。
“Turnitin”通過三個數(shù)據(jù)庫的內容來檢測交上來的作品:公眾可以查到互聯(lián)網(wǎng)上所有存檔的文件(超過45億頁,每天更新4000萬頁);成百萬的已經(jīng)出版的作品,包括商業(yè)數(shù)據(jù)庫、期刊摘要等,還有上萬本電子書籍,包括古登堡經(jīng)典文獻收藏;成百萬篇學生交到網(wǎng)站的論文。
在中國,數(shù)據(jù)庫也在不斷完善之中。不過,“反剽竊”系統(tǒng)要面對的,似乎遠遠不是技術難題。 ★
Copyright ©1999-2024 chinanews.com. All Rights Reserved