劉小姐是北京一傳媒集團老總的秘書。她工作的一項內(nèi)容是驗收員工的培訓心得,但隨之而來的網(wǎng)上搜索讓她不勝其苦。
她說,“每次都有上百篇文章交上來,老總要求每篇都在網(wǎng)上搜索一下,看看是不是抄襲的。有時候,老板自己也親自搜!鄙蟼月,她查出兩份學習心得是一字不改抄襲來的,老板很生氣,當即開除了這兩個經(jīng)營部門的人。
劉小姐覺得,對每篇文章都上網(wǎng)搜索,工作量比較大。而且,遇到剪刀加漿糊式的抄襲,也不好判斷人家是不是抄的,總不能把每段都拆開去搜。她希望能有個軟件來自動完成這個工作,“這樣,得罪人的事兒,就不用我來干了!彼龔男侣勆峡吹酱髮W開始使用“反抄襲”軟件檢測學生論文時,很感興趣,也去網(wǎng)上注冊想要使用這個系統(tǒng),但至今未獲授權。
與劉小姐一樣想找個“反抄襲”軟件的,還有出版社的編輯嚴燕。她主要編輯文學類小說,“抄名著還好發(fā)現(xiàn),但有些抄襲對象不是有名作品,我也不可能都看過,不好發(fā)現(xiàn),一旦出版之后會很被動!彼蚕M袀“反抄襲”軟件幫她篩一下書稿,減輕一下工作量。
目前,國內(nèi)的反抄襲軟件主要有兩套:一套是由中國學術期刊電子雜志社與清華同方知網(wǎng)共同研制的學術不端行為檢測系統(tǒng),另一套是武漢大學副教授沈陽研發(fā)的ROST反剽竊系統(tǒng)軟件。這兩套軟件都只對高等院校和科研單位進行檢測服務,而且免費,但并不對公眾開放。
但記者在淘寶網(wǎng)上發(fā)現(xiàn),用這兩種系統(tǒng)提供檢測服務的店鋪為數(shù)不少,而且大多生意不壞。在開發(fā)這兩家系統(tǒng)還都免費的時候,已經(jīng)有人從中賺取了“第一桶金”。
“反抄襲”軟件:一天注冊用戶6000個
今年年初,全國各大高等院校使用“反抄襲”軟件檢測畢業(yè)論文的新聞見諸報端,,“反抄襲”軟件隨后一直處在輿論的風口浪尖之上!艾F(xiàn)在幾乎天天都有人來找我們,要求授權他們使用‘學術不端行為檢測系統(tǒng)’!敝袊W(wǎng)科研誠信管理系統(tǒng)研究中心主任孫雄勇告訴中國青年報記者,“每天大量用戶注冊申請使用,年初最高峰時,一天注冊了6000個用戶!
孫雄勇說,雖然每天都有大量注冊,但目前開放授權的,基本都是學術科研領域——機構用戶和研究生導師,并且要簽保密協(xié)議。因為擔心一旦開放給個人用戶之后,會產(chǎn)生不可預料的后果。
這個“學術不端行為檢測系統(tǒng)”,是世界首個用全文文獻為比對資源檢測抄襲行為的軟件系統(tǒng),由中國學術期刊電子雜志社與同方知網(wǎng)公司聯(lián)合研發(fā)。其耗時3年,2008年12月底研制成功,2009年3月研究生院開始使用。據(jù)孫雄勇介紹,到6月底,已有3000家期刊編輯部和360多家高校的研究生院在使用,基本上覆蓋了全國重點院校。
雖然用戶很多,但基本都是免費使用。因為這樣的用戶,都是知網(wǎng)的論文供應商。知網(wǎng)的主營業(yè)務是數(shù)字出版,主要是通過合法渠道收集論文,再把這些論文整合后打包賣出去,但近年收稿質量開始下降,“用戶經(jīng)常投訴論文庫中有重復,編輯部也為此頭疼。所以要求公司開發(fā)一套系統(tǒng)來檢測!睂O雄勇說。
該系統(tǒng)的技術核心使用了“自適應多階指紋特征檢測技術”,能夠防止抄襲中的一些方法,比如替換一些詞句、顛倒順序、重組段落等等!爸讣y”是這篇文章的信息特征,簡單的手段改變不了這些特征。每一次檢測,待檢文章首先按照篇章、段落、句子等層級分層處理,然后創(chuàng)建指紋,而比對資源庫中的比對文獻,也采取同樣技術創(chuàng)建指紋索引,根據(jù)其重合處的比例,判斷該論文是否存在抄襲行為。目前,這個系統(tǒng)用做比對的資源庫,是有6000萬條學術文獻的數(shù)據(jù)庫及上百億網(wǎng)頁的網(wǎng)絡資源庫。
Copyright ©1999-2024 chinanews.com. All Rights Reserved