經(jīng)過(guò)畢業(yè)前期要拂,畢業(yè)論文書寫成為我們?cè)谛4髮W(xué)生頭等大事勿她,每天埋頭苦寫,唯恐重復(fù)率過(guò)高现柠。知道昨天顯示論文查重通過(guò)才算是送了口氣。
現(xiàn)在流行的相似度匹配系統(tǒng)大概有這么幾類學(xué)術(shù)不端網(wǎng)弛矛、中國(guó)知網(wǎng)够吩、paperpass、及微中國(guó)知網(wǎng)等丈氓。這些系統(tǒng)的原理都是一樣的周循,都是把你提交的論文拆分成一堆句子,再拆分成一堆關(guān)鍵字万俗,然后與他們維護(hù)的數(shù)據(jù)庫(kù)做對(duì)比湾笛,計(jì)算重復(fù)的文字在你文章里的比重,算法類似于百度的關(guān)鍵字匹配闰歪,這么說(shuō)嚎研,大家也就明白了,你簡(jiǎn)單地把一個(gè)句子的各別詞換成同意詞课竣,把字句變被字句嘉赎,加一兩個(gè)“的”等是不行的,除非你把句子40%的詞都換了于樟。
略有不同的他們數(shù)據(jù)庫(kù)內(nèi)文獻(xiàn)的多少公条、查重的粒度及斷定為相似的閥值。數(shù)據(jù)庫(kù)的大小就不說(shuō)了迂曲,那后兩個(gè)是什么呢靶橱?查重的粒度指可以被認(rèn)定為重復(fù)句的最小句長(zhǎng),舉個(gè)例子,現(xiàn)在的系統(tǒng)都把分號(hào)與句號(hào)當(dāng)作分句符关霸,paperpass把這個(gè)最小句長(zhǎng)設(shè)為8传黄,這意味著小于8個(gè)字的句子無(wú)論怎樣都不會(huì)被認(rèn)為是重復(fù)的,因?yàn)槟銢](méi)有到人家檢測(cè)的門檻队寇。中國(guó)知網(wǎng)的好像是13膘掰。相似的閥值指和原文相似多少以上為重復(fù),舉個(gè)例子佳遣,paperpass把你的文章中的文字分為三種綠色识埋、橙色與紅色,分別表示該句與原文的重復(fù)度在40%以下零渐、40%~60%窒舟、60%以上,除綠色以外其他部分都會(huì)被計(jì)算為相似度诵盼,而中國(guó)知網(wǎng)的閥值好像為60%惠豺,只會(huì)把你的文章中的句子分為兩類:重復(fù)與原創(chuàng)。同時(shí)风宁,還要說(shuō)明一下洁墙,這個(gè)閥值有可能不是固定的,一般系統(tǒng)會(huì)設(shè)一個(gè)重點(diǎn)檢查的論文杀糯,比如說(shuō)扫俺,你抄文獻(xiàn)A的比較多,中國(guó)知網(wǎng)查出你的文章與A的重復(fù)度在5%以上固翰,系統(tǒng)就會(huì)重點(diǎn)查A狼纬,如果你這句子與A有50%的相似也可能會(huì)判為重復(fù)。
我所理解的查重系統(tǒng)的大概原理也就這些了骂际。下面介紹下我們常用的系統(tǒng):中國(guó)知網(wǎng)與paperpass疗琉。中國(guó)知網(wǎng)是官方的系統(tǒng),大部分學(xué)校用的都是中國(guó)知網(wǎng)歉铝,當(dāng)然我校也是盈简;paperpass為一個(gè)公司開發(fā)的,因?yàn)椴僮鞣奖闾尽⒉惶F且非常嚴(yán)格柠贤,被我們廣泛使用,我個(gè)人只用過(guò)paperpass类缤。因?yàn)榫拭悖挥行7降娜擞兄袊?guó)知網(wǎng)的入口,他們?cè)谔詫毶腺I餐弱,一次要300宴霸,而且經(jīng)常要改的話可能要檢數(shù)次囱晴,對(duì)學(xué)生是一筆很大的開銷。除此外瓢谢,至于我為什么沒(méi)用中國(guó)知網(wǎng)查畸写,還有個(gè)小故事,教研室和我一同改論文的一兄弟氓扛,paperpass改到了17%枯芬,用中國(guó)知網(wǎng)查了一個(gè)才0.7%,我這個(gè)18%也就非常放心了采郎。
paperpass查一次是一萬(wàn)字10元破停,我的正文純字?jǐn)?shù)3萬(wàn)4,加標(biāo)點(diǎn)近4萬(wàn)尉剩,檢一次40元。paperpass由于參數(shù)嚴(yán)格毅臊,所以結(jié)果會(huì)高于中國(guó)知網(wǎng)的理茎,至于高多少這沒(méi)有準(zhǔn)。但使用paperpass時(shí)要注意的是管嬉,paperpass的數(shù)據(jù)庫(kù)并沒(méi)有中國(guó)知網(wǎng)全皂林,他們自已也承認(rèn),他們只保證有中國(guó)知網(wǎng)90%以上的文獻(xiàn)蚯撩,那哪部分沒(méi)有呢础倍?據(jù)我觀察是最新的沒(méi)有,paperpass是商業(yè)機(jī)構(gòu)胎挎,他們沒(méi)有中國(guó)知網(wǎng)的數(shù)據(jù)庫(kù)沟启,他們數(shù)據(jù)的來(lái)源可想而知---買個(gè)中國(guó)知網(wǎng)的號(hào),然后“扒”論文犹菇,類似于百度的人說(shuō)我們的一大工作是“扒”網(wǎng)頁(yè)德迹。所以最新的沒(méi)來(lái)的及入庫(kù)的,當(dāng)然也檢不到揭芍,不過(guò)還好的是胳搞,他有“自建庫(kù)”功能,如果你覺得你抄了某最新文獻(xiàn)B比較多了肌毅,但沒(méi)查出來(lái)悬而,可以自已上傳摊滔。
同時(shí)艰躺,因?yàn)閜aperpass有時(shí)過(guò)于嚴(yán)格腺兴,會(huì)出現(xiàn)页响,你都已經(jīng)看不出改動(dòng)了闰蚕,他還是橙色没陡,比如我的18%贴彼、我兄弟的17%埃儿。這時(shí)就可以不改了精钮,過(guò)尤不及杂拨,0.7也說(shuō)不過(guò)去弹沽。
下面說(shuō)下我的方法,這個(gè)網(wǎng)上都有丽已,而且更全沛婴,我怕不過(guò)嘁灯,但又不想在這上面費(fèi)更多的時(shí)間性雄,就簡(jiǎn)單地用了幾招:
1.盡量用長(zhǎng)句秒旋,相當(dāng)于加大基數(shù)。
2.拼湊瑰煎,不是把不同文獻(xiàn)的句子拼成一段,這樣沒(méi)用赋铝,而是把幾篇文章中的同一意思的幾個(gè)句子,拼成一句良哲。
3.翻譯,翻譯國(guó)外的論文基本不會(huì)發(fā)生重復(fù)巍实,而且從道義上講也是合理的,翻譯也是自己的工作丸边,是為學(xué)術(shù)做了貢獻(xiàn)的纬朝。畢竟玄组,那些評(píng)你論文的教授們也沒(méi)打算讓你有什么開創(chuàng)性的成果绕德,有自己的工作就可以了耻蛇。
4.看一遍原文用自己的話去闡述跃捣,這也是個(gè)好辦法刁赦,起碼自己是完全懂了的。
個(gè)人結(jié)合大眾的建議是選擇后兩種,因?yàn)椴橹叵到y(tǒng)不是為查重而查重的,所作的根本還是希望大學(xué)生們還是發(fā)揮自己的能力做原創(chuàng)作品,設(shè)計(jì)的原則是“可以放過(guò)一個(gè)壞人瘫证,但決不錯(cuò)怪一個(gè)好人”,只要是自已寫的或是翻譯的,通過(guò)就是小意思了。再或者說(shuō)蝇刀,我們的論文查重系統(tǒng)是讓我們大學(xué)生都具備基本的科研能力螟加,自己完成任務(wù)還是收益頗豐的。在我們的學(xué)位沒(méi)問(wèn)題的情況下還是多多保持原創(chuàng)吧吞琐!