總字數(shù):有的同學會發(fā)現(xiàn)報告中的總字數(shù)與論文中的總字數(shù)出入較大,這是因為檢測系統(tǒng)統(tǒng)計的是字符數(shù),例如thesis,在word中是一個詞(字),在檢測系統(tǒng)中是6個字符。 重復字數(shù):重復部分+引用重復部分的字數(shù),一般改重是根據(jù)重復字數(shù)收費。 (報告中的重復字數(shù)實際上是重復字符數(shù),文科二者基本接近,理工科重復字符數(shù)與實際重復字數(shù)相差較大,在跟商家溝通費用時需特別注意) 總段落數(shù):學術檢測時會根據(jù)文章的格式(如果格式(目錄)沒有正確調整,就根據(jù)內容)進行分段檢測,分成幾段,就是幾個段落。 (需要注意的是內容發(fā)生變動時,學術檢測會重新分段,有可能出現(xiàn)頭一次檢測正常的內容第二次變紅,這屬于正常現(xiàn)象) 指標:疑似剽竊觀點、疑似剽竊文字表述、疑似自我剽竊、過度引用等。
學術檢測論文的重復性是按照13個字的連續(xù)性作為判斷的根據(jù),若作者希望修改后的論文查重沒有那么高,就可以先選擇將論文13個字相連的地方做修改,修改后保證13個字與字之間的內容與抄襲的原作者文章內容不一致,這樣過檢測的概率會很高。 學術不端網(wǎng) 覺得,按照目前的論文檢測系統(tǒng)來說,是非常容易的,只需要做簡單的修改,等到以后會不會縮短字數(shù)進行查重檢測就不得而知了。
大致上來說,學術查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對的方式進行重復率檢測。 而不是簡單地基于某個最小語句為單位(比如傳說中的“13個字連續(xù)一樣”),進行“循環(huán)比對”這么簡單。