第一句子大全,网罗天下好句子,好文章尽在本站!

论文查重原理及降重

时间:2022-12-04

编辑一旦发现论文的重复率过高即和已发表的论文数据库中的某一篇或多篇论文高度相似,就会直接拒稿或退回论文要求改写,这是每位作者都绝对不想看到的后果

友情提示:本文共有 14008 个字,阅读大概需要 29 分钟。

据全球著名出版社Wiley(威立)介绍,目前超过1/3的国际期刊编辑经常碰到论文有重复的情况。编辑一旦发现论文的重复率过高(即和已发表的论文数据库中的某一篇或多篇论文高度相似),就会直接拒稿或退回论文要求改写,这是每位作者都绝对不想看到的后果。重复率等于论文中重复的单词个数除以论文参与查重的总字数(原则上参考文献不参与查重)。比如,一篇含有5000个单词的论文中有1000个单词被认定重复,那么这篇论文的重复率就是20%。在查重报告中,一般用Similarity Score(相似度分数)或Similarity Index(相似度指数)表示重复率,两者的定义没有任何差别。

本期将结合理论和真实的案例分析分别介绍查重的必要性、重复的原因、权威查重算法的原理、降重的方法及案例分析,并在最后一节对读者关心的常见问题进行解答。通过阅读本内容,读者们可以更加系统地了解国际SCI期刊的查重原理以及掌握减少重复率的技巧,从而顺利通过SCI期刊的查重预筛选。我们想强调的是,学会改写不是为了更好地拷贝再转化成自己的写作,而是让大家更好地学会消化吸收和引用参考已发表的论文,特别是论文的引言和材料方法部分以及综述性论文的写作方法。

1.查重的必要性

随着来自中国地区的英文论文的激增及部分论文的重复问题越发严重,国际上越来越多的SCI期刊设置了论文预筛选环节,即编辑在查看论文内容之前,用查重软件对提交上来的论文进行查重。比如国际著名的学术出版商Elsevier(爱思唯尔)出版的大部分期刊和Wiley出版的所有开放性期刊都设置了自动查重。

如果论文被查出小程度重复,则会被期刊编辑要求改写,但论文作者会给期刊留下不好的印象,而且由于要改写论文便会延长论文的审稿时间和推迟最终发表时间。如果有较大程度的重复,期刊编辑一般会直接拒稿或要求作者做出合理的解释。如果解释不成立,则有可能被认为是违反学术道德而拒稿且不给再投机会。国际著名的学术出版商Elsevier官网上的“作者指引”(Guide for Authors)列出的拒稿原因中就提到道德问题,如图1.1所示。

图1.1 著名学术出版商Elsevier旗下某期刊的“作者指引”节选

下面给出3个真实案例来说明重复率过高导致的后果。

案例1.1

重复率过高,作者被要求做出解释[Springer(斯普林格)出版社期刊]

气象与大气科学研究领域中的SCI期刊Theoretical and Applied Climatology的主编让作者对论文重复率过高的问题进行解释:

“The program iThenticate has indicated that 33 percent of your text are very similar or identical to other papers, foremost to two websites, which you do not cite.Please comment.”

主编发现该作者的论文中有1/3的单词与其他论文中的单词相似或完全一致,于是让作者给出解释。可想而知,如果解释不好,将很难说服主编录用该论文,甚至连送审的机会都不给。

案例1.2

重复率过高,论文被退回(Wiley出版社期刊)

海洋领域的SCI期刊Journal of Geophysical Research-Oceans的编辑对某一投稿人的论文在未审稿前进行了查重,并做出如下评价:

“Our screening for overlap with published works, including those authored by yourself and/or your co-authors, indicates that substantial parts of the manuscript are similar to those from other works.After careful consideration of your manuscript and these other works, I am returning the manuscript without review.”

编辑明确说明该论文和已有文献存在大量的重复,并且给出了直接拒稿的决定。由于编辑没有给出具体的重复程度和重复的地方,笔者帮助该投稿人进行了查重,结果显示重复率高达40%,即论文中有2/5的单词存在和已有文献重复的情况,属于重度重复。

案例1.3

重复率过高,论文被退回(Elsevier出版社期刊)

A大的一位科研人员曾经向土木工程方面的一个王牌期刊Engineering Structures投稿,投稿后很快就收到了如下具体的编辑意见:

“This paper cannot be considered for possible publication due to a high similarity index(25%), which indicates a large amount of overlapping with published materials.”

论文被查出重复率为25%,导致论文被主编立即拒绝,而且主编不给这篇论文修改后再投的机会,作者遗憾不已。

即使论文侥幸通过编辑预审和审稿人审稿而发表,在论文见刊后也需要接受读者的审阅。如果读者发现论文存在和其他论文重复的情况,可直接向期刊编辑或主编汇报重复的可疑情况。期刊编辑接到申诉后则有义务对该论文进行查重,如果查重结果证明读者的申诉成立,且论文通讯作者不能做出合理解释,则该期刊有权撤回已经发表的论文,同时有权通知作者所在单位或者资助本论文研究的基金单位。如此造成的影响将会非常恶劣,会极大地影响作者的学术声誉。Steen等人在2013年发表的研究成果(Steen et al., 2013)中分析了2047篇被撤稿的医学论文后,他们发现这些论文被撤稿的时间都在发表后的平均32.9个月内,且被撤稿时间越来越短。比如在2002年后发表的1333篇论文中,撤稿的平均时间降为23.8个月,而且对于高影响因子的SCI期刊,撤稿时间更短。这说明,国际SCI期刊编辑越来越重视类似抄袭造成的重复等学术道德问题。

因此有必要了解国际SCI期刊的查重原理。在了解查重原理的基础上,再学习改写论文的常用技巧就可以尽量避免重复或有效降低论文的重复率。

2. 重复原因

中国学者在发表英文论文的时候,存在非英语母语的劣势,会受到中式思维逻辑与英文表达无法完美衔接的制约。为了摆脱这方面的制约,并展示语言表述的地道性,我们很可能会借鉴和模仿同领域中母语是英语的国际学者的英文写作。然而在模仿借鉴的过程中,存在着许多会导致重复的情形。再者,在引用自己过去发表的论文,特别是研究背景和研究方法部分的时候,也会容易造成重复。同时,随着互联网的发展,可获取的网络论文信息越来越多,这也就更容易造成论文内容的重复了。

重复可分为故意重复(即直接挪用他人写作成果)和无意重复(即自己写的内容也会重复)。对于故意重复,比如直接复制粘贴造成雷同,由于没有分析的必要,我们不再说明。而我们会重点分析无意重复,剖析背后的主要原因,并为有效避免重复和降低重复率提供方法。

下面我们对无意重复的6个主要原因从SCI论文的各个部分进行解释说明。

2.1 情形1:题目的核心要素类似,容易重复

由于题目中包含的核心关键词在同一领域中很可能一样,因此如果研究内容和已发表论文的研究内容相似,那么就很可能出现题目高度重复的情况,如表1所示。

表1 高度重复的两篇论文题目

两篇论文研究的对象相似(Cold-Formed High Strength Steel是一种高强度钢材料,Cold-Formed Steel Tubular Sections是一种普通钢管),且测试条件都是高温(at

Elevated Temperatures),只是把研究变量从材料属性(Material Properties)变成了力学属性(Mechanical

Properties),因此两者结构相同,导致较大程度的重复。

题目重复的主要原因是题目的核心要素相似,如研究的对象、研究的变量、研究的条件、研究理论/方法/关系等。这些核心要素常常被写在一些常用的表达中,比如题目的经常写法有(下划线表示研究对象或条件):

虽然论文题目的字数很少,即便被查出有重复也不会对全文整体的重复率有较大影响,但是如果被SCI期刊编辑发现高度重复,就很可能会判断我们的论文是在重复前人的研究,也就是说创新性很差,很有可能直接被编辑拒稿。这也提醒我们可以在投稿前先去搜索一下是否有高度相似的题目,如果是,则需要改动。

2.2 情形2:研究背景相似,模仿后容易重复

在引言的写作中,首先要在第一段介绍研究背景,这在两种情况下容易造成重复。

(1)情况1:在引言的第一段中描述和国际同行相似的研究背景。这时候,如果我们去模仿已经发表出来的同行论文,而且没有正确地改写,就容易造成重复。

案例4

原文的中心是说明水泥基材料的传输性能很重要以及为什么重要。如果是小领域同行,很可能也需要表达类似的意思。如果想模仿并改写,但是把握不好的话,就会造成重复。

模仿后的段落和原文有高达31/49≈63%的重复率,其重复的单词和短语用下划线表示。

(2)情况2:作者自己的某一个课题成果较为丰富,可以就该成果连续发好几篇论文,而每篇论文的大背景大同小异,这样引言中的研究背景部分则容易造成自我重复。比如基于一个博士课题成果,往往可以发3~5篇SCI论文。由于是同一个课题,因此总的研究背景是相似的,这时候就容易造成引言第一段的重复。

2.3 情形3:综述当前研究成果

在引言中,容易出现重复的第二个部分是对前人研究成果的总结概括。如果没有高度概括前人的研究成果,就容易出现短语结构和关键词重复的情况。比如:

这两句话分别用被动语句和主动语句表达某个新模型被提出来(针对某个具体对象)的意思,都采用了短语结构a constitutive model for sth.,而且研究对象aluminium

alloys(铝合金)又很常见,也容易形成重复的情况。

或者选用一些常见的短语进行概括,也有可能出现重复的情况。比如:

短语a number of experimental and

numerical studies on经常被用在引言中来表示某个热点话题的关注度,因此就容易造成重复。

此外,在报道某种情况或数据时,由于数据和报道的对象都是统一的,就容易造成重复,比如:

报道主体是世界卫生组织(World Health Organization)、结核病犯病人数和死亡人数以及所在年份,它们都是固定的,因此就容易造成重复。

2.4 情形4:相同或相似研究方法,易重复

如果我们的论文研究方法和国际同行类似,往往需要参考已发表论文中的方法和具体步骤。其中那些较为标准和通用的方法步骤往往可以被借鉴。如果我们没做好改写,就容易造成语句重复。

同时,如果我们已经发表过使用某个试验方法或数值分析方法的论文,在新的论文中需要再次描述同一方法,就很容易造成自我重复。比如,我们有可能把已经发表的论文的方法部分作为一个模板,保持主体结构不变,只改动关键变量,比如材料名称、测试条件等。再比如,同一个课题组中的科研工作者都使用同一实验室、仪器及实验方法,这时如果没有正确改写,就容易造成论文的自我重复或与同门/同行重复。

案例5

多篇论文出现相似试验方法描述

论文1,发表于Chemical Geology:

“Laser sampling was performed using a GeoLas 2005 System, and an

Agilent 7500a ICP-MS instrument was used to acquire ion-signal intensities.”

论文2,发表于Lithos:

“The laser sampling was performed

using a GeoLas 2005 System, and an Agilent 7500a ICP-MS instrument was used to acquire the ion-signal

intensities.”

论文3,发表于Tectonophysics:

“Laser sampling was performed using a GeoLas 2005.An Agilent 7500a

ICP-MS was used to acquire

ion-signal intensities.”

小编仅以国内某重点实验室为例,以课题组为单位,其中的所有科研人员均可完全套用整个实验方法流程,只需置换样品名称。由此可想而知,会造成怎样的重复率。上面摘录的仅是一部分实验过程。那么,这样生成的文章会得到怎样的审稿意见呢?请看下面真实的审稿意见:

我们自己虽然明白这些通用的试验方法很难有新的写法,也知道我们研究的重点不在试验方法上,即便试验方法相同,研究的创新点还是存在的。可是,如果作者在提交论文之后无法通过计算机查重算法的初次审核,文章的重复问题就上升到了道德层次,将无法给编辑发现文章精华的机会,更有甚者可能使作者丧失再次投稿的机会。

2.5 情形5:研究变量相似,结果易重复

如果使用和已发表的论文中相同的试验或模拟方法,特别是和自己已发表论文中的实验方法相同,且测量的变量也相同,就会出现在论文结果部分使用和已发表论文结果部分相类似的句子结构去表达的情况。

案例6

第二句主相对于第一句的改动主要是替换了图表的标号,但都是同一个试验

(transient state test),且都是在相同测量条件下(under room temperature)测试相同变量(stress-strain curve)。

2.6 情形6:无法和难以避免的重复

目前的计算机查重算法将有固定表达的作者单位信息(Affiliations)、变量说明

(Notations)、相对固定的致谢

(Acknowledgement)、利益冲突申明(Conflict of Interest Statement)和道德申明(Ethical Statement)都纳入查重范围,因此这五部分一般都会被算作重复部分。不过大部分SCI期刊编辑都理解这些部分的重复,而且它们字数很少,因此不会对全文的重复率有大的影响。

以医学中的某标准道德申明为例。

可以看出类似这种标准语句的用法是非常普遍的,如果在写作时参考模板却不做改写,就会和已发表论文重复。

此外,参考文献不应该在查重中被考虑进去,例如查重软件iThenticate就可以在查重时自动排除参考文献。但是,在实际中,我们发现少部分SCI期刊的编辑也把参考文献包含在重复内容中,造成总体重复率的大大上升。这时,我们需要及时提醒编辑,说明参考文献有固定的格式,在同一出版社出版的不同SCI期刊中是完全一样的或基本一致的。

3 .权威查重算法的原理

理论上,判断论文内容是否重复的方法是看论文中的想法是否来自于作者自己,且用自己的话表达;如果不是,则要看是否将借鉴的内容进行了恰当改写并且写上了参考文献。因此,想要避免重复,则要在论文中用自己的话表达原创的想法,否则就要改写并附上参考文献。

如果想法存在雷同,则被称为“想法重复”,是最高级别的论文重复,如图2所示。依照重复级别由高到低,除了想法重复,依次为翻译式重复、改写式重复、伪装式重复、复制粘贴重复。

图2 论文重复的常见类型及最新查重算法覆盖范围

以下是对各个重复级别的解释:

(1)复制粘贴重复是指克隆式地去照抄别人论文中的语句,是一种“暴力”重复,是绝对逃不出目前查重算法的法网的。

(2)伪装式重复是指对原文的形式进行小改动,且没有加双引号明确指出引用的内容,比如表2中下划线部分的句子就是伪装式重复句子。

表2 伪装式重复句子

(3)改写式重复是指通过意译改写句子,即保持句子意思不变,但重新用自己的话表达出来。

(4)翻译式重复是指翻译其他语言的论文,保持译文与原文意思一致,比如将英文论文翻译成中文论文,并在中文期刊上发表,这样的操作就可以被称作翻译式重复。

(5)想法重复是指论文中语句表达出来的想法存在雷同,即语句表达的核心意思一致,但是语言表达的形式不同。

对于复制粘贴重复和伪装式重复,目前用字符串精确匹配算法即可查重,即一句话中连续重复3个及以上单词即可判定为重复。比如Plagiarism Checker X软件中默认连续4个单词以上算重复(使用该软件时,可修改为连续单词的个数标准,比如5个),如图3所示。

图3 Plagiarism Checker X查重报告

然而这种算法的最大缺点在于,只要在连续重复的单词中调整其中一两个单词,这些单词就没法被识别为重复,从而没法识别更高级别的重复。比如,在连续重复的5个单词中(见例7),替换掉中间的冠词a和形容词smart,这样重复的连续单词就变成了2个,也就骗过了查重算法。

案例7

字符串精确匹配算法查重改写后句子,结果显示无重复单词

目前绝大多数国际SCI期刊采用的权威查重算法是一种基于语言风格的算法(见图2),即不仅能查出一模一样的句子或词组(见例8和例9),而且能理解句子结构(见例4),因此是在字符串精确匹配算法基础之上发展的高级查重算法。只要句子结构和原文类似,那么即使句子中的部分单词不同,剩余重复的单词也照样可以被查出,即便是常用的介词或冠词。这比上面提到的字符串精确匹配算法能识别出更高级别的重复。不过,目前最先进的查重算法的识别程度还只能局限在句子结构上,而不能理解单词的含义,即不能在语义上进行查重,比如近义词替换后就可以躲开重复(见案例10)。

总结一下,目前的最新权威查重算法能覆盖所有的“复制粘贴重复”和“伪装式重复”,部分覆盖“改写式重复”。这就意味着,对于准备投稿国际SCI期刊的作者,只要避免暴力的“复制粘贴重复”以及对原文表达形式进行小变动的“改写式重复”,以及采用正确的改写方法,就能大幅度降低重复率,从而成功通过SCI期刊的查重预筛选。

由于查重是从数据库中挑选出与查重论文重复的论文或网页,因此一个合格的查重软件还需要覆盖足够多的学术论文数据。

目前受到国际SCI期刊认可程度最高的查重软件是iThenticate。它覆盖了超过600亿个网页数据,超过530家出版社的大约3800万篇(本)期刊论文、会议论文、博士论文、书籍等。这些出版社包括了著名的四大学术出版社,即Elservier、

Springer、Taylor & Francis(泰勒和弗朗西斯)、Wiley,如Elservier出版社就贡献了超过1000万篇论文和7000多本书。这些庞大的数据库也说明,想躲开确实存在的重复几乎是不可能的。

下面我们选用查重软件iThenticate,展开对论文查重原理的案例分析。

案例8

复制粘贴重复

句子或段落无改动,导致全部都被查出重复。

案例9

伪装式重复

解读:新版本的写作主要对原文的结构进行了微小改动,把疑问句改成了陈述句,而里面的内容基本保持一致。这种就被称为“伪装式重复”,很容易被查重算法发现。

案例10

改写式重复

解读:该句子的结构为research has

been...on the material...of...at,可见和原文的句子结构一致。虽然进行了改写(比如properties改成近义词behaviour),但是句子结构没有发生变化,依然被查重算法识别出来了,有12个单词重复(总共22个单词),共计55%的重复率,甚至连介词of也被认为是重复单词,可见句子或短语结构的相似是可以被查出来的。不过由于目前查重算法不能识别语义,在相似句子或短语结构中进行近义词替换就可以减少重复,比如短语on the material properties of中的properties替换成近义词behaviour就躲开了重复。

此外,如果连续的多个句子(甚至一个段落)的结构和具体某一篇已发表论文中的内容相似,查重算法都可以将其一块找出来。比如下面新版本中带下划线的单词或短语都是重复的。

查重结束后,会出具一份查重报告并显示查重结果,如图4所示。在其中,会显示被查重的论文题目、重复率、数据库中与之重复的论文题目或网页地址以及它们的编号(从1开始)、每篇重复论文的重复字数以及单篇重复率。这些单篇论文的重复率由高到低排列,它们被全部累加起来后就是总的相似度(如图4中就是35%)。

图4 查重报告显示查重结果

同时,在被查重的论文中会有不同颜色高亮显示哪些文字或数据是被认定为重复的,且在句首对与之重复的论文或网页进行编号(见图5)。比如,图5中显示为1的重复句子,表示在图4中的1所对应的论文中有重复的内容:“to convert experts"opinions into comparable measures and”。期刊编辑在查重软件里面点击“1”,即可快速查看论文1中对应的重复句子。

图5 查重后的论文高亮显示重复的单词或短语

如果数据库中的两篇论文互相之间也有重复,那么查重时显示最高重复率的那篇,而把相对低重复率论文的重复部分扣除两篇之间重复的部分。比如论文A的总重复率是30%,重复的论文B和论文C的重复率分别为25%和5%;而如果拿论文A分别与论文B和论文C进行重复比对,实际的重复率分别是25%和10%,这是因为论文B和论文C之间有5%的重复。

期刊编辑主要看的是总的重复率,但是也看重复的具体情况。比如一篇论文的重复率是20%,表示有20%的文字和数据库中的一篇或多篇论文重复。重复的部分既可以是和单独一篇论文重复(单篇20%的重复率),也可以和20篇论文重复(每篇论文1%的重复率)。很明显,前者重复的情况要比后者严重得多,因为作者有可能大幅度复制同一篇论文。因此,如果重复的篇数很多且每篇论文重复率都很低,比如1%,那么有一个高的总重复率的论文也不一定被判定为重复。这也告诉我们,要判断论文重复的程度可以先看是零散的单词或句子重复,还是整段或多段文字的集中重复。

同时,即便同一重复率下,在不同位置的重复也会产生不同的重复结果。比如,在实验方法部分重复就比在结果、讨论和结论部分重复的程度要轻。这是因为描述材料、实验分析方法和过程的语句形式变化有限,从而容易造成重复,这通常可被期刊编辑所理解。然而论文的结果、讨论和结论部分是体现论文个性和创新性的核心部分,也就意味着不能和其他论文重复,这也是编辑会比较严苛对待的部分。例如,环境科学领域的JCR1区(2016年)期刊Ecological Indicators曾特别强调了某篇论文在Highlights(要点)和Findings(结果)上存在高度相似:

此外,论文的类型也会影响期刊编辑判断期刊的重复程度。比如综述性论文就比原创性论文更加容易造成重复。因为在综述性论文中,作者需要大量地总结前人的研究成果,几乎没有或较少地贡献原创数据和分析。但是小编强烈建议大家在理解前人研究成果的基础上用自己的话表述,这是写综述性论文的基本要求。

因此,期刊编辑在拿到论文的查重报告后,会首先看总的重复率,再考虑重复的分布、重复的主要位置、论文类型等来判断重复程度。由于单一的总重复率不能决定重复的严重性,因此目前国际上并没有统一的最低重复率标准,即不能说哪一个具体的重复率以下的重复程度可算作合格。但是,根据图6,Papergoing对中国英文论文查重总结的数据(注:这些论文都被不同期刊指出有重复问题),没有一篇论文的重复率低于10%;重复率介于10%到20%的论文共占15%;重复率超过20%的论文比重最大,共占85%。

图6 Papergoing查重的被拒论文重复率分布

因此,我们可以认为,总重复率在10%以下且单篇不超过5%会比较安全,基本不会算作重复;但如果总重复率超过20%,这样的论文基本会判定为严重重复。著名学术出版社Springer也表示,如果重复率超过20%,这篇论文会被仔细地检查,以确认是否确实重复太多。

4 .降重的方法及案例分析

这一期我们将传授如何降低重复率,并结合案例进行指导分析。值得注意的是,改写时要遵守句子意思不变或相近的原则。基于第3节中分析的查重原理,我们总结出了如图7所示的主要降重方法及流程:首先应理解要改写句子的意思,然后在整体形式上改变句子结构(比如复杂句与简单句转换、主动句与被动句转换等),并进行局部改动,比如词组变换、同义词替换、单词形式变化(单复数变化、动词与名词转换、名词与形容词转换等)。在本节的最后,我们也给出其他的一些改写小技巧。

图7 主要降重方法及流程介绍

(1)改写句子结构的例子,以复杂句与简单句转换为例,比如:

复杂句:Based on the WL theory,

Wang et al.developed an analytic

model, which combines the Fourier

synthesis method and the

time-dependent linear stability

analysis, to predict the interface

structures.

简单句:Based on the WL theory,

Wang et al.developed an analytic

model to predict the interface

structures.This model combines the

Fourier synthesis method and the

time-dependent linear stability

analysis.

(2)词组变换,以名词所有格变换为例:

(3)同义词替换的例子,比如:

(4)单复数变化的例子,比如:

result与results。

(5)动词与名词转换的例子,比如:

We consider...与The consideration of...

(6)名词与形容词转换的例子,比如:

The experiment was a success与The

experiment was successful。

下面我们结合实例进行讲解。

案例11

解释:重复的句子和原文句子的结构一模一样,只是在介词短语a range of中加入了一个形容词wide。这虽然把重复的句子分隔成两部分,但是由于目前的查重算法能识别句子结构,因此达不到降重的目的。我们首先改写句子结构,将现在完成时改成现在进行时;同时,改复数名词为单数名词(alloys改成alloy),且将介词短语a wide range of改成相近意思的形容词multiple,既可保持表达相同的句子意思,又可避免重复。

案例12

解释:新论文中重复句子分别和论文1中句子与论文2中句子重复,重复率高达

63%。我们将新论文中重复句子第一句的被动语句(...are proposed in this

study)改成主动语句(This study

proposes...),且将新论文中重复句子第2句的主动语句(equations

accurately predicted...)换成具体的被动语句(...equations are found to yield accurate predictions),从而大幅度改变了句子结构,且进行了名词所有格变换(the material properties for

aluminium alloys改成aluminium alloys" material properties)、动词形式换成名词形式(predict改成prediction)以及近义词变换(elevated改成high, test改成

experimental)。

案例13

在第2节中,我们分析过原论文句子和重复句子相似的原因。这里通过将从句改成简单句,并将World Health

Organization(WHO)调到句子中间,且替换同义词(report变成estimate,

people变成patients)和单词词形变化(名词death变成动词died),从而大大降低了重复率。

以上三个例子表明,首先从整体上改变句子结构和局部上改变词组及单词形式可以有效降低重复率。

其他改写技巧:

(1)单复数变换不算重复,比如可将

apple改成apples。

(2)图形不会记入查重,即可将表格中的数据用图形表示。

(3)多次出现的专业词组改成简写,比如可将sea spray generation function改写为SSGF。

5 .常见问题答疑

(1)目前有哪些SCI期刊开始设置查重了?

随着论文投稿数量的快速增长,越来越多的国际出版社要求期刊在审稿前选择性设置查重,包括全球最大的四家学术出版社:Elsevier, Springer, Taylor &Francis, Wiley。但是实际操作中如果对每篇论文都查重则工作量过大,因此不一定每篇论文都查重,有些期刊按一定的频率来查,比如每2篇或每5篇查一次。

(2)用什么软件查重?

目前绝大多数SCI期刊和出版社认可的查重软件是iThenticate,该软件中包含绝大部分学术期刊论文、会议论文和博士、硕士学位论文。小编在本讲分析的查重原理以及案例都是基于iThenticate的。第2个查重软件是跟iThenticate同属一家公司的Turnitin。小编用两个系统对同一篇论文进行查重后并对比结果发现,两者的主要差别是数据库的范围。Turnitin由于主要用于国外大学在校生的作业和毕业论文查重,因此没有包含ProQuest(全球英文博士论文数据库),而iThenticate则包括ProQuest。图8是利用iThenticate查重的某篇英文论文的查重结果,该结果显示论文中有38个单词与西澳大学的博士论文7重复。

图8 利用iThenticate查重的某篇英文论文的查重结果

(3)重复多少字或重复率多少算是重复太多?

总重复率在10%以下且单篇不超过5%会比较安全,基本不会算作重复,但如果总重复率超过20%,这样的论文基本会被判定为重复严重。举例来说,一篇单词数为6000的论文,如果重复率为10%,则表示有600个单词和已发表论文是重复的。

(4)是否有必要在投稿前自己先查重?

首先,回忆一下自己写论文的过程。如果涉及复制后的小改动,建议投稿前先查重和改写,避免被期刊编辑直接拒稿。

(5)有哪些方法可以降低重复率?

参见本期的第4节。

(6)如果我是审稿人,发现了审稿的论文存在可疑的重复,我该怎么办?

可发邮件通知联系你的编辑,附上已发表的原文以及发表的时间,举几个重复的例子,并要求进行论文全文查重。如果编辑不作为,可拒绝审稿。

(7)如果我阅读论文时,发现别人论文中存在可疑的重复,我该怎么办?

可收集可靠证据(重复的论文和原文以及发表的时间)后,向该论文所在的期刊编辑或主编发邮件举报,并要求进行论文全文查重。

(8)论文被期刊发现大量重复的最坏结果是什么?

①在审稿阶段,最坏结果是直接拒稿且不给再投的机会。

②在发表后,最坏结果是被撤稿且通知所在单位或基金资助单位,比如国家自然科学基金委,会极大地影响作者声誉甚至工作或学位。

(9)期刊编辑什么时候会查重?

编辑可以在论文审稿和发表的任何时间段查重,比如审稿前、中和后。如果发表后被读者举报,编辑也可以在发表后进行查重。

(10)被期刊发现论文有重复的情况后要求我做出解释,且给我修改的机会,我该怎么解释?

首先要感谢编辑给予解释和修改的机会,再从不同角度给出解释,比如:

①如果是年轻作者,比如学生,可以强调自己论文的重复是无意的,并解释说由于没有经验,没有意识到复制一些单词和短语是不符合国际学术规范的,并表示会吸取这次教训和认真改写。如果是有经验的作者,比如讲师或教授等,由于期刊编辑天然地认为他们会非常熟悉国际学术规范,因此从这个角度解释就没有用了。

②如果主要是和自己已发表的论文重复,可以解释说之前没有意识到复制自己的论文也违法了学术规范。

③虽然总的重复率比较高,但是单篇重复率较低,比如都是低于5%。这样的重复程度可以不被认为太严重,因此可认真改写后请编辑重新审稿。

④如果大部分是在材料和方法部分重复,可以解释说这部分在这一领域有标准的写法,比较难以改写。这里提示技巧:概括地写这部分,并指出具体内容可以参考某篇参考文献。

(11)在国内发表过的中文论文,翻译成英文再发表,能查得出来吗?

由于目前查重算法不能识别“翻译式重复”,因此中翻英的论文不能被查重算法查出来,但不排除未来新的查重算法可以实现这个功能。

(12)本来写的句式语法不好,润色之后会不会导致重复率变高?

好的英文写作水平和写作重复没有任何关系,润色只会让论文的语言表达接近或达到地道的母语写作水平。正如本期分析的论文重复,是因为写作和已发表的论文句式结构相似或关键词汇相同。因此如果原文表达是自己的,润色老师修改之后也还具有个性,所以不会导致重复率的较大增加。同样,如果本来的内容就有大量重复的,润色之后即便减少了重复的内容,其重复率还是很高。因此,为了避免重复,建议大家在参考他人论文进行写作时,要先理解内容再合理改写,打造一篇低重复率论文。一个较低的重复率,其背后反映的是原创的写作手法,这是国际SCI期刊较为欢迎的。

(13)为什么一些非常基础的词汇,比如and, on, the, of等词都会被查重识别出来?

这是因为它们所在的句子和前人发表过的句子结构上相似,且这些简单词又在已发表论文的相似句子结构中出现。句子相似是目前权威查重算法能有效识别的,具体见本期第3讲。比如句子“I like apple

and orange.”其句子结构为“...like A and B.”那么这个相似句子“You like

watermelon and banana”中的like和and就是重复词。

(14)为什么别的好几篇句式和内容都极为相似的论文,它们就没有被查重,而我的就被查重了啊?

主要是因为国际期刊在最近几年才开始较为频繁地查重,那几篇已经发表的相似论文,很可能由于较早发表而没有被查过重复。其次,即便是现在,国际期刊也是抽查,不会每一篇都查,比如每5篇中抽查1篇。那几篇论文也可能是幸运地躲开了查重。

本文如果对你有帮助,请点赞收藏《论文查重原理及降重》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
二年级下册语文:句式转换+排列句子专练 孩子暑假巩固有奇效

二年级下册语文:句式转换+排列句子专练 孩子暑假巩固有奇效

二年级下册语文:句式转换+排列句子专练,孩子暑假巩固有奇效相信大家都知道,小学语文学习重心围绕语文基础技能,如句式转换、排列句子、仿写、补充句子等内容,都是小学语文阶段的重点内容。孩子没有对句子相关技...

2022-11-20 #经典句子

「句子」句式转换 一次考试8分!跟我学 轻松应考

「句子」句式转换 一次考试8分!跟我学 轻松应考

【 句式判断 】你能准确判断下列句式吗?1. 很久以前,还没有伞。( )2. 小红和小明真有礼貌呀!( )3. 太阳难道不像一个大火轮吗?()4. 用什么办法才能把亭子做得轻轻巧巧的呢?()【陈述句变反问句口诀操】① 将...

2023-01-20 #经典句子

句子之间不懂如何转换?转发给孩子吧 满满的实用干货

句子之间不懂如何转换?转发给孩子吧 满满的实用干货

一、把字句、被字句、陈述句的互换。“把”字句:用“把”字将动作和对象提到动作前面,并在动作前面加上“把”字的句型。“被”字句:将接受动作的对象提到动作发生者的前面,并在动作发生者的前面加上一个“被”字...

2023-01-30 #经典句子

小学语文:句子的类型与转换

小学语文:句子的类型与转换

我们知道:在说话时,一种意思有多种不同的表达方式,每个人的语言习惯和性格不同,对于同一个意思的表达也会有所不同。有的人喜欢平铺直叙,有的人喜欢拐弯抹角,有的人喜欢颐指气使,有的人喜欢反问别人,有的人又...

2022-12-07 #经典句子

句子转换的更灵活 作文语言更生动

句子转换的更灵活 作文语言更生动

很多同学跟我讲,每次语文考试中,出现句子转换,或是“换一种方式来表达”,就会不知所措。而在作文当中,如果能够灵活地运用各种句式。作文就会更加灵活多变,变得生动起来。所以,这一讲,我们来讲一讲语文中句式...

2022-11-21 #经典句子