论文查重的知识产权问题的思考

2022-10-10 20:59:46   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《论文查重的知识产权问题的思考》,欢迎阅读!
知识产权,思考,论文,问题,查重的
法学院本科生20142015学年 第(1)学期

《知识产权法》课程期中作业

学号: 1212893 姓名: 冉启辉 成绩:_________

浅谈我对论文查重系统的一些看法

真的很巧,我在这个学期之前的暑假中百无聊赖,正好在网上接触到了一位生物学院的学长,他向我介绍了一个赚取外快的机会,就是降低论文重复率的工作。他作为一个中间人,从网上各个商家搜集需要降低重复率的论文,然后分配给我们。包括我在内的这些终端的工作者,大多为学生,利用课余的时间,就像早期意大利分散的家庭手工坊一样,修改论文的重复部分,使重复率降到15%下,就能拿到相应的报酬。

首先我介绍一下这些需要降低重复率的论文。以我修改的论文来看,主要是硕士毕业论文,字数在50000左右,重复率一般为30%60%。毕业论文已经成为当今毕业生学业生涯完结的一大难题,很多毕业生平时都没有独立完成论文的习惯,多半靠复制粘贴来完成老师交代的论文任务,论文重复率往往超过50%或者一部分学生虽然在毕业论文中的观点是独创性,但是因为自身的原因和论文题材本身的原因导致论文需要大量引用其他的语句和图表从而使得论文的重复率相对较高,30%左右。本科生毕业论文一般在10000字左右,比较容易完成,虽然大部分都是非独创性的,但是因为字数较少,一般自己都能完成降低重复率的任务;博士毕业论文也不是我们这些一般的本科生水平能够企及的,再者到了博士这个水平的人,一般也都会自己独立的完成论文,而且博士论文的审查答辩是比较严格的。因此硕士论文就成为了我们修改论文的主要来源,这些论文介于本科生论文和博士生论文之间,难度不是很大,字数较多,而且随着当今学历不断地推高,“本科生满地跑,硕士生满天飞”,导致硕士生的质量层次不齐,往往有很多是混文凭的,这些情况都使得硕士生毕业论文的查重检测很难过关。

然后我将介绍一下我们是如何降低重复率的。在介绍如何降低重复率之前,我得先说明一下网站以及学校查重的基本原理。查重就是检测论文和已发表文章的相似度,通过将所检测论文与论文检测系统背后的数据库中的文章进行对比,


相同字符的比例就是论文的相似度。当你把论文交给网上的查重检测之后,他会给你一个《文本复制检测报告单》,这个报告单包含的主要内容有检测范围、文字相似比、相似比分布以及详细的原文内容和相似内容来源 的对照。检测范围就是该查重系统背后的数据库,你的论文将和数据库的所有文章进行对比,如果你的论文相似来源没有包含在这个数据库中,即使全部是抄袭的,这个系统也检测不出来。以我手上的这篇正在修改的论文为例,这篇题为《建筑安全管理》的论文所提交的重复率检测网站背后的数据库所检测的范围包括中国学术期刊网络出版总库、中国博士/硕士学位论文数据总库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国专利全文数据库、互联网资源、英文数据库、港澳套学术文献库、优先出版文献库、互联网文档资源、个人对比库,可以看出这个数据库还是非常庞大的,复制论文想要超出这个范围还是有难度的。建筑管理》这篇论文的相似比为34.4%,去除引用文献比为15.8%,有必要说明的是学校论文的查重并是计算论文的相似度总比的,就是不会去除引用部分的,此即使你已经在文章中说明的引用的部分也会计算在重复率内的。全文对照就是把详细的罗列所检测论文和相似来源的语句,以方便降低重复率的修改。有必要说明的是论文查重检测字符的相似度并不是说有一个字符相同就会判定为相似,它以段落为单位进行检测,一般来说高于该段落字数的百分之十的连续的相似字符将会被计算到重复率之中,这个10%就是论文重复率检测的阀值。并且图表文字将被视为连续的字符。因此很多科技类论文的相似度较高往往来源于图表的直接引用,而这些图表往往也是我们降低重复率工作者头痛的地方,因为图表中的文字和数据往往是具有相当的专业性、简略性和不可修改性的。

那么我们是如何降低重复率的呢?这个其实很简单,就是利用论文检测的基本原理和论文检测的阀值。对于被检测的论文所标注出来的相似部分进行修改,通过变换句式,主动句变被动句,被动句变主动句,或者倒装句等等诸如此类;再一个就是在相似部分中的语段中添加或者减少字词,使得相似部分的相似比低于论文检测的阀值10%,也就不会被检测出来。当然这些手段都不是很保险,最保险的手段是自己先理解标注部分的意思,然后按照自己的思维重新编写,这就100%保证不会被认定为相似。以《建筑安全管理》为例,其中一段被认为是相似的语句为“自改革开放以来,我国建筑业得到了飞速的发展,一跃成为我国


国民经济五大支柱产业之一。近年来,建筑业增加值占GDP的比重仍然保持了上升势头,例如,2011建筑业总值占GDP的比重上升至6.79%的高位,首次达到30年来的最高点。这也进一步促进了建筑技术、管理水平的提高。我将其修改为“从改革开放到今天,建筑业在我国发展迅猛,所占国民经济生产总值的比重日益上升,飞跃至我国国民经济五大支柱性产业之一。以2011年为例,我国建筑业占国民经济生产总值的比重达到30年来的最高位6.79%,反过来也有力地促进了管理水平、建筑技术的发展和提高,以至于带动了整个国民经济的快速发展。”这样修改就很好的规避掉了论文查重的检测。意思基本没有变化,但是却改形换貌,逃过了论文查重。

我以身说法的写这些并不是说我要如何的抨击这个论文查重系统的一无是处,而只是很中立的说明这样一个问题。由于论文查重检测涉及知识产权中著作权保护的问题,因此论文查重软件也是具有一定意义的。简单来说,就是论文查重检测仅仅只是一个前置的工具,并不能通过论文查重检测系统的一个相似比的一个简简单单的数字就说明论文抄袭,还需要人工的检查。对于相似度较高的论文,例如超过30%的文章,基本上可以认定为抄袭。而对于那些相似度不是很高的论文,但是又超过15%的文章不一定说明就是抄袭,有些论文由于研究题材的原因,需要大量的引用数据导致相似度超标也是可以理解的;相反对于很多低于相似度15%的论文也不能说明其没有抄袭,因为以我的例子来看就很容易说明。因此,论文查重系统仅仅只是一个人类科技进步和人类需求相结合而发明的工具,不能完全依赖,更不能完全否定。工具可为善,也可为恶,关键是在于我们如何运用它。


本文来源:https://www.dy1993.cn/tED.html

相关推荐