
“查重过了吗?”又到一年毕业季,论文查重成为毕业生之间的热门话题。近日,在多个社交平台上,除了常被讨论的查重率,关于论文AI率检测的帖子同样引发热议。
有网友反映,明明是自己原创的论文,经过系统检测之后,竟被指出AI生成内容比例过高。有媒体将朱自清的名篇《荷塘月色》与刘慈欣《流浪地球》的片段上传至某常用论文检测系统。结果显示,这两篇经典作品AI生成内容总体疑似度竟分别达到了62.88%和52.88%。此前还有网友发帖称,王勃的《滕王阁序》AI率竟然达100%。
AI率检测,就是利用人工智能技术对文本进行检测,分析文中AI生成内容的占比。当前,随着AI技术的发展,一些大学生的作业和论文里充满了“AI味”,甚至论文代写已经开始通过AI工具来批量编造论文。在这样的情况下,单靠老师们人工检测“AI”含量显然不是长久、有效的手段。不少高校尝试将AI检测引入毕业论文的审查标准,对论文AI生成内容进行规范,缓解AI冲击下的学术诚信问题。
但面对如此检测数据,不少网友担心自己的论文会被AI检测误判,也担心按照其结果修改后反而影响论文质量。毕竟,除了经典名篇被检测出AI率过高,从网络上的帖子来看,有人自己写的内容被提示高风险,用AI改写后反而通过AI检测,更有人调侃需故意“写笨”才能规避误判。
从AI检测的技术逻辑来分析,AI大模型的质量与“投喂”数据的内容和质量密切相关,而且模型的检测方式和算法模型存在差异,系统根据既有的语料通过算法反推AI生成的概率,回馈的效果很可能不尽相同,也不一定尽如人意。再加上,学术论文的语言和逻辑风格与AI生成文本的风格有一定相似性,结果可能“越努力越人机”。也就是说,现阶段AI技术发展尚存在缺陷,如果将其作为评价标准,有其合理性但显然也存在局限性。
由此,当学术评价回归到核心问题,即论文研究的创新性与思想性,这样的判断就走出了AI的“舒适区”。AI擅长对既有语料和素材进行排列组合,这就意味着生发和创造恰恰是它的短板。也就是说,AI很难真正判断一篇论文中的学术思考和智慧贡献。
高校对此并非不清楚,但以AI率检测遏制学术不端,既是明确态度,也是增加治理杠杆。当科技浪潮席卷而来,人工智能等新科技引入学术领域已成趋势。在这个过程中,除了期待审核技术的进步和成熟,高校、教师对于学生的日常作业、学术研究中的AI应用情况也应统一标准,为AI的应用设定清晰的边界。毕竟,AI检测系统的迭代升级与日常AI使用规范的确立是硬币之两面。审核技术检测的是底线边界,我们呼唤更完善的检测系统,也要重视日常行为共识的构建,两者同样重要。
(原题为《朱自清的《荷塘月色》AI率过高,引发何种思考?》 作者 龚桔 来源 光明日报客户端)
编辑:陈若松
二审:陈若松
三审:王长善