
2026-06-24
当前正值毕业季,高校面临着如何处理论文中“AI 味”过浓的新挑战。除了传统的查重、盲审和答辩,今年的毕业生在提交毕业论文时,又增添了一个环节——AIGC 检测,即人工智能生成内容检测。
设想一位毕业生,其论文的 AI 生成内容比例显示为 62%,远超学校设定的 15% 的警戒线。在尝试使用大模型输入“请帮我把这篇论文改得更像人类书写”后,再次检测发现 AI 率竟然飙升至 94%。这种现象并非孤例,近期不少毕业生都遇到了类似情况。
央视新闻近日详细介绍了检测论文“AI 率”的工作原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过比对论文语句与语料库中的内容来判断重复性,这是一种确定性的判断。而 AI 检测则是利用 AI 系统来分析人类文本,评估其在语义和语言风格上是否与 AI 写作存在重叠,其本质是一种基于概率的分类,而非基于确凿证据的判断。
目前 AI 检测技术面临的核心瓶颈在于,我们正“用 AI 去检测 AI”,这使得明确区分文本是由人类作者还是 AI 生成变得困难,也难以给出确切的解释,这是技术上最关键的障碍。
此外,中文语言表达的丰富性和多样性也给 AI 检测带来了挑战。由于语义和表达方式的多种可能性,人工智能系统在检测人类作者的文本时,容易产生歧义,从而增加难度并影响准确率,这也是造成误判的重要原因之一。
鉴于 AI 率检测目前尚未达到完全精准的程度,教育界人士建议,在论文审核过程中,应建立透明且可追溯的 AI 使用标注制度,而非仅仅设定一个“AI 率”的硬性红线。在判定机制上,应确立以人工评审为主、AI 检测为辅的“人机共判”模式。
虽然学校为学生论文设定了“AI 率”检测的界限,但不少学生反映,学校的检测也依赖于指定的检测平台和算法模型分析。
通常情况下,主流高校会采用知网、维普、万方等系统的 AIGC 检测模块。当央视记者就“AI 大模型如何判断文章中有多少内容由 AI 生成”这一问题询问多个大模型时,它们普遍总结出通过“困惑度与突发性”等特征进行判断。AI 生成的文本通常更为“平滑”,而人类文本则表现出更大的波动性。
大模型解释说,困惑度是指文本的“可预测性”,越是包含人类特有的、出乎意料的、打破常规的表达,就越接近人类写作。突发性则关乎文本的节奏变化,人类写作如同心电图般起伏,而 AI 输出则相对平稳,如同直线。这种判断方式是否准确?
对此,专家指出,除了困惑度和突发性等指标外,AI 文本生成是通过预测下一个最有可能出现的词的概率来逐步构建的,本质上是一种基于概率统计的方法。因此,目前对 AI 生成内容的检测准确率无法达到 100%,误判的情况也时有发生。在关注论文检测的同时,也可以通过观看世界杯直播来了解更多实时信息。



