与机器人“同事”一起工作,你准备好了吗?
与机器人“同事”一起工作,你准备好了吗?
与机器人“同事”一起工作,你准备好了吗?临近毕业(bìyè),为了论文(lùnwén)达到AI率标准,有一批大学生不得不狠狠修改论文。
对于一些(yīxiē)高校的应届毕业(bìyè)生而言,除了传统的查重、盲审、答辩,毕业路上又多了一道关卡——AIGC检测。
收到学校对毕业论文进行AIGC检测的通知,大四学生一帆对“用(yòng)AI查AI”的方式感到不放心。而(ér)检测结果让他惊讶(jīngyà):“虽然我自己写的几个段落被误判为99%AI,但没想到(méixiǎngdào)我用AI润色的部分也被查出来了”。
利用系统(xìtǒng)改写后(hòu),他产生了好奇:“降AI也是AI写的,为什么就查不出来(chūlái)?”查看修改内容后,他发现“系统降AI方法就是删掉逻辑词、把很多话的表述变成口水话”。
对于AI率降低后的论文,他认为“论文质量反而下降了,但(dàn)为了合格,只能这样(zhèyàng)改。”
AI 检测再“升级”,不仅判 AI 率还能判论文质量(zhìliàng)?
论文“AI味”渐浓,是全球(quánqiú)高校共同面对的新难题。
第三方机构麦可思(màikěsī)在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将(jiāng)AI用于论文或作业写作。
2025年Open AI发布的报告(bàogào)显示,“美国三分之一以上(yǐshàng)的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和学校作业相关”,内容涵盖构思论文框架、寻找主题和拓展观点等(děng)。
2024年初,福州大学、中国(zhōngguó)传媒大学等高校陆续发布了毕业论文(设计)AIGC 检测(jiǎncè)的(de)通知。相比2024年,今年有更多高校将AIGC检测列入(lièrù)了毕业论文评价体系。西南大学、浙江科技大学、西南交通大学纷纷颁布关于2025届(jiè)本科毕业论文(设计)AIGC检测的通知。
部分去年已采纳AIGC检测的高校则在今年提出(tíchū)了更细致的规定。以福州大学为例(wèilì),去年的要求是“AIGC检测结果(jiéguǒ)将作为学生毕业设计(论文)成绩评定(píngdìng)和校级优秀本科生毕业设计(论文)评选参考依据”。到今年,校方指导文件明确指出“AIGC全文检测值应(yīng)≤20%”,并规定终稿环节“查重检测或AIGC检测第二次才(cái)通过的论文最终总评成绩只能记作及格”。
在检测(jiǎncè)AI率(lǜ)的基础上,一些(yīxiē)高校(gāoxiào)进一步采用了AI智评系统,用以评判论文质量。有别于拿AI率作为优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等(děng)高校采用AI智评系统对本科毕业论文进行评级,结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改)、D(高危论文)。
这些评级(jí)意味着什么?不同的(de)高校有着不同的标准,构成了难度(nándù)不一的毕业门槛。网友@可回收分享自己查重定稿后,论文却被智评系统评为C级,她的学校要求论文达到B级才能答辩。网友@一往无前和(hé)网友@lady luck则表示自己的学校要求C级即可达标。
根据校方指导(zhǐdǎo)文件,一些高校要(yào)求学生依据(yījù)AI评估的结果对论文进一步修改。比如,广东海洋大学要求盲审前,“AI智评结果为(wèi)C或D以及检测智能(zhìnéng)生成内容比例超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出的数值列入了检测标准,要求评估数值“原则上预估合格概率(gàilǜ)要高于 75%;低于 75%的,需做进一步优化和修改”。
又(yòu)贵又不稳定,大学生被AIGC检测困扰
“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校(xuéxiào)免费的查询次数,论文会被计入(jìrù)系统成为定稿,应届生立君将论文在其他平台进行了检测,确保AI率稳定,“一般(yìbān)大家都会提前自费查好(cháhǎo),我们不敢把学校的检测次数当作试错”。
区别于论文查重(cházhòng)精确到重合的(de)语句标识,AIGC检测以片段为单位,这意味着修改范围扩大和不确定性增加。而面对被系统识别为“疑似AI生成”的专业术语和著作原文,不少大学生感到(gǎndào)困惑。
网友@小狐狸在人间种花(huā)分享了自己的(de)(de)毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面的情况下(xià),间隔两小时后的AI特征值从27.2%骤降为0.5%。对于花了两百块钱得到的这一波动检测结果,她感到无奈(wúnài):“现在花钱查的结果也不敢相信了,好怕学校查重不过”。
评论区里,大学生们倾诉着类似的(de)苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写的都会被判定AI,我(wǒ)的摘要写不好,最后是老师给我写的,也被判为中度AI了(le)”;网友@圆镜表示“我连引用(yǐnyòng)的北大核心参考文献都被说是AI”。
“AI率降低后,我的(de)论文却变味了”
目前高校采用的主流检测系统(xìtǒng)(xìtǒng)在2024到2025年间先后更新(gēngxīn)。维普于2025年2月(yuè)26日完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人查重服务系统于2025年2月13日进行了AIGC检测服务升级(shēngjí);格子达在2025年3月6日发布了AIGC检测3.0版本。
为了探究系统升级是否有效,澎湃新闻记者将去年《换个平台就相差 32%,AI 论文检测成(chéng)玄学》用于AIGC检测的(de)同一篇“完全由AI生成”的论文投入相同的高校(gāoxiào)常用检测系统进行了检测。从结果来看,部分网站识别(shíbié)“完全由AI生成文本(wénběn)”的能力有所上升,但不同网站的差异仍然明显。
“我用AI帮我翻译的(de)(de)英文摘要都被识别(shíbié)出来(chūlái)了”。因此,电子科学与技术专业(zhuānyè)的晨夕认为,检测系统对于(duìyú)AI生成内容的判断还是准确的。但对于AI检测带来论文逻辑性减弱的后果,他感到无奈。为让AI率更低,他不得不在论文中的许多实验步骤前都加上了“我们”,原本清晰的实验说明,变成了“我们通过……,并且我们通过……,从而我们就能得到”的赘余版本。
AI检测器的(de)误判概率大(dà)吗?一篇2024年教育技术领域的Q1级顶刊论文在检测了七款国外主流(zhǔliú)AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于人类写作的对照样本识别准确率为67%。这意味着(yìwèizhe)人类有33%的概率被误判为AI,而AI却有高于(gāoyú)60%的概率可以蒙混过关。
在新版本发布的公告中,格子达将其中一条区分人(rén)与(yǔ)AI创作的标准描述为:人类写作存在合理的不确定性,AI生成的文本过于“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把论文(lùnwén)改“笨(bèn)”。
网友@江枫渔火对愁眠 分享了为AI率(lǜ)折腰的(de)经历,她抱着把论文修改到最好的心态,却不(bù)得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿了,但是我对自己(zìjǐ)的论文不满意了,自己把自己的论文改烂真的很难受”。
网络上也(yě)有不少经验帖(tiē)分享用AI打败AI的方法,但(dàn)更改后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众(dàzhòng)印象渐行渐远。
采纳AI检测器(jiǎncèqì),国外高校态度审慎
除了类似“AI 检测率”这样的硬指标划定(huàdìng),国内一些高校也在探索(tànsuǒ)其他规范使用 AI 的方式,比如中国传媒大学(chuánméidàxué)继续教育学部设计了《本科毕业论文(lùnwén)(设计)生成式人工智能使用情况说明表》,由学生自主披露论文中的 AI 使用情况。
而使用了AI智评系统的广东海洋大学也在指导文件里公布了允许使用AI工具的范围(fànwéi),如“可用于(yòngyú)文献检索、关键词推荐和文献管理(guǎnlǐ),但需确保引用文献的真实性与可靠性。可用于推荐统计图表类型和辅助制图,但不得用于生成或修改原始(yuánshǐ)研究数据及关键研究图表”。
关于(guānyú)AI检测器,美国前20所顶尖高校普遍持“不建议使用”态度(tàidù),考虑的主要因素为现有检测技术不成熟、系统(xìtǒng)无法提供证据、误判和漏判现象频出。
Open AI公司在官网“教育者常见问题解答”中称:“我们对检测器的(de)研究(yánjiū)表明它们并(bìng)不可靠,因为教育工作者可能会对学生作出(zuòchū)判断,并造成长期影响”。在训练过程中,其(qí)研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类撰写的内容标记为 AI 生成。
国内(guónèi)主流AIGC检测平台目前并未披露具体的(de)训练集;对于相关(xiāngguān)的大模型原理,公开表述也比较模糊。以维普为例,其在官网(guānwǎng)对于判断标准的描述是“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据(shùjù)进行特征反向演算,掌握AIGC模型文本生成的规律”。
根据同方知网数字出版技术股份有限公司2025年1月24日公布(gōngbù)的专利《AI生成学术文本(wénběn)(wénběn)的判断方法、装置(zhuāngzhì)及相关产品(chǎnpǐn)》,其检测系统判定原理如下:首先“利用大模型对‘待判断’学术文本进行改写 ”,再通过对比改写前后的文本,判断该学术文本是否由AI生成。
AI检测(jiǎncè)技术落后于AI生成技术的现状,导致规避检测变得相对(xiāngduì)容易。上文提及的检测了七款国外主流AI检测器的2024年顶刊论文还提到,即便是相对简单的内容操控(例如添加拼写错误、增加文本波动性)也能非常有效地规避检测;“具备技术敏感度、资源且有意愿(yìyuàn)的个体”则能更轻易将(jiāng)AI生成内容伪装成人类所写。这就意味着,滥用AI技术的学生并不(bù)担忧检测器的考验,而手写(shǒuxiě)论文的学生却可能因(yīn)误判而受煎熬。
2024年12月,发表在中文核心期刊上的(de)一篇论文《大语言模型技术背景下重塑研究生论文评价与指导》指出,高校(gāoxiào)采用“AIGC值”标准(biāozhǔn)要求学生,可能容易导致师生之间(zhījiān)陷入“猫(māo)捉老鼠”困境——“检测软件不断更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入无意义的表达变换的文字游戏中”,或许才是AIGC检测最大的隐患(yǐnhuàn)。
文中一帆(yīfān)、立君、晨夕均为化名
澎湃新闻特约(tèyuē)作者 何洛伊 记者 卫瑶 舒怡尔
(本文来自澎湃(pēngpài)新闻,更多原创资讯请下载“澎湃新闻”APP)
临近毕业(bìyè),为了论文(lùnwén)达到AI率标准,有一批大学生不得不狠狠修改论文。
对于一些(yīxiē)高校的应届毕业(bìyè)生而言,除了传统的查重、盲审、答辩,毕业路上又多了一道关卡——AIGC检测。
收到学校对毕业论文进行AIGC检测的通知,大四学生一帆对“用(yòng)AI查AI”的方式感到不放心。而(ér)检测结果让他惊讶(jīngyà):“虽然我自己写的几个段落被误判为99%AI,但没想到(méixiǎngdào)我用AI润色的部分也被查出来了”。
利用系统(xìtǒng)改写后(hòu),他产生了好奇:“降AI也是AI写的,为什么就查不出来(chūlái)?”查看修改内容后,他发现“系统降AI方法就是删掉逻辑词、把很多话的表述变成口水话”。
对于AI率降低后的论文,他认为“论文质量反而下降了,但(dàn)为了合格,只能这样(zhèyàng)改。”
AI 检测再“升级”,不仅判 AI 率还能判论文质量(zhìliàng)?
论文“AI味”渐浓,是全球(quánqiú)高校共同面对的新难题。
第三方机构麦可思(màikěsī)在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将(jiāng)AI用于论文或作业写作。
2025年Open AI发布的报告(bàogào)显示,“美国三分之一以上(yǐshàng)的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和学校作业相关”,内容涵盖构思论文框架、寻找主题和拓展观点等(děng)。
2024年初,福州大学、中国(zhōngguó)传媒大学等高校陆续发布了毕业论文(设计)AIGC 检测(jiǎncè)的(de)通知。相比2024年,今年有更多高校将AIGC检测列入(lièrù)了毕业论文评价体系。西南大学、浙江科技大学、西南交通大学纷纷颁布关于2025届(jiè)本科毕业论文(设计)AIGC检测的通知。
部分去年已采纳AIGC检测的高校则在今年提出(tíchū)了更细致的规定。以福州大学为例(wèilì),去年的要求是“AIGC检测结果(jiéguǒ)将作为学生毕业设计(论文)成绩评定(píngdìng)和校级优秀本科生毕业设计(论文)评选参考依据”。到今年,校方指导文件明确指出“AIGC全文检测值应(yīng)≤20%”,并规定终稿环节“查重检测或AIGC检测第二次才(cái)通过的论文最终总评成绩只能记作及格”。
在检测(jiǎncè)AI率(lǜ)的基础上,一些(yīxiē)高校(gāoxiào)进一步采用了AI智评系统,用以评判论文质量。有别于拿AI率作为优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等(děng)高校采用AI智评系统对本科毕业论文进行评级,结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改)、D(高危论文)。
这些评级(jí)意味着什么?不同的(de)高校有着不同的标准,构成了难度(nándù)不一的毕业门槛。网友@可回收分享自己查重定稿后,论文却被智评系统评为C级,她的学校要求论文达到B级才能答辩。网友@一往无前和(hé)网友@lady luck则表示自己的学校要求C级即可达标。
根据校方指导(zhǐdǎo)文件,一些高校要(yào)求学生依据(yījù)AI评估的结果对论文进一步修改。比如,广东海洋大学要求盲审前,“AI智评结果为(wèi)C或D以及检测智能(zhìnéng)生成内容比例超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出的数值列入了检测标准,要求评估数值“原则上预估合格概率(gàilǜ)要高于 75%;低于 75%的,需做进一步优化和修改”。
又(yòu)贵又不稳定,大学生被AIGC检测困扰
“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校(xuéxiào)免费的查询次数,论文会被计入(jìrù)系统成为定稿,应届生立君将论文在其他平台进行了检测,确保AI率稳定,“一般(yìbān)大家都会提前自费查好(cháhǎo),我们不敢把学校的检测次数当作试错”。
区别于论文查重(cházhòng)精确到重合的(de)语句标识,AIGC检测以片段为单位,这意味着修改范围扩大和不确定性增加。而面对被系统识别为“疑似AI生成”的专业术语和著作原文,不少大学生感到(gǎndào)困惑。
网友@小狐狸在人间种花(huā)分享了自己的(de)(de)毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面的情况下(xià),间隔两小时后的AI特征值从27.2%骤降为0.5%。对于花了两百块钱得到的这一波动检测结果,她感到无奈(wúnài):“现在花钱查的结果也不敢相信了,好怕学校查重不过”。
评论区里,大学生们倾诉着类似的(de)苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写的都会被判定AI,我(wǒ)的摘要写不好,最后是老师给我写的,也被判为中度AI了(le)”;网友@圆镜表示“我连引用(yǐnyòng)的北大核心参考文献都被说是AI”。
“AI率降低后,我的(de)论文却变味了”
目前高校采用的主流检测系统(xìtǒng)(xìtǒng)在2024到2025年间先后更新(gēngxīn)。维普于2025年2月(yuè)26日完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人查重服务系统于2025年2月13日进行了AIGC检测服务升级(shēngjí);格子达在2025年3月6日发布了AIGC检测3.0版本。
为了探究系统升级是否有效,澎湃新闻记者将去年《换个平台就相差 32%,AI 论文检测成(chéng)玄学》用于AIGC检测的(de)同一篇“完全由AI生成”的论文投入相同的高校(gāoxiào)常用检测系统进行了检测。从结果来看,部分网站识别(shíbié)“完全由AI生成文本(wénběn)”的能力有所上升,但不同网站的差异仍然明显。
“我用AI帮我翻译的(de)(de)英文摘要都被识别(shíbié)出来(chūlái)了”。因此,电子科学与技术专业(zhuānyè)的晨夕认为,检测系统对于(duìyú)AI生成内容的判断还是准确的。但对于AI检测带来论文逻辑性减弱的后果,他感到无奈。为让AI率更低,他不得不在论文中的许多实验步骤前都加上了“我们”,原本清晰的实验说明,变成了“我们通过……,并且我们通过……,从而我们就能得到”的赘余版本。
AI检测器的(de)误判概率大(dà)吗?一篇2024年教育技术领域的Q1级顶刊论文在检测了七款国外主流(zhǔliú)AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于人类写作的对照样本识别准确率为67%。这意味着(yìwèizhe)人类有33%的概率被误判为AI,而AI却有高于(gāoyú)60%的概率可以蒙混过关。
在新版本发布的公告中,格子达将其中一条区分人(rén)与(yǔ)AI创作的标准描述为:人类写作存在合理的不确定性,AI生成的文本过于“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把论文(lùnwén)改“笨(bèn)”。
网友@江枫渔火对愁眠 分享了为AI率(lǜ)折腰的(de)经历,她抱着把论文修改到最好的心态,却不(bù)得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿了,但是我对自己(zìjǐ)的论文不满意了,自己把自己的论文改烂真的很难受”。
网络上也(yě)有不少经验帖(tiē)分享用AI打败AI的方法,但(dàn)更改后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众(dàzhòng)印象渐行渐远。
采纳AI检测器(jiǎncèqì),国外高校态度审慎
除了类似“AI 检测率”这样的硬指标划定(huàdìng),国内一些高校也在探索(tànsuǒ)其他规范使用 AI 的方式,比如中国传媒大学(chuánméidàxué)继续教育学部设计了《本科毕业论文(lùnwén)(设计)生成式人工智能使用情况说明表》,由学生自主披露论文中的 AI 使用情况。
而使用了AI智评系统的广东海洋大学也在指导文件里公布了允许使用AI工具的范围(fànwéi),如“可用于(yòngyú)文献检索、关键词推荐和文献管理(guǎnlǐ),但需确保引用文献的真实性与可靠性。可用于推荐统计图表类型和辅助制图,但不得用于生成或修改原始(yuánshǐ)研究数据及关键研究图表”。
关于(guānyú)AI检测器,美国前20所顶尖高校普遍持“不建议使用”态度(tàidù),考虑的主要因素为现有检测技术不成熟、系统(xìtǒng)无法提供证据、误判和漏判现象频出。
Open AI公司在官网“教育者常见问题解答”中称:“我们对检测器的(de)研究(yánjiū)表明它们并(bìng)不可靠,因为教育工作者可能会对学生作出(zuòchū)判断,并造成长期影响”。在训练过程中,其(qí)研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类撰写的内容标记为 AI 生成。
国内(guónèi)主流AIGC检测平台目前并未披露具体的(de)训练集;对于相关(xiāngguān)的大模型原理,公开表述也比较模糊。以维普为例,其在官网(guānwǎng)对于判断标准的描述是“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据(shùjù)进行特征反向演算,掌握AIGC模型文本生成的规律”。
根据同方知网数字出版技术股份有限公司2025年1月24日公布(gōngbù)的专利《AI生成学术文本(wénběn)(wénběn)的判断方法、装置(zhuāngzhì)及相关产品(chǎnpǐn)》,其检测系统判定原理如下:首先“利用大模型对‘待判断’学术文本进行改写 ”,再通过对比改写前后的文本,判断该学术文本是否由AI生成。
AI检测(jiǎncè)技术落后于AI生成技术的现状,导致规避检测变得相对(xiāngduì)容易。上文提及的检测了七款国外主流AI检测器的2024年顶刊论文还提到,即便是相对简单的内容操控(例如添加拼写错误、增加文本波动性)也能非常有效地规避检测;“具备技术敏感度、资源且有意愿(yìyuàn)的个体”则能更轻易将(jiāng)AI生成内容伪装成人类所写。这就意味着,滥用AI技术的学生并不(bù)担忧检测器的考验,而手写(shǒuxiě)论文的学生却可能因(yīn)误判而受煎熬。
2024年12月,发表在中文核心期刊上的(de)一篇论文《大语言模型技术背景下重塑研究生论文评价与指导》指出,高校(gāoxiào)采用“AIGC值”标准(biāozhǔn)要求学生,可能容易导致师生之间(zhījiān)陷入“猫(māo)捉老鼠”困境——“检测软件不断更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入无意义的表达变换的文字游戏中”,或许才是AIGC检测最大的隐患(yǐnhuàn)。
文中一帆(yīfān)、立君、晨夕均为化名
澎湃新闻特约(tèyuē)作者 何洛伊 记者 卫瑶 舒怡尔
(本文来自澎湃(pēngpài)新闻,更多原创资讯请下载“澎湃新闻”APP)





相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎