site logo: www.epochtimes.com

AI检测工具欠准 在澳中国留学生担心被冤枉

澳洲的大学正在使用写作检测软件检查学生的论文作业是否有作弊行为,由于这些检测工具并不完善准确,母语非英语的留学生担心他们可能会被冤枉。(Shutterstock)
【字号】    
   标签: tags: , , ,

【大纪元2023年06月02日讯】(大纪元记者陈光澳洲悉尼编译报导)澳洲的大学正在使用写作检测软件检查学生的论文作业是否有作弊行为,包括中国留学生在内的母语非英语的留学生担心,由于这些检测工具并不完善准确,他们可能会被冤枉。

澳洲广播公司报导,在采访中要求使用化名的李佳(Jia Li)是新南威尔士大学(UNSW)的一名中国留学生。最近她用了检测人工智能(AI)生成内容的ZeroGPT计算机应用程序来检查她大学论文的草稿,结果该程序得出的结论是,她的论文可能有一半以上是AI撰写的。

“这是我自己写的,但(检测程序)说它是AI生成的,”她说。

该程序标记出了李佳先用中文写出,然后用电脑翻译成英文的内容,以及她自己用英文写的其它句子。

李佳之所以使用检测工具,是因为新南威尔士大学已开始使用类似的工具Turnitin 来检查学生是否有使用AI文本生成工具撰写作业和论文的作弊行为。

随着诸如ChatGPT等能够生成大学论文和作业的AI应用程序的迅速出现,已有一些学生使用AI生成的内容来冒充自己的作业,这让大学纷纷做出回应,使用相应的检测工具来评估学生的作业是否存在不当行为。

但AI专家表示,相关的检测技术可能并不准确,一些人认为相关的检测工具不应该用来对学生进行评估。

美国斯坦福大学的一项研究发现,检测AI生成的文本的程序可能会对“非英语母语写作者”产生偏见。

研究人员将91篇中国学生用英语撰写的论文和88篇美国学生用英语撰写的论文通过七个不同的公开可用的检测工具进行了试验。

结果,这些工具发现61%的中国学生的论文是AI生成的,但对美国学生论文的评价是“近乎完美的准确”。

报告的共同写作者詹姆斯·邹(James Zou)表示,目前许多人工智能检测算法都过度依赖“困惑度”指标,这是一种衡量文本中使用复杂词语的指标。

“如果有很多复杂的词,那么它们就会有很高的困惑度,”他说。

他表示,英语非母语人士的写作经常被错误地归类为AI生成的,因为他们没有使用那么多“花哨”的词语。而且许多英语非母语的人士还使用翻译和语法工具,这些程序的算法降低了写作的复杂性,因此检测工具会更频繁地将这些文本标记为是AI生成的。

斯坦福大学的这项研究并没有包括澳洲新南威尔士大学和墨尔本大学所使用的 Turnitin 的书写检测工具。

Turnitin今年4月推出了新型AI书写检测工具,并声称该工具非常准确。

墨尔本大学的一位发言人表示,Turnitin的新检测工具的使用,只是促使要对学生提交的作业做进一步调查,学生提交的所有作业“必须是他们自己的东西”。

该大学的网站称,Turnitin的检测工具可能会错误地将一些作业识别为是由AI生成的,“如果你被要求讨论或解释你的论文内容,请理解,这并不是对学生有学术不端行为的指控”。

新南威尔士大学的发言人也表示,“最初的检测并不是作弊的确切证据,也不会自动导致学生有学术不端行为的结论。它是触发进一步调查的标志。”

Turnitin亚太地区副总裁索利(James Thorley)表示,该公司正在努力将错误率保持在尽可能低的水平。他说该公司从澳洲学术界收到的大部分反馈都是积极的。

《人工智能与学习未来》一书的作者波佩尼奇(Stefan Popenici )表示,AI检测工具最棘手的问题之一是大学“从一开始就将学生视为潜在的罪犯”。

他说,大学应该谨慎使用这些工具来应对AI文本生成带来的挑战。

“我们试图为一个非常复杂的问题找到灵丹妙药,因为我们喜欢简单的解决方案,”他说。

“我们抱怨我们的学生走捷径,然后我们自己也在走捷径。

“我认为这是不公平的。”

责任编辑:岳明

了解更多澳洲即时要闻及生活资讯,请点击 dajiyuan.com.au

(本文未经许可不得转载或建立镜像网站)

 

评论