用ChatGPT作坏处，老师能发掘吗？

wrjc1hod · 发表于 2024-8-22 15:50:51

源自：《中国科学报》 (2024-06-28 第2版国际)

一项6月26日发布于《公共科学图书馆-综合》的科研发掘，在运用ChatGPT生成答案的大学考试答卷中，有94%不会被检测出是由于人工智能（AI）生成的，况且这些答案常常比学生真实的答案得分更高。

如今，AI技术的兴起和发展，给教育分部出了一道难题，即学校许多形式的评定，都是在无监考的状况下完成的，而学生很可能利用AI答题。尤其在新冠疫情后，对无监督的居家考试的依赖越发严重。

现场考试使学生很难运用AI作坏处。照片源自：Trish Gant / Alamy

为此，英国雷丁大学的Peter Scarfe和同事运用ChatGPT生成为了雷丁大学心理学本科生学位考试5个模块共63个评定问题的答案。因为学生们是在家里参加这些考试的，因此她们能够查看笔记和参考资料，乃至可能违反规定，运用AI帮忙答题。

AI生成的答案和学生真实的答案一块被提交，其中前者平均占答卷总数的5%。阅卷人并不晓得她们检测的答卷中有33份来自假学生，而这些假学生的名字亦是由于ChatGPT生成的。

在所有模块问题的答案中，仅有6%的AI生成答案被标记为可能不是学生自己的答案。而有有些非AI生成的模块问题的答案则被标记为存疑。

“尽管各模块之间存在有些差异，但平均而言，AI生成的答案得分高于学生提交的答案。在AI提交的对63个问题的答案中，得分超过学生的概率为83.4%。”Scarfe说，“但AI当前还难以进行更抽象的推理和信息集成。”

科研人员暗示，她们的工作是迄今同类科研中规模最大、最靠谱的。尽管只科研了雷丁大学心理学本科学位的工作，但Scarfe认为这是值得全部学术界关注的问题。

“无理由认为其他学科行业不会有一样的问题存在。”Scarfe说，然而从源头上处理这一问题几乎是不可能的。因此呢，必须重新思虑评定内容。

关联论文信息：

责任编辑：网友投稿

m5k1umn · 发表于 2024-10-1 01:35:11

顶楼主，说得太好了！

m5k1umn · 发表于昨天 23:55

交流如星光璀璨，点亮思想夜空。

		自动登录	找回密码
密码			立即注册