OpenAI 开发出 ChatGPT“反作弊利器”:拥有 99.9% 的极高准确率,但尚未发布。
编辑日期:2024年08月06日
学生们热衷于借助ChatGPT来完成作业,然而老师们却苦恼于无法有效阻止学生们利用ChatGPT进行作弊的行为。
人工智能能够根据一个提示,在几秒钟内免费生成整篇论文或研究文章。教师和教授们表示他们急需帮助以打击这种滥用行为。
根据《每日邮报》在2023年1月30日的报道,一名新南威尔士大学(UNSW)的学生因使用ChatGPT自动生成论文被发现,这是全澳大利亚首例被查获的利用人工智能技术作弊的案例。
新南威尔士大学的人工智能教授托比·沃尔什表示,各大学都在评估如何防止学生利用人工智能技术进行作弊。随后,新南威尔士州、昆士兰州和塔斯马尼亚州都对其校园网络进行了针对ChatGPT的封锁,以防止学生利用这项技术作弊。
但Walsh教授表示,禁止校园网络访问ChatGPT是没有意义的,因为学生可以通过代理服务器绕过这样的封锁。
若要完全杜绝学生的作弊行为,只能将他们置于无网络的环境中,仅提供一张纸和一支笔。
CDT 最近进行的一项调查显示,59% 的中学老师相信有学生使用了人工智能来辅助学习,这一比例相较于上一学年上升了 17 个百分点。
要想仅依赖老师和学校的监督来避开ChatGPT的诱惑是难以实现的。解铃还需系铃人——应当让开发AI的企业亲自介入解决捕捉“AI枪手”的问题。
据了解,OpenAI 已经研发出一款能够高精度识别由 ChatGPT 生成的文本的工具,但至今尚未发布。
ChatGPT 由人工智能系统支持,其生成原理是根据输入的内容来预测句子中接下来可能出现的词汇或令牌。
OpenAI正在讨论的反作弊工具将略微改变令牌的选择方式,这些改变会留下一种被称为水印的痕迹。
这些水印人眼无法辨识,但能通过OpenAI的检测技术被发现。该检测器会给出一个分数,表示整份文档或其部分由ChatGPT编写的可能性。
根据内部文件,当ChatGPT生成足够多的新文本时,水印的有效率可以达到99.9%。
尽管准确率非常高,OpenAI的工作人员仍担心可以通过简单的方法轻松地去掉水印,从而容易地让系统出错。
例如,可以让 Google 将文本翻译成另一种语言后再翻译回原语言,或者让 ChatGPT 在文本中加入表情符号,然后再手动删除它们。
另一方面,公司内部普遍认为,谁可以使用这个探测器也将是一个棘手的问题。
如果拥有这个工具的人太少,那么这个工具就基本没用。如果有太多人获得访问权限,那么有些人可能会试图破解水印技术。
OpenAI 的员工也讨论过,可以通过向教育工作者或外部公司提供检测器,来帮助学校辨识出由人工智能编写的论文及抄袭作品。
谷歌实际上也开发了一种名为 SynthID 的水印工具,可以检测由 Gemini AI 生成的文本。该工具目前处于 Beta 测试阶段,尚未得到广泛应用。
OpenAI 拥有一个工具,可以判断图像是否由去年春季发布的测试版文本转图像生成器 DALL-E 3 创建。
该知情员工表示,该公司优先考虑音频和视频水印而非文本水印,是因为前者造成的影响更为严重,特别是在美国这个选举繁忙的年份里。
早在2023年1月,OpenAI就已发布了一种算法,该算法旨在检测包括其自身模型在内的多个AI模型所编写的文本。
但其成功率为仅26%,七个月后OpenAI就将其撤回。
其他公司和研究者也开发出了用于检测由人工智能生成的文本的工具,许多教师表示他们已经使用了这些工具。
但它们有时无法识别出由高级大型语言模型编写的文章,并且准确度较低,可能会产生错误的警报。
最近在乔治亚州一所私立高中任教的教育工作者及人工智能顾问迈克·肯茨(Mike Kentz)表示,一开始,学生们确实感到震撼,以为老师们已经完全掌握了一种方法,能够辨明他们是否使用了人工智能来代写。
但到了年底...... 他们渐渐发现,等等,我的老师似乎并不知道这件事。
一些教师鼓励学生利用人工智能来辅助研究或提供意见和反馈。然而,问题在于,当学生使用如ChatGPT这样的应用来完成全部任务时,他们甚至不会去核实提交的内容是什么。
去年,犹他大学的政治学教授乔什·麦凯恩给学生们布置了一项写作任务。在这项作业的要求中,他插入了一些极小且难以辨认的文字,里面提到了与作业内容无关的蝙蝠侠。
如果他们将作业复制并粘贴到人工智能中,作业的提示内容会被合并,这时「蝙蝠侠」就会干扰作业的内容。
果然,有少数学生提交了作业——一篇关于蝙蝠侠的论文。
麦科瑞教授正在调整写作作业,更多地关注人工智能不太熟悉的时代议题,并恳求学生们不要将自己的工作外包给人工智能。
“这就是我试图向学生们强调的一点:你需要自己学习这些内容。” 麦克雷恩教授说道。
据知情人士透露,在OpenAI于2022年11月推出ChatGPT之前,关于水印工具的讨论就已经开始了。
它是由计算机科学教授 Scott Aaronson 开发的。在过去两年里,他在得克萨斯大学休假期间一直在OpenAI从事安全工作。
2023年初,OpenAI的联合创始人之一John Schulman在一份共享的Google文档中概述了该工具的优点和缺点。
随后,OpenAI的高管们决定,在采取进一步行动之前,他们会征求一系列人士的意见。
在接下来的一年半时间里,OpenAI 的高管们反复进行了讨论,并寻求新的数据集来优化算法,对于是否发布这项技术犹豫不决。
内部文件显示,2023年4月,OpenAI 委托的一项调查显示,全球范围内的人们以四比一的比例支持使用人工智能检测工具的想法。
同月,OpenAI 对 ChatGPT 用户进行了一项调查,发现有 69% 的用户认为作弊检测技术可能会导致对使用 AI 技术的错误指控。
接近30%的人表示,如果ChatGPT部署了水印功能而其竞争对手没有的话,他们会减少使用。
此外,OpenAI 内部有一种反对意见认为反作弊工具可能会损害 ChatGPT 的写作质量。
据知情人士称,OpenAI 在今年早些时候进行的一项测试中发现,文本水印并不会降低输出的质量。
6月初,OpenAI的高级员工和研究人员再次聚集讨论该项目。大家一致认为水印技术表现良好,但去年的ChatGPT用户调查结果依旧是一个令人头疼的问题。
内部文件显示,OpenAI 需要在今年秋季前制定一项计划,该计划旨在通过围绕人工智能透明度以及可能的新法规来引导公众舆论。
「如果无法实现这一目标,我们可能会失去作为负责任企业的信誉。」
参考资料:
本文转载自微信公众号:微信公众号(ID:null),作者为新智元,原标题为《OpenAI 开发 ChatGPT “反作弊神器”,命中率高达 99.9%!但尚未发布》。