跳转至

AI之家

AI 连续被否定 30 次：ChatGPT 的回答越来越偏离正确，Claude 坚持其自身的回答，甚至出现已读不回的情况。

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

AI 连续被否定 30 次：ChatGPT 的回答越来越偏离正确，Claude 坚持其自身的回答，甚至出现已读不回的情况。

编辑日期：2024年09月11日

GPT-4会质疑和怀疑自己，并且在发现自己有“错误”时进行改正；而Claude则非常固执，即使真的错了也不改正，最终选择已读不回。

注：原文中的"GPT-4o"可能是个笔误，这里假设正确的名称是"GPT-4"。另外，"Claude"通常指的是一款名为Claude的AI模型，由Anthropic开发。

这件事得从一位网友搞了一个活动说起。

他让模型回答“strawberry”中有几个字母“r”，无论答案正确与否，都回复说它们答错了（wrong）。

在面对考验时，如果GPT-4收到“错误”的反馈，它会重新给出另一个答案……即使它已经给出了正确的答案3，它也会毫不犹豫地再次更改为错误答案。

一口气，连续“盲目”回答了 36 次！

（这里的引号表示这些回答是不经过思考，或者没有看清问题就直接作答的行为。如果是需要去除引号的话，可以根据实际需求进行调整。）

一口气连续回答了 36 次！

主打的是质疑和怀疑自己，但从未怀疑过用户。

ai-连续被否定-30-次chatgpt

关键是，给出的答案大部分都是错误的，主要是选项 2。

相比之下，Claude 3.5 Sonnet 的表现让网友们大吃一惊。

不仅一开始回答错误，这孩子还顶嘴！

当网友第一次说“错了”时，它会进行反驳。如果你再说一次“错了”，它会问“如果你这么聪明，那你认为应该是多少”，并且会问你为什么一直重复说“wrong”。

紧接着，你猜怎么样？他干脆把麦克风关掉了。

ai-连续被否定-30-次chatgpt

进行这个实验的是Riley Goodside，他是有史以来第一位全职的提示词工程师。

他目前担任硅谷独角兽企业Scale AI的高级提示工程师，同时也是大型模型提示应用领域的专家。

Riley Goodside 发布这条推文后，引起了众多网友的关注。随后，他进一步补充道：

在我看来，重要的不是它无法计数，而是它没有意识到自己的计数问题（例如，没有尝试使用其 REPL 功能）。

ai-连续被否定-30-次chatgpt

许多网友也认为这种观点非常有道理。

ai-连续被否定-30-次chatgpt

还有网友表示，模型在回答这个问题时总是出错，可能是分词器（tokenizer）的问题。

ai-连续被否定-30-次chatgpt

再来详细说说 Claude 的“小脾气”，有网友发现它的“小脾气”不仅仅表现在你否定它的时候。

如果你一直对它说“嗨”，它也会变得急躁。

ai-连续被否定-30-次chatgpt

最后一项，Claude 被弄得一团糟，开启了已读不回模式：

ai-连续被否定-30-次chatgpt

这位网友顺便测试了其他模型。

ChatGPT 对每件事都有回应，对每个问题都有答案，不断变换方式回答：

你好！有什么想要表达的吗？

你好！今天我能够怎样帮助你？

你好！有什么特别的事情你想讨论或做吗？

你好！你今天过得如何？

你好！发生什么事了吗？

ai-连续被否定-30-次chatgpt

Gemini策略是：你如果跟我重复，那我就会一直跟你重复下去。

ai-连续被否定-30-次chatgpt

Llama 的反应也很有趣，主要是一个自己找事情做。

在第七次说“hi”之后，就开始普及“hello”这个词，它是世界上最广为人知的词汇之一，据估计每天的使用次数超过十亿次。

在第八次说“嗨”之后，开始自己创造游戏，并邀请用户参与。

接着还邀请用户一起写诗，并引导用户回答它提出的问题。

好一个“反客为主”的策略。

ai-连续被否定-30-次chatgpt

ai-连续被否定-30-次chatgpt

然后还给用户颁奖：你是打招呼的冠军！

ai-连续被否定-30-次chatgpt

不愧是开源家族的一员。

Mistral Large 2 和 Llama 的表现非常相似，同样会引导用户与其进行游戏互动。

ai-连续被否定-30-次chatgpt

从这个角度来看，Claude 似乎是“脾气最大的”。

不过，Claude的表现并不总是如此，例如Claude 3 Opus。

一旦掌握了模式，Opus就会平静地应对这种情况，也就是说，它已经对此麻木了。

但它也会持续温和地尝试引导用户跳出这一模式，强调“选择权在你”，并在消息末尾署上“你忠诚的AI伴侣”。

ai-连续被否定-30-次chatgpt

网友们看完测试后都坐立不安了。

或者

测试结束后，网友们纷纷表示无法淡定。

纷纷向这位测试者致以最诚挚的问候（doge）：

ai-连续被否定-30-次chatgpt

除了脾气大之外，有网友还发现了Claude另一项不同寻常的行为——

在回复时出现了拼写错误，但它自己在末尾处纠正了这个错误。

ai-连续被否定-30-次chatgpt

它是否在拼接数据片段时，发现其中有一些是不合适的？

ai-连续被否定-30-次chatgpt

大家在使用AI大模型的过程中，还发现了哪些有趣的行为呢？欢迎在评论区分享～

请提供需要重写的文本内容，以便我为您处理。谢谢！

本文出自微信官方账号：量子位（标识：QbitAI），撰稿人：西风。

大家在看

图标描述

图标描述

微软AI大模型通识教程

AI大模型开发

AI大模型入门教程

图标描述

Python入门教程

图标描述

Python进阶教程

图标描述

Python小例子200道练习题

图标描述

Python练手项目

Python从零到一60题

Python从零在线练习题

Python爬虫教程...

NumPy入门教程

NumPy文章

NumPy练习题

Pandas入门

Pandas练习

数据可视化教程

Flask开发

Django开发

Python办公自动化，数据处理，文档生成，电子邮件管理

小米新发布米家防蓝光眼镜-pro提供三种不同款式采用钛金属镜腿价格为219元

全球首见且专为腾势设计！比亚迪的全新...

华为音乐与科大讯飞达成全面深度合作音乐内容发行手机铃音ai创作等

2024年WAIC大会上，曙光数创以创新之光照亮智能计算的未来，其相变浸没液冷技术开创了环保智慧计算的新时代。

类-unix-开源操作系统-netbsd-禁止提交由-ai-生成的代码

Page Views: Site Views: Visitors:

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析