您现在的位置是：短视频 >>正文

思维链被推翻！纽约大学新研究：大模型推理步骤或可省略

短视频88947人已围观

简介CSS站长资源ChinaZ.com）5月15日消息:纽约大学的最新研究对当前流行的思维链Chain-of-Thought，CoT）技术提出了挑战，该技术原本被认为能够提升大模型的推理能力。研究显示， ...

CSS站长资源（ChinaZ.com）5月15日消息:纽约大学的思维省略最新研究对当前流行的思维链（Chain-of-Thought，CoT）技术提出了挑战，链被该技术原本被认为能够提升大模型的推翻推理推理能力。研究显示，纽约使用省略号代替具体的大学推理步骤，模型的新研推理结果并没有显著差异，这意味着增加计算量而非推理步骤本身可能是模型提升性能的关键。

论文地址:https://arxiv.org/pdf/2404.15758

研究要点

省略号代替推理步骤:研究发现，步骤将思维链推理中的思维省略具体步骤替换为省略号（...），模型的链被推理结果与完整步骤的推理结果相差无几。
性能提升来源:实验结果表明，推翻推理所谓的纽约性能提升可能只是因为大模型获得了更多的计算资源（token数量），而非真正的大学推理步骤。
隐藏推理:该发现还引发了关于模型可能在不可见的新研情况下进行隐藏推理的讨论，这在一定程度上脱离了人类的模型控制。

实验设计

3SUM问题:设计了一个难度较高的3SUM问题，要求模型在序列中挑选满足条件的3个数，实验中使用了填充token的方法，并与CoT解决方案进行对比。

2SUM-Transform任务:第二个任务是2SUM-Transform，通过将输入数字进行随机偏移，防止模型直接计算，实验结果显示填充token的方法精度接近CoT。

研究结论

填充token的有效性:研究表明，使用重复的省略号作为填充token可以达到与CoT相似的效果。

局限性:尽管填充token方法有效，但它并没有突破Transformer的计算复杂度上限，且需要特定的训练过程。

这项研究为AI领域带来了新的视角，提示我们在设计和使用大型语言模型时，需要更深入地理解其工作原理和性能提升的真正来源。同时，也引发了关于AI安全性和未来发展的进一步思考。

Tags：

上一篇：为什么高铁座椅没有E号上热搜网友：抓去当视力表了

下一篇：OpenAI预警系统探索 GPT-4 在制造生物武器方面的优势

AI视野：文心一言支持生成数字分身；Bard推出图片生成功能；亚马逊开发AI购物助手Rufus；苹果将推生成式AI功能
短视频
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.ai ...

2024-07-06 18:35【短视频】
阅读更多
5亿个token之后，我们得出关于GPT的七条宝贵经验
短视频
ChatGPT 正确的使用姿势。自 ChatGPT 问世以来，OpenAI 一直被认为是全球生成式大模型的领导者。2023年3月，OpenAI 官方宣布，开发者可以通过 API 将 ChatGPT 和 ...

2024-07-06 17:04【短视频】
阅读更多
开源大模型Llama 3归来！底牌4000亿参数，性能直逼GPT-4
短视频
扎克伯格:「有了 Llama3，全世界就能拥有最智能的 AI。」ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开 ...

2024-07-06 16:43【短视频】
阅读更多

您现在的位置是：短视频 >>正文

思维链被推翻！纽约大学新研究：大模型推理步骤或可省略

相关文章

AI视野：文心一言支持生成数字分身；Bard推出图片生成功能；亚马逊开发AI购物助手Rufus；苹果将推生成式AI功能

5亿个token之后，我们得出关于GPT的七条宝贵经验

开源大模型Llama 3归来！底牌4000亿参数，性能直逼GPT-4

热门文章

最新文章

友情链接