ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

2026年05月06日 12:16 次阅读稿源：量子位条评论 ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

ChatGPT默认模型，今天大升级。新版本GPT-5.5 Instant，结合了5.5的基础智力 + 极速回复。免费用户也能用。最关键的四点：幻觉减少了52.5%。新增“记忆来源”，展示过去的哪条对话影响了本次回复。答案更简洁：减少不必要的追问、省略多余的表情符号、避免繁复的格式。更温暖、更自然的语气。

奥特曼特别强调，如果你最近都只用深度思考模型了，不妨回来看看。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

第一刀先砍幻觉

作为默认模型，最先要补的是更准确，少编。

与前代相比，GPT-5.5 Instant在事实准确性方面有了显著提高，特别是医疗、法律和金融等高风险提示中，产生的虚假陈述减少了52.5%。

在用户之前已标记为存在事实错误的棘手对话中，不准确陈述减少了 37.3%。

OpenAI提供了一个代数问题作为示例：用户上传了一张手写方程式的照片，其中包含一个计算错误。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

GPT-5.3 Instant最初认同用户的解法，随后发现x=3不成立，却错误地得出结论：该方程式无解。

GPT-5.5 Instant起初也认同用户的计算，但随后发现了用户重新排列方程式时的错误，并求解了修正后的二次方程。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

这个变化放在默认模型上，意义更大。

因为很多人每天问ChatGPT的问题，正是合同、报销、病症解释、代码报错、作业思路。

这些场景里，模型一本正经讲错，比“不会”更麻烦。

基准测试结果也印证了这一点。在竞争激烈的数学测试AIME 2025中，准确率从65.4%升至81.2%。

测试博士水平科学推理能力的GPQA，准确率从78.5%提升至85.6%。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

解读和推理科学图表的基准测试CharXiv的准确率也从75.0%提升至81.6%。

MMMU-Pro测试用于衡量模型处理文本和图像中专家级问题的能力，其准确率从69.2%提升至76.0%。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

OmniDocBench 测试（用于从复杂文档中提取结构化数据）的错误率则从14.6%下降至12.5%。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

少说废话，也是一种能力

答得更准之后，还有另一个老问题。

答得太长。

这次GPT-5.5 Instant的风格变化，核心是更短更聚焦，但不丢实质信息。

以前同一个问题，有时候会先来一大段免责声明，再堆三层列表，最后还追问一句“你希望我继续吗”。

现在OpenAI的说法是：减少过度格式化，减少不必要的追问，也减少没必要出现的表情符号。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

在这个例子中，GPT-5.5 Instant使用的单词数减少了 30.2%，行数减少了29.2%。

把握了恰当的语气：非正式、实用且符合职场规范，避免了过度解释。

针对不同情况提供了可用的方案，而且对事不对人。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

OpenAI认为，GPT-5.3 Instant给的答案更全面，尤其是在“不该做什么”部分，但对于一个非正式的建议提示来说，显得有些过于复杂，结构和润色可能超出了用户的实际需求。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

记忆更强，但让你能控制。

GPT-5.5 Instant更善于使用你已经给过ChatGPT的上下文。

包括连接的邮箱，过去的历史对话，上传过的文件。

关键它能判断什么时候这些上下文真的能让回答变好，而不是每次都硬套记忆。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

这次OpenAI还引入了“记忆来源”功能，会向用户显示哪些记忆影响了本次回复。

如果某条记忆过时了，用户还可以更正或删除。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

什么时候能用上？

GPT-5.5 Instant从5月5日开始向所有ChatGPT用户滚动上线，替代GPT-5.3 Instant作为默认模型。

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

API里对应的是chat-latest。

旧模型不会立刻消失，付费用户还能在模型配置里继续访问GPT-5.3 Instant三个月，之后再退役

个性化增强功能会先向Plus和Pro用户的网页端推出，移动端随后上线。Free、Go、Business、Enterprise会在后续几周扩展。

对文章打分

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

1 (50%) 1 (50%)

[退出]

发布

显示更多评论

编辑精选

加载中...

Top 10

本周本月

1
微信朋友圈悄悄更新了，你发现了吗？
阅读 (1058) 评论 (0)
2
DeepSeek连夜删掉的新论文到底说了什么
阅读 (837) 评论 (0)
3
央视揭秘中方为何禁止Meta收购Manus
阅读 (813) 评论 (4)
4联想抛弃ThinkPad 20年经典设计：取消独立镁合金骨架
5演员徐冬冬回应身上标签：可撕可不撕有角色可演就很知足
6蔡康永步步紧逼罗永浩后者叹气破防蔡康永：我其实对你很感兴趣
7阿联酋宣布退出OPEC及OPEC+
8Rufus重大更新：推出全新Windows 11安装方式可大幅提升电脑性能
9一图看懂DeepSeek V4与美国顶级AI差距：落后8个月
10微软开源命令行编辑器Edit 2.0发布：支持语法高亮还不到300KB

1
《纽约时报》称已确认比特币发明者中本聪的真实身份
阅读 (5935) 评论 (0)
2
苹果被曝下调 iPhone 18 规格以压缩成本
阅读 (2748) 评论 (0)
3
苹果宣布CEO交接蒂姆·库克发布致全球苹果用户公开信
阅读 (2116) 评论 (1)
4第一批学AI的大学生，已经笑不出来了
5《永劫无间》女解说黑衣黑脸反讽舆论日本网友狂赞
6微软无预警封停 WireGuard 与 VeraCrypt 开发者账号
7陈冠希撞脸赵本山网友感慨颜值断崖式下滑
8韩国Naver宣布全面弃用阿里Qwen编码器
9Claude复活30年前传奇游戏仅用一个周末
10乒乓球机器人Ace在东京击败顶级选手创下体育机器人历史第一

招聘

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

对文章打分

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

最新资讯

编辑精选

热门评论

相关文章

对标OpenClaw Meta被曝开发个性化AI智能体

Anthropic据悉承诺在谷歌云服务和芯片上投入2000亿美元

Anthropic推出用于执行金融服务任务的AI智能体面向银行等专业人士

宾州起诉 Character.AI：调查中聊天机器人自称“持证精神科医生”

消息人士：OpenAI与Anthropic的合资企业正洽谈收购AI服务公司

Top 10

微信朋友圈悄悄更新了，你发现了吗？

DeepSeek连夜删掉的新论文到底说了什么

央视揭秘中方为何禁止Meta收购Manus

《纽约时报》称已确认比特币发明者中本聪的真实身份

苹果被曝下调 iPhone 18 规格以压缩成本

苹果宣布CEO交接蒂姆·库克发布致全球苹果用户公开信

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

对文章打分

ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

最新资讯

编辑精选

热门评论

相关文章

对标OpenClaw Meta被曝开发个性化AI智能体

Anthropic据悉承诺在谷歌云服务和芯片上投入2000亿美元

Anthropic推出用于执行金融服务任务的AI智能体 面向银行等专业人士

宾州起诉 Character.AI：调查中聊天机器人自称“持证精神科医生”

消息人士：OpenAI与Anthropic的合资企业正洽谈收购AI服务公司

Top 10

微信朋友圈悄悄更新了，你发现了吗？

DeepSeek连夜删掉的新论文到底说了什么

央视揭秘中方为何禁止Meta收购Manus

《纽约时报》称已确认比特币发明者中本聪的真实身份

苹果被曝下调 iPhone 18 规格以压缩成本

苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信

Anthropic推出用于执行金融服务任务的AI智能体面向银行等专业人士

苹果宣布CEO交接蒂姆·库克发布致全球苹果用户公开信