OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录
2026年05月08日 02:32 次阅读 稿源:cnBeta.COM 条评论
OpenAI 今日发布三款全新的实时语音模型,旨在为开发者“解锁新一代语音应用形态”。 这三款语音智能模型分别侧重推理对话、实时翻译和实时转录等不同场景需求。

根据 OpenAI 公布的信息,新系列包括 GPT‑Realtime‑2、GPT‑Realtime‑Translate 和 GPT‑Realtime‑Whisper 三个模型。 其中,GPT‑Realtime‑2 被定位为首款具备 GPT‑5 级推理能力的语音模型,能够更好地处理复杂请求,并以更自然的方式持续推进对话。 官方介绍称,该模型专为实时语音交互打造,在用户提问或发出指令时,一边进行推理、一边保持对话连贯,同时还能调用工具、处理用户打断和更正,并根据当下情境作出更贴切的回应。
第二款模型 GPT‑Realtime‑Translate 主打实时翻译能力,可支持“70 多种输入语言和 13 种输出语言”,并在翻译过程中尽量跟上说话者的语速。 这一特性意味着,跨语言通话、会议或直播等场景,有望通过该模型获得更接近“同声传译”的体验。
第三款 GPT‑Realtime‑Whisper 则是一款实时流式语音转写模型,聚焦低延迟语音转文本能力。 OpenAI 表示,该模型可以在说话者讲话的同时即时完成转录,使得各类实时产品显得更快速、更灵敏、更自然。 从直播字幕“边说边出”,到能跟上讨论节奏的会议记录,这类应用场景都被视为 GPT‑Realtime‑Whisper 的主要发力方向。
在接入方式与价格方面,OpenAI 称三款新语音模型均已纳入其 Realtime API 体系。 GPT‑Realtime‑2 的定价为每 100 万音频输入 Token 收费 32 美元(缓存输入 Token 为 0.40 美元),每 100 万音频输出 Token 收费 64 美元。 GPT‑Realtime‑Translate 的价格为每分钟 0.034 美元,而 GPT‑Realtime‑Whisper 的价格为每分钟 0.017 美元。
OpenAI 表示,开发者可以通过 Playground 直接测试这些新的实时语音模型。 若已安装 Codex,只需在指定提示上点击提交,即可将 GPT‑Realtime‑2 添加到现有应用,或基于该模型快速创建一款新应用。 官方也在其网站上进一步介绍了这三款语音模型的技术细节,以及部分合作企业已经如何在实际产品中加以利用。
在生成式 AI 持续向多模态与实时交互演进的背景下,OpenAI 此次发布的三款语音模型,被视为其在“语音智能”方向上的又一重要布局。 随着推理、翻译与转录能力的统一整合,开发者将能够更轻松地为用户提供“开口就能用”的语音 AI 体验,从助手工具到生产力应用,再到内容创作与无障碍服务,都有望迎来新一轮探索与创新。
-对文章打分
OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录
1 (50%) 1 (50%)- 登录
[退出]
最新资讯
加载中...编辑精选
加载中...热门评论
相关文章
-
图像生成现已成为推动AI应用发展的关键功能
- 昨天 19:40
-
特朗普家族推出WorldRouter 打破模型壁垒重构支付逻辑
- 昨天 16:41
-
火到欧美的韩国棒球女神是AI生成 无数宅男梦碎
- 昨天 12:50
-
网友给父亲买衣服 AI竟调侃是寿衣
- 昨天 12:46
-
Claude付费订阅5小时配额速率翻倍 高峰期速率限制取消
- 昨天 12:08
Top 10
本周 本月-
1
DeepSeek连夜删掉的新论文到底说了什么
阅读 (990) 评论 (0) -
2
“DeepSeek版Claude Code” GitHub 2.3k星
阅读 (850) 评论 (0) -
3
70岁周润发跑步近照流出 双颊凹陷被疑“瘦到脱相”
阅读 (822) 评论 (0) - 4美国天后级歌手突发重病 曾接受昂贵“洗血”疗法
- 5联想抛弃ThinkPad 20年经典设计:取消独立镁合金骨架
- 6生物圈震撼:00后小哥在客厅完成基因组测序 27亿美金壁垒塌了
- 7一图看懂DeepSeek V4与美国顶级AI差距:落后8个月
- 8Rufus重大更新:推出全新Windows 11安装方式 可大幅提升电脑性能
- 9OpenAI疯狂升级Codex 接管Mac人类全程0操作围观
- 10DeepSeek公开多模态模型技术报告公布:超越GPT-5.4
-
1
《纽约时报》称已确认比特币发明者中本聪的真实身份
阅读 (5951) 评论 (0) -
2
苹果被曝下调 iPhone 18 规格以压缩成本
阅读 (2766) 评论 (0) -
3
苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信
阅读 (2122) 评论 (1) - 4第一批学AI的大学生,已经笑不出来了
- 5《永劫无间》女解说黑衣黑脸反讽舆论 日本网友狂赞
- 6微软无预警封停 WireGuard 与 VeraCrypt 开发者账号
- 7陈冠希撞脸赵本山 网友感慨颜值断崖式下滑
- 8韩国Naver宣布全面弃用阿里Qwen编码器
- 9Claude复活30年前传奇游戏 仅用一个周末
- 10乒乓球机器人Ace在东京击败顶级选手 创下体育机器人历史第一