OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录

OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录

2026年05月08日 02:32 次阅读 稿源:cnBeta.COM 条评论 OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录 OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录

OpenAI 今日发布三款全新的实时语音模型,旨在为开发者“解锁新一代语音应用形态”。 这三款语音智能模型分别侧重推理对话、实时翻译和实时转录等不同场景需求。

OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录

根据 OpenAI 公布的信息,新系列包括 GPT‑Realtime‑2、GPT‑Realtime‑Translate 和 GPT‑Realtime‑Whisper 三个模型。 其中,GPT‑Realtime‑2 被定位为首款具备 GPT‑5 级推理能力的语音模型,能够更好地处理复杂请求,并以更自然的方式持续推进对话。 官方介绍称,该模型专为实时语音交互打造,在用户提问或发出指令时,一边进行推理、一边保持对话连贯,同时还能调用工具、处理用户打断和更正,并根据当下情境作出更贴切的回应。

第二款模型 GPT‑Realtime‑Translate 主打实时翻译能力,可支持“70 多种输入语言和 13 种输出语言”,并在翻译过程中尽量跟上说话者的语速。 这一特性意味着,跨语言通话、会议或直播等场景,有望通过该模型获得更接近“同声传译”的体验。

第三款 GPT‑Realtime‑Whisper 则是一款实时流式语音转写模型,聚焦低延迟语音转文本能力。 OpenAI 表示,该模型可以在说话者讲话的同时即时完成转录,使得各类实时产品显得更快速、更灵敏、更自然。 从直播字幕“边说边出”,到能跟上讨论节奏的会议记录,这类应用场景都被视为 GPT‑Realtime‑Whisper 的主要发力方向。

在接入方式与价格方面,OpenAI 称三款新语音模型均已纳入其 Realtime API 体系。 GPT‑Realtime‑2 的定价为每 100 万音频输入 Token 收费 32 美元(缓存输入 Token 为 0.40 美元),每 100 万音频输出 Token 收费 64 美元。 GPT‑Realtime‑Translate 的价格为每分钟 0.034 美元,而 GPT‑Realtime‑Whisper 的价格为每分钟 0.017 美元。

OpenAI 表示,开发者可以通过 Playground 直接测试这些新的实时语音模型。 若已安装 Codex,只需在指定提示上点击提交,即可将 GPT‑Realtime‑2 添加到现有应用,或基于该模型快速创建一款新应用。 官方也在其网站上进一步介绍了这三款语音模型的技术细节,以及部分合作企业已经如何在实际产品中加以利用。

在生成式 AI 持续向多模态与实时交互演进的背景下,OpenAI 此次发布的三款语音模型,被视为其在“语音智能”方向上的又一重要布局。 随着推理、翻译与转录能力的统一整合,开发者将能够更轻松地为用户提供“开口就能用”的语音 AI 体验,从助手工具到生产力应用,再到内容创作与无障碍服务,都有望迎来新一轮探索与创新。

-

对文章打分

OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录

1 (50%) 1 (50%)
  • 登录
OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录 [退出]

OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录 发布
    显示更多评论

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      相关文章

      • 图像生成现已成为推动AI应用发展的关键功能

        • 昨天 19:40
      • 特朗普家族推出WorldRouter 打破模型壁垒重构支付逻辑

        • 昨天 16:41
      • 火到欧美的韩国棒球女神是AI生成 无数宅男梦碎

        • 昨天 12:50
      • 网友给父亲买衣服 AI竟调侃是寿衣

        • 昨天 12:46
      • Claude付费订阅5小时配额速率翻倍 高峰期速率限制取消

        • 昨天 12:08

      Top 10

      本周 本月
      • 1

        DeepSeek连夜删掉的新论文到底说了什么

        阅读 (990) 评论 (0)
      • 2

        “DeepSeek版Claude Code” GitHub 2.3k星

        阅读 (850) 评论 (0)
      • 3

        70岁周润发跑步近照流出 双颊凹陷被疑“瘦到脱相”

        阅读 (822) 评论 (0)
      • 4美国天后级歌手突发重病 曾接受昂贵“洗血”疗法
      • 5联想抛弃ThinkPad 20年经典设计:取消独立镁合金骨架
      • 6生物圈震撼:00后小哥在客厅完成基因组测序 27亿美金壁垒塌了
      • 7一图看懂DeepSeek V4与美国顶级AI差距:落后8个月
      • 8Rufus重大更新:推出全新Windows 11安装方式 可大幅提升电脑性能
      • 9OpenAI疯狂升级Codex 接管Mac人类全程0操作围观
      • 10DeepSeek公开多模态模型技术报告公布:超越GPT-5.4
      • 1

        《纽约时报》称已确认比特币发明者中本聪的真实身份

        阅读 (5951) 评论 (0)
      • 2

        苹果被曝下调 iPhone 18 规格以压缩成本

        阅读 (2766) 评论 (0)
      • 3

        苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信

        阅读 (2122) 评论 (1)
      • 4第一批学AI的大学生,已经笑不出来了
      • 5《永劫无间》女解说黑衣黑脸反讽舆论 日本网友狂赞
      • 6微软无预警封停 WireGuard 与 VeraCrypt 开发者账号
      • 7陈冠希撞脸赵本山 网友感慨颜值断崖式下滑
      • 8韩国Naver宣布全面弃用阿里Qwen编码器
      • 9Claude复活30年前传奇游戏 仅用一个周末
      • 10乒乓球机器人Ace在东京击败顶级选手 创下体育机器人历史第一
      招聘