分享好友 资讯首页 频道列表

OpenAI发布语音智能体全家桶,引领AI交互新时代

2025-03-21 09:13440

OpenAI通过一场技术直播,向全球开发者隆重推出了其最新的语音智能体全家桶。这一创新之举不仅标志着OpenAI在AI语音技术领域的重大突破,更为未来的智能交互体验开启了全新的篇章。

在此次发布的语音智能体全家桶中,OpenAI推出了三款全新的语音模型,专为开发语音AI Agent而设计。其中包括两款语音转文本模型——GPT-4o-transcribe和GPT-4o-mini-transcribe,以及一款文本转语音模型——GPT-4o-mini-tts。这些模型在性能上实现了质的飞跃,特别是在语音识别的准确性和文本转语音的自然度方面,均达到了前所未有的水平。

据OpenAI平台负责人Olivier Godement介绍,语音是人类最自然的交互方式,相较于读写,语音沟通更加便捷和人性化。因此,OpenAI一直致力于打造可靠、精准、灵活的语音智能体,以拓展AI的应用场景。此次推出的语音智能体全家桶,正是这一愿景的重要里程碑。

GPT-4o-transcribe和GPT-4o-mini-transcribe两款语音转文本模型,在各种语言的转录准确率上都实现了显著提升,使得AI能够更准确地理解人类语音。而GPT-4o-mini-tts文本转语音模型,则首次让开发者可以精细控制AI的发声方式,包括语调、情感等,从而打造出更富有人性的声音体验。

为了方便开发者使用这些新模型,OpenAI还特意开发了一个新的网站(http://OpenAI.fm),供开发人员尝试OpenAI API中的新文本转语音模型。在这个网站上,开发者可以选择不同的声音、不同的情绪来表达文本,也可以自己输入文本进行体验。

此外,OpenAI还对之前发布的Agent SDK进行了重大更新,深度整合了最新的语音转文本和文本转语音模型。这使得开发者无需复杂配置,即可为智能体赋予“耳朵”和“嘴巴”,实现双向流式传输,大幅提升语音交互的流畅性。

OpenAI的专家Jeff Harris在直播中分享了构建语音智能体的两种主要方法:一种是直接使用“语音-语音”模型,让AI直接理解音频并输出语音;另一种是链式调用音频模型与文本模型,这种方案更易上手、更可靠,也是OpenAI此次重点推荐的方式。

值得注意的是,尽管性能炸裂,但OpenAI此次推出的语音智能体全家桶在价格上却十分亲民。GPT-4o-transcribe每分钟0.6美分,与之前的Whisper模型价格一致;GPT-4o-mini-transcribe每分钟仅需0.3美分,性价比更高;而GPT-4o-mini-tts文本转语音模型,每分钟也仅需1美分。

此次OpenAI推出的语音智能体全家桶,无疑将极大地推动AI语音技术的发展和应用。随着这些新模型和工具的普及,我们可以期待在未来看到更多智能化、人性化的语音交互产品,为人们的生活带来更大的便利和乐趣。

免责声明:

本网转载并注明自其它来源(非智能装备网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。如涉及作品内容、版权等问题,请在发布之日起十五天内与本网联系,否则视为放弃相关权利。

反对 0
举报 0
收藏 0
打赏 0
评论 0

相关资讯

曝OpenAI将完成首款自研芯片设计:计划由台积电代工
OpenAI正积极推进其减少对英伟达芯片依赖的计划,即将完成自家首款自研人工智能芯片。据最新消息,OpenAI已决定将这款自研芯片交由全球领先的半导体制造商台积电进行“流片”测试。

0评论2025-02-11200

OpenAI劲敌重大突破,“几乎能像人一样熟练使用电脑”
由前OpenAI研究高管创立并获得亚马逊支持的人工智能初创企业Anthropic宣布,该公司已在人工智能领域取得了一个里程碑式的突破,其研发的AI智能体已具备与人类相当的能力,可以操作电脑以完成更复杂的任务。

0评论2024-10-23299

OpenAI将终止对中国提供服务 国内套壳创业公司如何应对
从昨天晚间至今,已有多名用户收到了来自OpenAI的邮件。该邮件表示,“我们的数据显示您的组织来自OpenAI目前不支持的地区的API流量。”邮件进一步表示,自7月9日起,OpenAI将开始阻止来自非支持国家和地区的API流量。

0评论2024-06-25614

团队负责人:Sora 还不是一个产品,短期不会向公众开放
三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但我们应该如何改进它是一个悬而未决的问题。

0评论2024-03-14284

Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
近日,博主“AI疯人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山,还有山间云卷云舒、山石崩裂等动画画面,令众多网友赞叹不已。

0评论2024-02-20280