迅维网

OpenAI发布GPT-4o:可免费开放使用,语音对话媲美真人

ptmanager 2024-5-15 18:05

OpenAI发布了最新升级的大型语言模型GPT-4o。GPT-4o的“o”代表“omni”,意为“全能”。它可以实时对音频、视觉和文本进行推理,能处理超过50种不同的语言,并且速度和质量大大提升。

GPT-4o的最大亮点是其语音对话能力。此前GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒,而GPT-4o可以在232毫秒内对音频输入做出反应,甚至还能随意打断,与人类在对话中的反应时间相近。

此外,GPT-4o还可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,人机交互更加自然、全面了。

OpenAI表示,GPT-4o将会在未来几周内陆续开放。其中,免费用户可以使用GPT-4o的基本功能,但会限制数量。

GPT-4o主要特点:

* 实时对音频、视觉和文本进行推理
* 能处理超过50种不同的语言
* 语音对话媲美真人
* 可接受文本、音频和图像三者组合作为输入
* 并生成文本、音频和图像的任意组合输出

GPT-4o的发布标志着人工智能技术又取得了重大突破。它将为我们带来更加自然、高效的人机交互体验。未来,GPT-4o还将会有更多令人期待的应用。让我们拭目以待!
本文转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容! [声明] 本站文章版权归原作者所有,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权!

雷人

握手

鲜花

鸡蛋

路过
收藏

最新评论

发表评论

登录 后可参与评论
关闭

站长提醒 上一条 /1 下一条

返回顶部
附近
店铺
微信扫码查看附近店铺
维修
报价
扫码查看手机版报价
信号元
件查询
点位图


芯片搜索