转自:AI寒武纪
要实现电话通话,至少需要以下几个关键能力:语音识别;语音合成;3、实时交互;这些技术OpenAI都有了,现在就看最终的产品了。
OpenAI 似乎正在努力在 chatGPT 中实现电话通话。这可能是周一宣布的活动的一小部分,这一点从OpenAI网站一些后台代码就可以发现
现在,OpenAI 也已配备了 webRTC 服务器来实现这一目标,这些服务器最近也进行了配置
起初大家以为webrtc被用于他们的纯语音模式,但事实证明那是由Livekit完成的
早就2月份,OpenAI前开发者关系负责人就提及,ChatGPT的终极形态不是聊天,看起来和现在的信息对应上了
要实现电话通话,至少需要以下几个关键能力:
1、语音识别 - 将语音信号转换为文本
2、语音合成 - 将文本转换为自然语音输出
3、实时交互 - 能够在通话过程中实时处理对方的语音输入并作出响应
这些技术OpenAI都有了,现在就看最终的产品了
OpenAI语音技术负责人也转发了周一发布会的推文