OpenAI最近发布了ChatGPT的几项新功能,这些功能将AI交互提升到了新的层次。2023年9月25日,ChatGPT开始部署新的声音和图像处理功能。这些新功能使用户可以通过语音与ChatGPT进行对话,或展示图片让ChatGPT分析讨论。例如,用户可以在旅途中拍摄地标照片,与ChatGPT进行实时对话,讨论地标的有趣之处;或在家中拍摄冰箱和食品储藏室的照片,询问应该准备什么晚餐,并获取逐步的烹饪指导。
此外,这些新功能目前正逐步向Plus和企业用户推出,预计在接下来的两周内完全上线。新的语音功能允许用户在移动应用中选择五种不同的声音选项,并通过新的文本到语音模型生成类似人声的音频。同时,使用OpenAI的开源语音识别系统Whisper将用户的口语转换成文本