人工智能初创企业 ElevenLabs 于周三推出了一项创新功能,名为 GenFM,允许用户上传多种类型的内容,以生成多声道播客,与谷歌的 NotebookLM 类似。
这项新功能已在 ElevenLabs Reader 的 iOS 应用中推向市场,支持多达 32 种语言,涵盖英语、印地语、葡萄牙语、中文、西班牙语、法语、德语和日语等。
在使用 GenFM 时,用户可以上传 YouTube 视频、文本或文档,应用程序会智能选择两种声音,为用户生成播客内容。
ElevenLabs 提供了丰富的声音选项供用户选择,应用程序在准备 AI 生成的播客过程中,用户或许会遇到一些有趣的提示,比如“添加一些停顿”和“插入一些填充词”。在当前众多工具致力于消除背景中的“嗯”和“啊”时,ElevenLabs 则选择为其 AI 生成的播客增添一些人性化元素。
ElevenLabs 移动增长负责人 Jack McDermott 在接受采访时表示:“我们探讨了在多大程度上引入‘嗯’、‘啊’、‘嗯哼’、笑声和呼吸等类似人类对话的填充词。我们的目标是在人类自然对话和内容实用性之间实现平衡。”
他进一步指出,优秀的长格式播客通常干扰较少,更自然和深入的对话流是他们所追求的体验,以使音频叙事在不同声音和语言中更易于获取。
未来,ElevenLabs 计划推出更多自定义选项,并允许用户添加多个来源来创建生成式 AI 播客。9 月份,谷歌推出了 NotebookLM 的 AI 生成对话功能,并在一个月后增加了用户自定义播客输出的能力。
本月初,ElevenLabs 还宣布将投资 1100 万美元于波兰初创企业生态系统,并在华沙设立研发中心,以吸引本地 AI 人才。同时,该公司正在扩展至印度,已招聘一名业务负责人并建立团队。此外,ElevenLabs 还为客户推出了对话 AI 代理。
重点摘要:
🌐 ElevenLabs 推出 GenFM 功能,支持用户上传视频或文本生成多声道播客。
🎙️ 该功能智能选择两种声音,并加入人性化的填充词,以提升自然对话体验。
🚀 ElevenLabs 未来计划支持更多自定义选项,并在波兰和印度扩展业务。
暂无评论