Hume AI,一家专注于情感智能语音界面的创业公司,近期推出了一项名为“语音控制”的创新功能。
该工具旨在帮助开发者和用户无需具备编程、AI提示工程或音效设计技能,即可打造专属AI声音。用户能够通过精细调整声音属性,轻松定制满足需求的音质。
此功能基于公司先前发布的“共情语音界面2”(EVI2)升级而来,EVI2增强了语音的自然度、情感反应和定制能力。与传统语音克隆技术有所区别,Hume的产品致力于提供独特且富有表现力的声音,适用于客户服务聊天机器人、数字助手、教师、导游以及无障碍功能等多个场景。
“语音控制”功能允许开发者在十个不同维度上调整声音特性,涵盖性别、果断性、兴奋度、自信心等方面。
“性别: 发声在男性化和女性化之间调整。
自信度: 声音的坚定性,介于胆怯与大胆之间。
浮力: 声音的密度,介于轻盈和充实之间。
自信: 声音的确定性,介于害羞与自信之间。
热情: 声音中的激情,介于平静和热情之间。
鼻音: 声音的开放性,介于清晰与鼻音之间。
放松度: 声音的压力,介于紧张与放松之间。
平滑度: 声音的质感,介于平滑与断续之间。
温和: 声音的活力,介于温和与有力之间。
紧密度: 声音的包容性,介于紧密与松散之间。”
用户可通过虚拟滑块实时微调这些属性,简化定制过程。该功能已在Hume的虚拟平台上上线,用户免费注册后即可使用。
语音控制功能目前已推出测试版,并与Hume的共情语音界面(EVI)集成,适用于多种应用场景。开发人员可选择基础语音,调整特性,并实时预览效果,确保在客户服务机器人或虚拟助手等实时应用中的可重复性和稳定性。
EVI2的影响力在语音控制功能上得以体现。早期版本引入的对话提示和多语言功能等,拓宽了语音AI应用的范围。例如,EVI2支持亚秒级响应时间,实现自然流畅的对话。它还允许在交互过程中动态调整说话风格,成为企业多功能的工具。
Hume此举旨在解决AI行业中过度依赖预设声音的问题,许多品牌或应用难以找到合适的声音。Hume的目标是开发情感细腻的语音AI,推动行业向前发展。EVI2于2024年9月发布时,已大幅提高语音的延迟和成本效益,并为声音调节功能提供了安全的选择。
Hume的研究驱动型方法在产品开发中占据核心地位,结合跨文化声音录音和情感调查数据。这一方法论为EVI2和新推出的语音控制功能奠定了基础,使其能够精确捕捉人类对声音的感受。
目前,语音控制功能已在测试版中推出,并与Hume的共情语音界面(EVI)相结合,支持多种应用场景。开发者可选择基础声音,调整特性,并实时预览结果,确保在实时应用中的一致性和稳定性。
在市场竞争日益激烈的背景下,Hume的个性化语音和情感智能定位使其在语音AI领域脱颖而出。未来,Hume计划扩展语音控制功能,增加可调节维度,提升声音质量,并扩大基础声音的选择范围。
官方博客:https://www.hume.ai/blog/introducing-voice-control
划重点:
🔊 **Hume AI推出“语音控制”功能,助力用户轻松打造个性化AI声音。**
🛠️ **无需编程技能,用户通过滑块即可调整声音特性。**
暂无评论