在伦敦的DeepMind总部,谷歌云举办了一场重要活动,正式发布了其高清语音模型Chirp3。该模型借助Vertex AI统一机器学习平台,向开发者全面开放,并提供了丰富的开发工具,旨在推动程序创新。
Chirp3模型支持248种独特的声音,并能够用31种语言进行语音合成。开发者可以利用这一强大的模型,开发出智能语音助手、有声读物和视频配音等多种应用。谷歌强调,Chirp3的语音合成功能能够捕捉人类语调的微妙变化,使对话更加生动有趣。
除了预制的语音,用户还可以利用谷歌云的文本转语音API,通过自定义语音来丰富应用。为了确保负责任的使用并防止滥用,谷歌限制了语音克隆功能的访问权限,并致力于遵守伦理AI的实践标准。
在发布会中,谷歌云首席执行官托马斯・库里安(Thomas Kurian)阐述了谷歌提供广泛模型的愿景,包括Chirp3、Gemini、Imagen和Veil等。同时,谷歌推出了专门针对商业用户的新产品Agent Space,以满足不同客户的需求。
谷歌DeepMind首席执行官德米斯・哈萨比斯(Sir Demis Hassabis)介绍了Gemini的进步,特别是其多模态理解能力。他指出,在AI Studio中,用户可以通过上传YouTube链接,Gemini能够分析视频内容,并通过其长时上下文窗口快速定位讲座或体育赛事的关键时刻。
此外,谷歌还宣布了一项旨在提升英国AI技能的计划,通过综合培训项目帮助专业人士掌握AI技术。谷歌将为英国初创企业提供云基础设施和AI工具的使用积分,支持它们快速开发创新解决方案,进而促进创业活动。
在隐私和合规性方面,谷歌重申了对数据驻留的承诺。Vertex AI和Agent Space AI工具能协助组织在遵守当地法律的前提下,进行模型训练和服务。这对于对隐私和合规性要求极高的医疗和金融等行业尤为重要。
项目链接:https://cloud.google.com/text-to-speech/docs/chirp3-hd
🌟 谷歌云发布Chirp3语音模型,支持248种声音及31种语言,助力开发者构建智能化应用。
🔒 谷歌限制语音克隆功能的访问权限,保障伦理AI实践,防止滥用。
💼 谷歌启动提升英国AI技能计划,向初创企业提供云基础设施支持,促进创新。
暂无评论