播客领域正迎来快速发展,Podcastle 平台近期发布了其革命性的AI文本转语音模型Asyncflow v1.0。这一创新模型不仅向用户提供了超过450种独特的AI语音,还为开发者提供了API接口,使他们能够轻松将这一功能集成到自家的应用程序中。
Podcastle的创始人Arto Yeritsyan透露,公司一直梦想打造一个文本转语音模型,但由于以往高昂的训练成本和庞大的数据需求,这一目标迟迟未能实现。然而,得益于近年来大型语言模型技术的飞速发展,Podcastle终于在去年实现了突破,无需大量数据就能构建出高质量的语音模型。Yeritsyan补充说,Podcastle的研发得到了去年1350万美元的A轮融资支持,这为其技术创新提供了坚实保障。
在价格方面,Podcastle的文本转语音服务定价为每500分钟约40美元,相较于竞争对手ElevenLabs的99美元,具有明显成本优势。除了文本转语音模型,Podcastle的语音克隆功能也得到了升级,训练过程从之前的70句不同句子的朗读缩短至仅需几秒的录音。这一新过程得益于Podcastle去年推出的Magic Dust AI技术,显著提升了音频录制质量。
在实际测试中,尽管新生成的语音略显机械,但仍然能够较好地模仿说话者的语调。Podcastle表示,随着技术的不断进步,这一功能将得到持续优化,用户也可以通过不同的录音样本来训练出个性化的声音效果。
Yeritsyan指出,除了成本优势外,Podcastle通过整合音频、视频、播客和AI驱动的叙述工具到一个重新设计的网站中,也将使其在激烈的市场竞争中脱颖而出。他提到,尽管目前大多数用户仍主要使用Podcastle进行音频内容创作,但视频制作的需求也在逐渐增长。
访问入口:https://podcastle.ai/ai-voices
重点提示:
🌟 Podcastle 推出Asyncflow v1.0模型,提供超过450种AI语音。
💰 该平台每500分钟文本转语音收费40美元,低于竞争对手定价。
🎤 语音克隆功能升级,训练时间大幅缩短,用户体验持续优化。
暂无评论