今日,我国知名企业科大讯飞推出了其最新研发的星火同传语音大模型,这标志着我国首个拥有端到端语音同传功能的大模型正式亮相。与讯飞此前的翻译技术相比,这一创新技术实现了全场景翻译效果的显著提升,同时大幅缩短了端到端的响应时间。
星火同传语音大模型的推出,为用户带来了更加流畅、精准的同传体验。在讯飞的演示中,搭载该模型的翻译机在英译中语音同传方面几乎实现了无延迟,非常适合用于出国旅游、国际展会等场合。这一优化不仅显著提升了翻译字幕的呈现速度,还保证了中英互译的准确性。
据悉,星火同传语音大模型支持译文长度反向调控,在语音到文本的端到端翻译过程中,能够流式地进行意群切分、语境理解和信息重组。同时,流式语音合成技术还能支持意群韵律衔接和自适应语速调节,进一步提升了翻译的自然度和流畅度。
在国际交流场景中,无论是日常对话、商务交流还是行业翻译等高难度同传翻译需求,星火同传语音大模型都表现出色。其内容完整度、信息准确度以及语言质量均处于行业领先水平,超越了谷歌Gemini2.0和OpenAI GPT-4o等同传技术。最快可实现5秒以内的同传时延,达到人类专家译员的水平。
科大讯飞的星火同传语音大模型的发布,不仅代表我国AI翻译技术的重大突破,也预示着未来国际交流将更加便捷和高效。
暂无评论