Meta携手UNESCO推广少数民族语言AI

Meta近期宣布与联合国教科文组织(UNESCO)携手合作,推出一项全新的语言技术合作伙伴计划。该计划致力于搜集多种语言的语音录音和文字记录,旨在促进未来开放可用的人工智能(AI)技术的进步。特别关注那些在数字世界中处于边缘地位的少数民族语言。

据Meta介绍,该计划期望吸引合作伙伴,提供超过10小时的语音录音及其转录内容、丰富的书面文本,以及翻译句子的集合。Meta希望通过与合作伙伴的紧密合作,将这些语言融入其AI语音识别和翻译模型中,并将最终成果以开源形式发布。

图源:音频声波智能语音(图片由AI生成,图片授权服务商Midjourney)

截至目前,已确认的合作伙伴包括加拿大北部的努纳武特地区政府,该地区部分居民使用因纽特语。Meta在其博客中表示:“我们的努力特别聚焦于服务不足的语言,以支持联合国教科文组织的工作。最终,我们的目标是创建智能系统,能够理解并回应复杂的人类需求,无论语言或文化背景如何。”

为了配合这一计划,Meta还将发布一个开放源代码的机器翻译基准,旨在评估语言翻译模型的性能。该基准由语言学家设计,支持七种语言,并可通过AI开发平台Hugging Face进行访问和贡献。

Meta将这两项举措视为慈善行动,但公司也因此将受益于其语音识别和翻译模型的升级。Meta持续扩展其AI助手Meta AI支持的语言数量,并测试例如Instagram Reels中语音翻译的功能,允许创作者对其语音进行配音和自动同步。

尽管Meta在语言处理方面的努力值得肯定,但该公司在处理非英语内容时曾受到不少批评。有报告显示,Facebook在处理意大利语和西班牙语的COVID-19虚假信息时,几乎有70%的内容未被标记,而英语内容的未标记比例仅为29%。此外,泄露的文件显示,阿拉伯语内容常常被错误标记为仇恨言论。Meta表示,正采取措施改善其翻译和内容审核技术,以应对这些挑战。

相关推荐

暂无评论

发表评论