人工智能领域内,大语言模型的“幻觉问题”长期是行业面临的一大难题。近期,通过HHEM-2.1-Open评估体系进行的一项测试表明,智谱AI推出的GLM-4-9B模型呈现出了令人赞叹的成绩。

根据测试数据,在参与评测的85个大语言模型中,GLM-4-9B凭借98.7%的事实一致性率和100%的回答率,荣登榜首。尤为引人注目的是,该模型的幻觉率低至1.3%,这一成绩不仅高居榜首,还超越了OpenAI的GPT系列和Google的Gemini系列模型。

机器人 元宇宙 科幻

图源说明:此图由AI生成,版权由Midjourney授权。

这一突破性成果显示了中国大语言模型在降低“幻觉率”方面的重要进展,为提高AI应用的可靠性和准确性提供了新的途径。这不仅展示了智谱AI在模型研发方面的技术优势,也为全球AI领域树立了新的里程碑。

在AI技术竞争愈发激烈的当下,GLM-4-9B模型的卓越表现无疑将为智谱AI赢得更多关注,并助力中国AI企业在国际舞台上获得更多话语权。