由穆罕默德·本·扎耶德大学研究人员领导的研究成果,推出了一款名为 BiMediX2 的人工智能模型。此系统能够理解和解释医学图像中的信息,并支持英语和阿拉伯语的双语分析,尤其在处理阿拉伯语内容时表现出色。

作为首个能够使用英语和阿拉伯语分析、描述医学图像的人工智能系统,BiMediX2能够处理包括 X 射线、MRI 扫描和显微图像在内的多种医学图像,并提供详细的描述,同时能够回答与图像内容相关的问题。在医学图像理解上,该模型不仅提高了翻译的准确性,还显著增强了阿拉伯语的处理能力。

QQ20241230-105429.png

技术报告显示,BiMediX2在与现有技术的对比测试中表现卓越,其英文内容的翻译效果提高了9%,阿拉伯语内容则提高了20%。这一成果归功于团队对 160万份医学文本和图像数据 的海量训练,确保了两种语言之间的准确转换。

得益于其创新的底层架构,BiMediX2的表现令人瞩目。该系统基于 Llama3.1架构GPT-4o,特别针对医疗领域进行了优化。结合 Vision EncoderMeta Llama3.1,BiMediX2实现了无缝的双语医学图像分析。在识别错误医疗信息方面,它甚至优于 GPT-4o。

尽管 BiMediX2的性能令人鼓舞,但研究人员强调,目前该系统仅限于研究用途,尚未进入临床应用。与所有人工智能系统一样,BiMediX2也可能出现错误或生成不准确的信息。因此,研究团队已在 Hugging Face 上发布了该模型,并推出了名为 BiMed-MBench 的双语基准,用于测试类似系统的性能。

BiMediX2是医学图像分析领域的一项重要创新,尤其在处理双语医学图像和翻译方面取得了显著进展。尽管目前尚未应用于临床,但该系统的研究成果为医疗行业带来了更高效、更准确的人工智能应用前景。