人工智能在认知测试中暴露出瑕疵,揭示临床应用的局限性
人工智能模型在接受蒙特利尔认知评估测试时表现出认知障碍,挑战了其在临床应用中的局限性。研究发现,大型语言模型在执行任务中存在重要弱点,可能导致其无法在医疗任务中超越人类医生。虽然在某些任务上表现良好,但在视觉空间技能和执行功能方面表现不佳。这些发现强调了人类大脑与大型语言模型的本质差异,认为神经科医生不太可能被取代,并可能需要治疗“虚拟”病人。
人工智能模型在接受蒙特利尔认知评估测试时表现出认知障碍,挑战了其在临床应用中的局限性。研究发现,大型语言模型在执行任务中存在重要弱点,可能导致其无法在医疗任务中超越人类医生。虽然在某些任务上表现良好,但在视觉空间技能和执行功能方面表现不佳。这些发现强调了人类大脑与大型语言模型的本质差异,认为神经科医生不太可能被取代,并可能需要治疗“虚拟”病人。