浙江大学与阿里巴巴达摩院联合发布多模态教科书研究,利用教学视频提炼高质量知识语料,提升VLMs知识密度和图像关联性。
VLMs在理解否定方面存在不足,NegBench框架通过引入否定示例显著提升模型性能,推动人工智能系统进步。