当前标签

Shopping MMLU

新闻热点 132 次浏览

“探索亚马逊Shopping MMLU：提升网购体验的多任务AI基准测试”

亚马逊推出的Shopping MMLU基准测试，通过57个任务评估大型语言模型在在线购物中的潜力，涵盖概念理解及用户行为对齐等技能。研究表明，AI助手需掌握多任务能力，但常用训练方法可能导致性能下降，进一步探索智能购物助手的未来仍需克服多样性及训练挑战。