当前标签

LLM

HHEM排行榜：LLM幻觉评估与模型比较

Ai专栏 212 次浏览

HHEM排行榜：LLM幻觉评估与模型比较

AI模型幻觉评估排行榜：HHEM评估LLM生成摘要时的事实一致性，揭示模型在摘要任务中的幻觉频率及事实一致性。

Anthropic宪法分类器防御AI越狱

Ai专栏 263 次浏览

Anthropic宪法分类器防御AI越狱

Anthropic发布规则分类器，防御大语言模型越狱攻击。

PaSa：突破学术搜索难题，智能论文搜索代理大揭秘

新闻热点 258 次浏览

PaSa：突破学术搜索难题，智能论文搜索代理大揭秘

PaSa：字节跳动与北大研发的智能学术论文搜索代理，由爬虫和选择器代理组成，提升检索效率和准确性。

AI历史知识测试：LLM在复杂历史问题上的不足

新闻热点 335 次浏览

AI历史知识测试：LLM在复杂历史问题上的不足

AI在历史问题处理表现不足，LLM模型在测试中准确率低，需改进以提升历史研究应用。

Transformer²：自适应LLM框架，灵活应对多样化任务

新闻热点 208 次浏览

Transformer²：自适应LLM框架，灵活应对多样化任务

Sakana AI推出Transformer²，自适应调整LLM权重，适应多样化任务，提升效率。

大规模语言模型LLM数据中毒风险：医疗领域安全警示

新闻热点 382 次浏览

大规模语言模型LLM数据中毒风险：医疗领域安全警示

大规模语言模型存在数据脆弱性，虚假信息可致模型失效，医疗领域风险大，呼吁谨慎应用。

FlashInfer：高效LLM推理解决方案，提升性能与资源利用

新闻热点 306 次浏览

FlashInfer：高效LLM推理解决方案，提升性能与资源利用

FlashInfer：专为LLM推理设计，支持多种注意力机制，优化GPU资源利用，显著减少推理延迟，提升效率，开源合作推动AI发展。

Meta发布新型记忆层技术，大幅提升LLM事实准确性

新闻热点 165 次浏览

Meta发布新型记忆层技术，大幅提升LLM事实准确性

Meta发布新型记忆层技术，提升LLM事实准确性，扩展参数规模，突破传统神经网络扩展方式。

NVIDIAChipAlign：突破芯片设计LLM融合难题

新闻热点 317 次浏览

NVIDIAChipAlign：突破芯片设计LLM融合难题

NVIDIA ChipAlign创新合并策略，提升LLM在芯片设计等领域的性能，展现AI解决方案潜力。

o1-like模型“过度思考”问题及优化策略

新闻热点 421 次浏览

o1-like模型“过度思考”问题及优化策略

o1-like模型存在过度思考问题，腾讯AI实验室提出优化策略，提高资源利用效率，减少token使用，提升模型在简单任务上的准确性。

加载更多