当前标签

多模态模型

Gemini2.0发布:最新AI模型引领智能代理时代

Google发布Gemini 2.0,这是其最强大的多模态AI模型,具备图像、视频、音频等多种输入输出能力,旨在为用户提供更有用的信息和助手体验。该模型强化了长上下文理解和多步骤推理,支持复杂任务的执行。同时,Gemini 2.0推动了安全和责任性的发展,确保在AI使用中保护用户隐私和安全。更多功能如实时多模态API将帮助开发者打造创新应用,开启AI代理时代的新篇章。

查看全文

智谱AI开源的GLM-Edge系列:端侧大语言与多模态模型解决方案

智谱科技近日开源其GLM-Edge系列端侧大语言和多模态模型,标志着公司在实际应用中的重要进展。该系列包含四种不同尺寸的模型,针对移动和桌面平台进行了优化。基于GLM-4系列技术,智谱团队调整了模型以实现性能和便利度的最佳平衡。特别是在高通骁龙8Elite平台上,模型解码速度超越每秒60tokens,应用投机采样后可达100tokens。这一举措为开发者和研究者在端侧AI应用中提供了有力支持。

查看全文