北京智谱华章科技有限公司最近对外宣布,其旗下智谱 GLM-PC 智能体已完成升级,并正式向公众开放体验。这是全球首个能够自主操控计算机的多模态智能体。GLM-PC 的技术依托于智谱的多模态大模型 CogAgent。用户仅需轻点回车,便能享受到这一创新的电脑智能助手带来的便捷。
自2024年11月29日 GLM-PC v1.0版本发布后,它便开始了内测。该版本引入了“深度思考”模式,增加了逻辑推理和代码生成功能,并支持了 Windows 系统。GLM-PC 在代码生成、逻辑执行、图形用户界面(GUI)理解等方面展现出了其强大的智能化操作潜力。
在代码生成和逻辑执行上,GLM-PC 能够全面分析目标和资源,制定执行路线图,将大任务拆分为小任务,实现高效的任务规划。完成规划后,智能体将启动代码生成模块进行循环执行,确保任务精准完成。同时,GLM-PC 还具有长思考能力,能实时调整和反思修正,与用户互动,优化解决方案。
在图像和 GUI 认知方面,GLM-PC 能精确识别和理解图形界面中的元素,如按钮和图标,并基于用户历史操作提供智能推荐。其图像语义解析功能能够深入分析复杂图像,提取关键信息,如趋势和指标。此外,GLM-PC 还能融合图像和文字信息,为用户提供全面感知结果,助力用户制定精准的操作策略。
随着人工智能技术的不断进步,智谱 GLM-PC 的问世为用户带来了更加高效、智能的电脑使用体验,标志着人机交互领域的重大进步。
暂无评论