谷歌近期发布了Gemini人工智能助手的两大重磅更新:Canvas实时协作平台与Audio Overviews音频概览功能,大幅提升了其AI助手的实用性与用户体验。

Canvas:实时协作文档创作工具

Canvas功能为用户提供了一个高效的工作区域,实现与AI的协作式文档和代码编写。该工具支持文档更改的实时显示,并配备内置聊天功能,方便用户交流修改意见。

尤为值得一提的是,Canvas可实时生成HTML和React代码的预览,用户可直接将完成文档导出至Google Docs。业内分析指出,此功能与ChatGPT去年秋季推出的同名功能有异曲同工之妙。

Audio Overviews:将文字转化为对话式音频

Audio Overviews功能能让用户将文档、演示文稿、研究报告等书面内容转化为对话式播客,由两位AI主持人进行深入分析。

谷歌通过免费深度研究功能的更新,展示了这一技术的应用。这些音频摘要最初在NotebookLM平台上推出。需要注意的是,与其他AI生成内容类似,这些音频内容可能存在不准确信息,用户在使用时需保持理性判断。

目前,Audio Overviews功能仅支持英语,用户可通过网络和移动平台访问,并下载、分享所创建的音频文件。

Gemini生态系统持续进化

自今年年初起,谷歌一直在不断丰富其Gemini生态系统。近期更新包括:

  • Gemini Live新增视频和屏幕共享功能,率先在三星Galaxy S24/S25和Pixel 9设备上推出
  • 谷歌计划以Gemini替代Google Assistant,成为Android设备的默认AI助手
  • 推出了三种新的模型变体:Gemini2.0 Flash(基础模型)、Flash Lite(经济高效版)和2.0 Pro(具备扩展上下文处理能力)
  • 在欧盟、瑞士和英国以外的地区,Gemini可访问用户的Google搜索历史记录,提供更情境化的响应
  • 平台获得了用于生成和编辑图像以及理解YouTube视频的原生多模式功能

据谷歌官方消息,Canvas和Audio Overviews功能现已面向全球的Gemini和Gemini Advanced用户开放。