AI赋能浏览器:OperaBrowserOperator体验新纪元

🚀邀请体验:中国首家 AI IDE 智能编程软件 Trae 中文版下载,不限量使用 DeepSeek-R1 和 Doubao-pro!

挪威的 Opera 公司,以其创新精神闻名,再次引领浏览器技术前沿。最近,Opera 推出了名为 Browser Operator 的新型 AI 代理功能,为用户带来全新的浏览体验。这项技术如同为浏览器配备了一个智能助手,能理解用户的自然语言指令,并自动执行在线任务,实现了从信息展示平台到主动服务工具的转变。

blank


(adsbygoogle=window.adsbygoogle||[]).push({});

 

告别繁琐,AI 代理让浏览器“动”起来

长期以来,浏览器在我们的印象中只是被动的信息展示工具。我们需要手动输入网址,点击链接,所有操作都依赖于用户的指令。而 Opera 推出的 Browser Operator 则试图打破这种模式,让浏览器变得更加智能和主动。

想象一下,你只需告诉浏览器“帮我买几双白色网球袜,XXX品牌,L码”,Browser Operator 就能自动完成搜索商品、筛选尺寸、加入购物车到支付的全过程。这不再是科幻电影里的场景,而是 Opera 正在努力实现的未来。

Opera 表示,Browser Operator 的目标是解放用户,让他们能将时间投入到更有意义的事情上。无论是网购、预订机票酒店,还是收集网页信息填充表格,Browser Operator 都能成为用户的得力助手。在任务执行过程中,用户可以随时监控进度,并在需要时接管或取消任务,确保一切尽在掌控。

使用场景示例

  • 场景一:轻松网购 对于忙碌的上班族来说,网购虽然方便,但挑选商品、比价、下单也需要花费不少时间。有了 Browser Operator,用户只需简单描述需求,例如 “在 [电商平台名称] 购买最新款的 [商品类型],价格在 [价格范围] 左右,评分要 4.5 星以上”,Browser Operator 就能自动完成商品筛选、排序、加入购物车等一系列操作,最终用户只需核对订单信息并确认支付即可。
  • 场景二:信息快速收集 研究人员或数据分析师经常需要从网页上搜集信息,手动复制粘贴效率低下且容易出错。借助 Browser Operator,用户可以指定需要收集的信息类型和目标网站,例如 “从 [新闻网站] 抓取今天所有关于 [关键词] 的新闻标题和链接,保存到 [指定文档格式]”,Browser Operator 就能快速抓取相关信息并整理成结构化文档,大大提升信息收集效率。

 

Browser Operator 的用户体验

目前 Browser Operator 仍处于功能预览阶段,用户可以通过 Opera 浏览器的侧边栏和命令栏访问它。要使用 Browser Operator,只需输入你想让它为你执行的任务即可。

例如,你可以让它在网上购买商品、预订票务和活动,甚至从网站收集信息以填充到电子表格或文档中。

Browser Operator 会让你看到整个过程的进展,以及它为完成任务所采取的步骤:

Opera 推出创新 AI 浏览器代理:让浏览器更智能地服务用户-1

当你以提示词的形式向 Browser Operator 发出任务指令后,它会开始工作以完成任务,并且偶尔可能需要你的输入才能完成,这就是所谓的 “人机协作”。然后,你可以直接与网页交互,或者通过 Browser Operator 的聊天界面提供更多信息。

Opera 推出创新 AI 浏览器代理:让浏览器更智能地服务用户-2

此外,你可以随时取消 Browser Operator 正在执行的任务,只需点击取消按钮即可:

Opera 推出创新 AI 浏览器代理:让浏览器更智能地服务用户-3

最后,当整个任务完成后,你可以选择结束任务,或者向 Browser Operator 提供进一步的指示,以详细说明刚刚完成的任务。 礼貌地说声 “谢谢” 总是好的 🙂,但例如,如果你下错了订单,你可以指示 Browser Operator 取消它。 届时,Browser Operator 将理解你指的是哪个订单并为你取消它。

Opera 推出创新 AI 浏览器代理:让浏览器更智能地服务用户-4

 

立足本地,安全与效率并驾齐驱

在众多厂商探索 AI 代理技术的当下,Opera 的 Browser Operator 方案独树一帜。它采用了立足本地客户端的策略,与那些依赖屏幕截图、视频捕捉或云端服务器的解决方案截然不同。

Opera 的 AI 代理直接在用户的浏览器环境中运行,无需虚拟机或云端服务器的支持。这种本地化的运行方式,不仅最大限度地保护了用户的数据隐私,确保用户的登录信息等敏感数据不会被发送到第三方服务器,还大大提升了任务执行的效率。由于 Browser Operator 直接访问网页的 DOM 树和浏览器布局数据,它能够像人一样 “理解” 网页结构,无需像图像识别 AI 那样 “观看” 屏幕像素,从而实现更快速、更精准的操作。

更值得一提的是,Browser Operator 能够有效地处理网页中的各种弹窗,例如常见的 Cookie 同意弹窗和验证对话框,这得益于它可以与用户不可见的网页元素进行交互。这些优势使得 Browser Operator 在用户体验、安全性和效率方面都更胜一筹。

 

持续创新,Opera 的 AI 浏览器之路

Opera 一直以来都是浏览器创新领域的先锋。从最早的标签页浏览、地址栏搜索,到内置 VPN、侧边栏即时通讯工具,再到率先推出原生浏览器 AI —— Aria,Opera 不断突破浏览器的功能边界,致力于为用户提供更优质的上网体验。

在 AI 技术浪潮席卷全球的背景下,Opera 再次展现了其前瞻性的战略眼光。早在 2023 年,Opera 就率先将 AI 功能融入浏览器,并持续通过 AI Feature Drops 计划,不断迭代和完善 Aria 的功能,例如本地 LLM、图像生成、AI 标签页指令等创新功能都陆续在 Opera 浏览器中亮相。

而此次推出的 Browser Operator,无疑是 Opera 在 AI 浏览器领域的又一次重大突破。它标志着 Opera 正在将浏览器从一个工具,转变为一个能够主动为用户服务的智能代理,引领浏览器迈向 “Agentic Browsing” 的新时代。

 

预览在即,未来可期

目前,Browser Operator 尚处于功能预览阶段,用户可以通过 Opera 浏览器的侧边栏和命令栏体验这项前沿技术。Opera 计划在未来的 AI Feature Drops 计划中正式发布 Browser Operator,让更多用户能够体验到 AI 代理带来的便捷与高效。

随着 AI 技术的不断发展,我们有理由相信,Browser Operator 仅仅是一个开始。未来,AI 将在浏览器中扮演越来越重要的角色,为用户带来更加智能化、个性化、场景化的浏览体验。而 Opera,无疑将继续引领这场浏览器变革的潮流。

CDN1

相关推荐

NLR.AI:探索AI自主创作小说的创新平台与项目展示

NLR.AI是一个创新平台,展示由10个AI代理自主创作的小说项目“Terminal Velocity”。该项目通过协作实现故事生成、质量评估等功能,展现了AI在创意写作领域的强大潜力。用户可实时监控AI代理的工作,并参与讨论与贡献,深入了解人工智能意识的崛起及写作流程。

Gemini2.0发布:最新AI模型引领智能代理时代

Google发布Gemini 2.0,这是其最强大的多模态AI模型,具备图像、视频、音频等多种输入输出能力,旨在为用户提供更有用的信息和助手体验。该模型强化了长上下文理解和多步骤推理,支持复杂任务的执行。同时,Gemini 2.0推动了安全和责任性的发展,确保在AI使用中保护用户隐私和安全。更多功能如实时多模态API将帮助开发者打造创新应用,开启AI代理时代的新篇章。

暂无评论

发表评论