12月30日,支付宝全新发布AI视觉搜索工具“探一下”,依托自主研发的多模态大模型技术,让用户能“用AI之眼洞察万物”,提供更加迅速、实用且有趣的搜索服务。
用户对感兴趣的事物只需通过摄像头,AI就能识别花草宠物、潮玩,提供旅游讲解、商品药品详情查询等功能,还能解读萌宠照、宝宝照等,晒图再也不用担心文案问题。目前,此产品已在支付宝上线,首页点击“扫一扫”后左划即可找到,支小宝App也能轻松访问。
自2024年以来,支付宝陆续推出“支小宝”等AI独立应用及智能体开发平台,此次聚焦AI视觉多模态领域推出“探一下”,标志着以支付宝为核心的蚂蚁AI战略正稳步推进。
赋予AI视觉,探索周边世界
近年来,生成式人工智能迅速发展,多模态技术正让视觉成为数字服务的新入口。支付宝推出“探一下”,旨在让AI成为大众的“好奇心之眼”,帮助其探索周遭万物,实现AI识图即可搜索、创作、互动。
与传统的AI视觉搜索产品不同,“探一下”通过AI识图更快地输出有用信息,并能基于用户兴趣和场景的深度理解,提供更有趣的视觉解读和更多元的服务。
体验发现,“探一下”目前提供探知识、探灵感、探文本三大核心服务。
当遇到难以用语言描述的事物时,通过“探知识”实现AI随手识图,随时获得新知。
例如,喜爱户外旅行的人士,遇到不认识的花草、昆虫、美食、建筑、展览物品等,就能轻松获取相关信息,享受“智能导游”的便捷。
年轻人对喜欢的手办潮玩,通过它可查阅种草攻略;父母也能用它辨别68种奥特曼,避免孩子提问时不知所措。
网友用“探一下”识别奥特曼
遇到不懂的外文商品,探一下即可获取详情,方便线上购买;家中丢失说明书药盒,也能查到详细介绍,并咨询支付宝旗下的“AI健康管家”了解更多用药须知。
基于生成式AI的特性,“探灵感”能根据场景触发智能视觉滤镜,实现AI趣味解读,晒图不再为文案发愁。
例如,养宠物的“铲屎官”可为萌宠拍照并定制“读心物语”,让毛孩子开口说话更温馨;热衷在朋友圈晒娃的父母,也能让AI解读自己对孩子的爱意。
此外,在国外旅行或学习外语时,遇到看不懂的外文菜单、招牌等,也可以通过“探文本”便捷识别原文并翻译。
革新AI视觉搜索,支付宝AI持续加速发展
过去,搜索主要通过关键词匹配来返回相关结果。作为新一代的生成式AI视觉搜索产品,“探一下”提供的不仅是简单的搜索链接,而是基于多模态大模型的视觉理解与创作能力,提供更智能、更丰富、更具交互性的服务体验。
相关数据显示,人类获取的信息超过80%来自视觉,以视觉为中心的人工智能产品,可极大降低人与AI交互的门槛,并解锁更多的AI应用场景,实现“所见即搜索,所见即服务”。在国外,谷歌推出的Google Lens每月有超过200亿次的视觉搜索调用量;苹果也在今年推出名为“视觉智能”的新功能,通过手机摄像头帮用户“即时了解所见的一切”。
作为承载数亿用户的数字生活开放平台,此次支付宝推出AI视觉搜索产品“探一下”,并将其内置在“扫一扫”的核心入口内,正是希望通过持续创新,让AI像扫码支付一样便利每个人的生活——不仅大脑能对话、手脚能办事,更有眼睛能探索周边世界。
支付宝AI产品密集落地的背后,是蚂蚁集团AI First战略的全面加速。2023年11月,蚂蚁推出自研的百灵大模型,今年9月以来,又陆续上新支小宝、蚂小财、AI健康管家三大AI应用及智能体开发平台“百宝箱”,加速构建开放的AI服务生态。
暂无评论