哈啰AI布局:大模型时代服务升级

在2024年的Inclusion·外滩大会上,哈啰集团宣布已经构建了全面的AI布局,以迎接大模型时代的到来。如同黑马一般,哈啰在智能时代脱颖而出,其服务版图从最初的单车扩展到如今的本地出行及生活服务平台。

哈啰在技术探索的征途上,通过构建基于向量数据库的RAG(Retrieval-Augmented Generation)应用,不断强化业务效能。大模型应用,如海螺机器人、交易机器人、光子引擎、贾维斯幻视大模型平台等,均已实现落地应用,不仅能够有效提升内部效能和客户体验,也推动了整个行业的数字化转型和智能化升级。

RAG技术,即结合检索(Retrieval)和生成(Generation)的自然语言处理技术,通过检索相关信息来增强语言模型的生成能力,已被哈啰应用于智能客服、内部问答系统等多个领域,用于内容推荐和召回等任务。

在哈啰的技术体系中,向量数据库扮演着日益关键的角色,并在多个业务场景中展现出巨大潜力:

- 智能客服平台:提升哈啰服务效率
- 海螺机器人:内部提效平台的智能化升级
- 图像比对:智能报障与运维管理
- 数字人直播:智能问答提升互动体验

哈啰的技术之旅,就像是一场探险,但每一步都在考究而踏实地前进。

哈啰最初采用Elastic Search(ES)处理数据,但随着业务的扩展,ES在语义理解和精确召回方面的局限性逐渐暴露。面对这一挑战,哈啰开始寻找更有效的解决方案,在对比了多个产品后,包括向量插件产品、NoSQL数据库和专门的向量数据库,哈啰发现专门的向量数据库更为高效。

在测评中,Milvus更是以其出色的召回效果和性能赢得了哈啰的青睐:

- 性能优势:Milvus在数据写入和索引构建速度上是ES的近100倍,提供了卓越的查询性能,对于实时性要求高的问答RAG应用而言,性能瓶颈得以突破。
- 社区支持与文档完整性:Milvus作为一个成熟产品,拥有强大的社区支持和持续的技术更新,为哈啰提供了稳定的技术支持。

随着业务的飞速扩展,一次由于ETCD故障引发的宕机事件打破了这种平衡,自建Milvus集群的不足之处亦开始显现:

- 自建Milvus集群的运维成本较高,学习曲线陡峭。
- 业务稳定性难以保证。

这些挑战最终坚定了哈啰构建Zilliz + Milvus双集群的决心,以进行故障转移、负载均衡和多租户支持的目的,而事实也证明,云上的日子更美好!

Zilliz Cloud自研Cardinal索引算法比云厂商RAG和开源向量数据库产品性能(QPS)提升10倍以上;

在数据管理效率上,Zilliz Cloud的多Partition设计使得哈啰的数据管理更加高效,通过将相似的数据存储在同一个Partition中,哈啰简化了数据管理流程,提高了数据检索的速度;
而且99.95%的SLA保障了业务在迁移完成后不再出现宕机等影响业务的事故。Zilliz Cloud的稳定性使得哈啰的运维团队可以专注于业务开发,而不是基础设施的维护。这大大提高了运维效率,降低了故障率。

业务流量的波动促使哈啰需要灵活调整资源。Zilliz Cloud的弹性扩容功能使得哈啰能根据业务需求快速调整资源,增强了业务灵活性。“在Zilliz Cloud上,我们只需调整配置,即可快速扩容,非常方便。”哈啰工程师郑工如是说道,这使得业务在高峰时能迅速扩展资源,在低谷时快速回收,实现资源的最优利用。

迁移至Zilliz Cloud后,扩容和缩容操作变得异常便捷,运维负担大幅减轻,从而实现了多方面的成本控制。Zilliz Cloud 发布的弹性伸缩功能(Auto-scaling)实现了根据实时用量动态调整集群容量,能够防止因资源不够而导致的禁写,并帮助开发者降低运营成本。

郑工表示采用Zilliz开发的迁移服务使得从Milvus向Zilliz Cloud的整个数据迁移过程非常便捷顺畅。据悉,迁移服务专为处理大规模向量数据迁移而设计的高性能操作。目前,Zilliz Cloud 支持从多种外部数据源(如 Milvus、Elasticsearch 和 pgvector)迁移数据,也支持同组织或跨组织间的 Zilliz Cloud 集群迁移,以实现高效的数据集成和管理。

技术不仅是业务突破的引擎,业务需求也是技术迭代的催化剂,这样的良性互动在哈啰的发展历程中持续发酵。向量数据库作为技术革新的重要组成部分,为哈啰在大模型时代的自我进化提供了强大动力,同时也为其在智能出行领域的持续创新和保持技术领先地位提供了坚实保障。

相关推荐

暂无评论

发表评论