纽约的人工智能团队Nous Research,因致力于打造“个性无限”的语言模型而知名,近期又带来新动态——全新模型推理API的发布。此举标志着这家以自由不羁著称的AI机构,开始将自家引以为傲的语言模型,以程序化接口的方式,提供给更广泛的开发者和研究人员。

QQ_1741832058993.png

无拘无束的模型

Nous Research凭借对OpenAI和Anthropic等大型AI公司“框架”的挑战而备受瞩目。他们的口号洋溢着“自由主义”的气息。如今,他们终于将这种“自由”封装成API,让更多人得以体验。

首批API包含了两大明星产品:一个是基于Meta Llama3.1架构的重量级通用模型Hermes3Llama70B,另一个则是他们上个月发布的,能在标准回复和详细的“思维链”(Chain-of-Thought,CoT)之间灵活切换的推理模型DeepHermes-38B Preview。这无疑为开发者提供了“豪华版”和“经济型”两种选择。

然而,要体验这份“AI快递”并非易事。Nous Research设立了先到先得的候补名单系统**。同时,为了安抚排队用户,他们还为每个新账户提供了5美元的免费额度。

这种做法一方面是技术层面应对潜在需求高峰,毕竟与那些资金雄厚的大厂相比,Nous在GPU资源上可能较为有限。

另一方面,这种“限量供应”也是一种巧妙的营销策略,营造出一种“稀缺感”,激发人们对他们的好奇心。

有趣的是,这个看似特立独行的Nous Research,在API设计上却选择了与OpenAI的API设计模式保持一致,包括 completions 和 chat completions 接口。

这对于已经熟悉OpenAI接口的开发者来说,实现了无缝对接,可以轻松将Nous的模型集成到他们的应用中。这也体现了Nous在坚持自身理念的同时,也展现了务实的商业考量。毕竟,方便用户才是关键。

从“免费下载”到“付费部署”的商业转型

仅四个月前,Nous Research刚刚推出了他们的首个用户界面聊天机器人Nous Chat。在此之前,他们专注于发布开源模型,供用户在本地部署。

以前用户需要自行下载代码并在本地运行模型,这不仅耗时费力,还可能涉及不菲的成本。而现在,开发者可以直接通过API使用高性能模型,无需再为基础设施烦恼。这标志着Nous Research从纯开源模式向可持续商业模式的重要转变。

此次API的推出,体现了Nous Research在坚持开源原则的同时,探索商业化道路的努力。他们在公开模型权重的同时,通过商业化部署来获取收入。这就像在走钢丝,既要保证“自由”的灵魂不受束缚,又要让“身体”健康地生存。

这种混合模式旨在吸引不同用户群体:个人开发者和研究人员可以免费下载和运行模型,而追求可靠性、便捷性和性能优化的企业则可以选择付费使用API。

随着时间推移,Nous Research表示他们的推理服务将不断扩展,可能会纳入更多特色模型,如擅长函数调用的Hermes2Pro,以及他们的Psyche项目。对于基于开源模型进行创新的人工智能初创公司来说,Nous Research的API提供了一个新的选择,打破了现有格局,可能加剧AI推理领域的竞争,并推动技术进一步发展。

入口:https://portal.nousresearch.com/login