当前位置:首页 > 网络技巧 > 正文

智能体榜第一,纳米 AI 凭什么

简介​「2025 年会成为智能体爆发的一年」这一判断基本已经成为了行业内的共识。这一点从第三方机构 aicpb AI 产品榜的变化就...

​「2025 年会成为智能体爆发的一年」这一判断基本已经成为了行业内的共识。这一点从第三方机构 aicpb AI 产品榜的变化就可以看出。在 6 月份最新发布的 AI 产品榜上,aicpb 首次增加了智能体榜单。

令人意外的是,排名第一的并非此前大火的 Manus,也不是来自老牌搜索厂商百度,或是号称 All in AI 的字节跳动,而是 360 旗下的纳米 AI。其 156.67M 的月度 Web 访问量甚至断层式领先了第二名 Manus 近 10 倍。

智能体榜第一,纳米 AI 凭什么  第1张

要知道,此时距离纳米 AI 超级搜索正式发布还不到一个月。纳米 AI 超级搜索是如何做到异军突起的?

01 

智能体时代:让 AI 从「给你答案」

变成了「交付结果」 

当我们从网上获取信息时,大多数人脑海中浮现的仍然是那个熟悉的画面:输入关键词,获得一串链接,然后再自己手动分析、筛选、整理,时常还找不到想要的答案。

这是传统搜索引擎时代。关键词稍有不同,显示出来的结果也大相径庭,也就无法真正理解用户的需求。同时,因为竞价排名的广告模式,内容总是被点击率所裹挟,很多所谓「标题党」的信息往往排名更靠前,信息需要用户筛选掉大量无关信息。

ChatGPT 的出现改写了这种信息获取的方式。用户可以直接获得一个相对精准的结果,获取信息的方式从「检索、遍历」进化到了「直接获取结果」。

智能体的出现,标志着 AI 生产力落地的又一次范式转化。智能体带来的最大变革,是让 AI 从「给你答案」变成了「交付结果」。系统不再只是给出一个答案,而是可以自动调用工具执行用户的复杂需求,直接给出一个交付结果。例如输入「优化公司财报」,它不再是教你怎么做,而是直接生成一份专业的财报优化方案。

智能体榜第一,纳米 AI 凭什么  第2张

AI 智能体、AI 助理、聊天机器人的区别 

具体而言,一个合格的智能体通常需要具备以下特征:

1、自主性:在最小人工干预下独立运行,具备自我驱动的执行能力。

2、环境感知:通过多种接口实时获取环境状态信息,并理解上下文变化。

3、推理规划:基于目标进行任务分解,制定多步骤执行策略和资源分配方案。

4、适应学习:从执行反馈中提取经验,动态调整行为模式和决策策略。

5、工具集成:主动选择和组合外部工具/API,扩展自身能力边界。

6、状态管理:维护短期工作记忆和长期知识存储,支持上下文连续性。

7、目标导向:围绕明确目标进行行为选择,具备结果评估和纠偏能力。

8、多模态交互:支持自然语言、API 调用等多种交互方式,具备协作能力。

一句话总结就是,真正的智能体应该具备「感知→推理→规划→执行→反馈→优化」的完整闭环能力,而不仅仅是高级版本的问答系统。

整体而言,智能体目前仍处于早期阶段。海外市场方面,巨头如微软、谷歌、OpenAI 都在开发自己的智能体产品,例如 OpenAI 最近推出的 ChatGPTAgent,大致覆盖了上述特征。而在与大家更相关的国内市场,manus 和纳米 AI 可以说是跟进最早的玩家。

02 

两个场景,看懂纳米 AI 的能力 

为了更好地理解纳米 AI 智能体的能力,我们挑选了两个典型的用户场景。

首先是「一句话生成长视频」,例如告诉纳米 AI,让它生成一条上海城市的宣传片。

智能体榜第一,纳米 AI 凭什么  第3张

「一句话生成长视频」过程

面对这样一个复杂任务,纳米 AI 其实把整个流程拆解成了「输入信息、整理文案、生成分镜脚本、文生图、配音、图生视频、添加配音字幕、视频拼接、获取 BGM、添加 BGM」等环节。

每个任务由不同的智能体完成,整个视频是一个多智能体组成的工作流。看起来用户只说了一句话就得到了一个视频,但实际上支撑纳米 AI 完成这个复杂需求的是个智能体团队。

例如在最开始的信息检索阶段,就调用了超级搜索智能体,检索出了 30 个搜索结果,并以此为基础形成了这支上海城市宣传片的文案和分镜脚本部分。

智能体榜第一,纳米 AI 凭什么  第4张

纳米 AI 生成的分镜脚本(部分),可以看到很好的把握了上海的代表性元素 

以分镜脚本为基础,纳米 AI 又调用了图片生成智能体,形成了多个上海的代表性画面作为分镜图片。

智能体榜第一,纳米 AI 凭什么  第5张

纳米 AI 调用文生图智能体 

值得注意的是,纳米 AI 最终产出的视频长达两分钟,一条视频能消耗 1000 万左右 token,以 AI 生成视频的标准来说这个长度相当夸张。业界具备类似长任务的执行能力的智能体非常少。同时,它有连贯的逻辑以及接近摄影实拍的视频画面,配音、BGM、字幕这些正常视频的各种要素也全都具备。即使拿「人类作者」的标准看待,这也是一个相当成熟的视频。

以下视频来源于大狐 AI

过去制作一条视频,往往要经过「文案-分镜-拍摄/绘图-剪辑-后期」这样一整套工作,涉及策划、美术师、剪辑师等,不同工种耗费数个工作日才能协作完成。

但是现在,泡一杯咖啡的时间,纳米 AI 就能生成一个成熟的长视频。AI 生成视频,在此刻真正做到了有用。

另一个场景是处理复杂的研究型问题,以「分析人工智能对就业市场的影响」为例。

智能体榜第一,纳米 AI 凭什么  第6张

纳米 AI 深度研究过程 

令人惊讶的是,在输入需求之后,纳米 AI 并没有一味执行任务,而是主动要求进一步补充需求的具体细节。这体现了纳米 AI 的「搜商」,能够像人类一样在思考,主动发起交互、补足思维链。

智能体榜第一,纳米 AI 凭什么  第7张

纳米 AI 主动要求明确需求 

在生成结果的关键节点,纳米 AI 也会主动发起询问,以更好地匹配用户需求。这份提纲包含了现状分析、趋势预测、政策建议、和最后的结论,从结构上来说,十分完整。

智能体榜第一,纳米 AI 凭什么  第8张

最终,纳米 AI 超级搜索在十几分钟内就生成了一份包含数据图表、趋势分析、政策建议的综合报告。

过去,研究者需要从多个信息源收集资料,然后进行人工分析和整合,往往要耗费几天甚至几周的时间。而现在,在短时间内,所有人就能快速了解一个复杂问题的基本面貌。

智能体榜第一,纳米 AI 凭什么  第9张

报告不仅是文字,也包含图表、图片等多模态信息 

不仅如此,这份最终生成的报告还可以转换成 PDF、Word、思维导图、PPT,甚至是动态网页,形成了从资料搜索、生成分析到结果演示的完整闭环。

智能体榜第一,纳米 AI 凭什么  第10张

纳米 AI 生成的动态网页 

值得注意的是,纳米 AI 在报告最后还列出了 36 个参考文献的链接。对于复杂的研究型问题而言,这一点非常有必要,研究者可以很方便地作进一步的研究和查证。

智能体榜第一,纳米 AI 凭什么  第11张

纳米 AI 列出的参考文献链接(部分) 

在整个生成研究的过程中,纳米 AI 自主跑完了一整个流程,直接完成了交付。甚至在用户需求不明确时,它还会主动发起交互,补足思维链。从 AI 2.0 时代的「告诉你怎么做」,到纳米 AI 的「直接交付多模态的结果」,这是一整套范式的转变。

实际上,要让 AI 自主完成一件复杂任务并不是一件容易的事,背后有非常复杂的对技术路径的先验思考和巨大的技术投入。

其中,多模型协作架构是纳米 AI 最令人印象深刻的技术特点之一。纳米 AI 接入了 80 多个模型,并根据不同任务需求进行智能调度。

正是有了这样的模型基座能力,才实现复杂任务下的超长思维链。

纳米 AI 在 MCP(Model Context Protocol)工具生态建设上也投入了大量资源,专为国内环境自研了许多 MCP。有人把 MCP 比作大模型的 USB-C 接口。正如 USB 标准化了硬件接口,MCP 也为大模型的标准化接口,使得其能够连接到各种外部数据源和工具,解决了「AI 可用」的问题。

目前纳米 AI 已接入 110+工具,覆盖办公协作、学术研究、生活服务、搜索引擎、金融分析、媒体娱乐、数据抓取等多个领域。在上文的「一句话生成长视频」中,比如文案生成智能体,就调用了 AI 搜索、图片转文字、音视频转文本、 AI 文档分析等多个 MCP 工具。

纳米 AI 智能体还实现了对本地浏览器的调用能力,可以识别网页上的所有的可点击元素,让大模型像人一样去操作浏览器。

这么做的好处是什么呢?

信息孤岛的问题就被解决了。这是个由来已久的问题,各家互联网公司出于商业考量,并不允许谷歌、百度这类搜索引擎抓取信息。但是有了对浏览器的调用能力之后,它就可以像普通用户一样「正常访问」这些平台,获取其内部的深度信息和实时数据。

拥有了这样的能力,纳米 AI 就可以深度挖掘小红书的旅行攻略和购买建议;直接对比多个电商平台的商品,找到最低价;或者是获取社交媒体上的最新趋势和用户反馈。

智能体榜第一,纳米 AI 凭什么  第12张

纳米 AI 突破信息孤岛,检索小红书内容,生成选购建议

03 

AI 下半场,加速 AI 效用的生产落地 

LnData 的报告指出,2024 年底全球智能体市场规模已突破 500 亿美元,年度增长率超过 200%。头豹研究院对智能体的增长也持乐观态度。它预测,智能体行业市场规模将从 2024 年的 695.28 亿人民币增长至 2028 年的 8520.35 亿人民币,年复合增长率高达 87.10%。

如此巨大的市场潜力,自然吸引了 OpenAI、谷歌、微软等科技巨头,以及字节跳动、阿里、腾讯、百度等国内大厂的全面加码。

就在 7 月 17 日深夜,OpenAI 正式发布了 ChatGPT Agent,这个被业界期待已久的智能体终于姗姗来迟。和 ChatGPT 初次发布的那种惊艳不同,舆论对 ChatGPT Agent 有些两极分化。

支持者认为这标志着 AI 从「对话式 AI」向「任务执行型 AI」的转变。

反对者则认为 ChatGPT Agent 的发布更像一次「补课」而非「创新」,因为其展示的核心能力,例如多步骤任务规划、工具调用、上下文记忆,这些在国内已经不是什么新鲜事了——Manus 和纳米 AI 早在几个月前就已经实现了类似的功能。在某些方面,例如可视化生成,纳米 AI 甚至展现出了比 ChatGPT Agent 更好的能力。

整体而言,ChatGPT Agent 确实没有表现出超越国内智能体的能力。这其实反映了一个更深层的问题:AI 领域的技术护城河正在快速缩小。OpenAI 的生态整合能力和产品化水平依然值得学习,但纯粹从智能体能力来看,国内外的差距确实在快速缩小,某些细分领域甚至已经出现了反超。

智能体的终局尚未可知,但是在特定领域逐步发挥作用、成为提升工作效率的重要工具,的确是一条可预见的迭代路径。真正的挑战在于如何找到合适的应用场景,构建可持续的商业模式,并在技术创新和用户需求之间找到平衡点。毕竟,技术再牛,用户不买单也是白搭。

在 AI 下半场的激烈竞争中,纳米 AI 走出了一条独特的差异化路线——它没有选择与巨头们正面硬刚通用型超级智能体,而是选择成为智能体生态繁荣的基础设施搭建者。

周鸿祎对纳米 AI 的愿景很明确——将纳米 AI 打造成最大的「智能体社区」。

从数量上看,纳米 AI 目前已经拥有近万个专业智能体,覆盖不同行业和场景的业务需求。用户面对具体问题时,只需输入需求描述,平台即可匹配对应的专业智能体,实现从需求到解决方案的快速连接。

平台的价值不仅在于丰富的智能体资源,更在于其灵活的组合能力。在纳米 AI,如果你的任务需求过于复杂,用户还可以调用多个智能体、组建多个智能体协作的团队,通过任务分解和流程优化,实现更高效的问题解决。这种团队化协作模式,为个人和小团队提供了以往只有大企业才能享有的专业服务能力。

如果多智能体协作还不能解决你的问题,纳米 AI 的「360 智能体工厂」,还提供了低门槛的智能体搭建平台。通过自然语言交互,用户无需编程技能即可创建符合特定需求的智能体。这种零代码创建方式,让智能体的定制化变得简单高效,真正实现了「人人都能造专家」的愿景。

周鸿祎表示,AI 时代为每个人、每个组织都带来了前所未有的机遇,每个人都可以拥有三五十个智能体,形成自己的专家队伍,这些智能体听你指挥,替你干活,每个人都有机会成为超级个体。

AI 下半场,叙事逻辑从技术炫技逐步走向「效用落地」,从追求技术先进性转向追求解决问题的有效性,这才是 AI 的价值回归,真正变成普通人的生产力工具。

纳米 AI 在榜单上的排名可以视作是一个阶段性的成果。断层领先第二名近 10 倍,这并非偶然,背后反映的是使用智能体这一产品形态的强烈市场需求。

当所有人都在谈论 AGI 的终极目标时,纳米 AI 已经在实际应用中交出了答案:AI 的价值不在于有多「智能」,而在于能为多少人解决多少问题。

可以预见,智能体这场战役并不好打,但纳米 AI 已经早早入局,并握了一副好牌。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。