Manus会开启Agent元年吗?和大厂离职的两位AI创业者聊了聊|微软|agent|知识库|编程|调用

文章编号:81 最新资讯 2025-04-18 微软 agent 知识库 创业者 编程 调用

用微信扫码二维码

Manus会开启Agent元年吗?和大厂离职

分享至好友和朋友圈

出品 | 网易科技态度栏目

像一颗巨石投入湖水,Manus发布溅起的水花虽已逐渐退去,但激起的涟漪还在不断扩散。

Manus会开启元年吗?怎么理解Agent及其壁垒?当前是不是Agent的发展机会点?不同玩家如何迎接Agent的浪潮?当前Agent能代替实习生吗……

3月8日,网易科技邀请了两位大厂离职,在 AI 创业一线的嘉宾——李博杰和彭康伟,分享他们的判断与思考。

李博杰,华为“天才少年”出身,曾任华为计算机网络与协议实验室副首席专家,学者奖得主。2023年投身AI创业,目前是 PINE AI 首席科学家,致力于为每个人和每个组织构建类似《Her》 里面 Samantha 的通用智能助理。

彭康伟,曾在腾讯0-1打造过月活破亿的C端产品,2023年离职创业,成立梦马智能,正在做新一代的AI内容平台。

作为AI浪潮下的,他们如何在巨浪中寻找方向?透过他们的视角,又能看到一个怎样的Agent未来?网易科技整理了他们对十个关键问题的回答。

李博杰:Agent 的概念其实非常早,早在上世纪60年代人工智能刚出现时,就已经有了 Agent 的概念。Agent 的本质其实很简单,就是它是一个中介或者说代理。Agent 能够感知世界,并基于感知进行规划,然后采取行动。

在如ChatGPT的传统ChatBot 里,用户输入一个问题,系统给出一个答案,问答结束。但 Agent 不一样。你把一个任务交给Agent后,它不仅会回答,还会主动收集各种资料,利用周围的各种资源,最终帮你把事情办成。这就是ChatBot和Agent 的核心区别。

比尔·盖茨其实很早就看重这个方向。我在微软工作的时候,Office 2003里就有一个小回形针助手(Clippy),它会弹出来问你需要帮助吗?这其实就是早期探索 Agent 的尝试。但当时 AI 技术不成熟,最终在 Office 2007里就取消了。

后来像 Cortana、Siri 之类的助手,也可以看作是早期的 Agent,能帮用户完成一些小任务。再往后发展,现在的 Agent(比如 Manus)真的可以帮助用户完成长时间、复杂的任务,甚至长达半小时到一小时。

Agent 的神奇之处在于它具备“脑、手和交付”三种能力:LLM 提供认知和思考能力,相当于 Agent 的“脑”;Agent 的“行动”能力体现在它能调用浏览器、搜索信息、执行指令等,相当于它的“手”;而“交付”能力则体现在它最终能给出完整的成果,不管是文档还是网页展示。

在 Manus 的界面中,你可以清楚看到它的工作过程:左边是它的浏览和操作记录,右边是它的思考过程。最终,它还能以文档或网页的形式完整地展示成果。对于实际业务来说,这种能力的价值非常高。

二、Manus为什么能够出圈?

李博杰:我觉得 Manus 出圈主要有两个原因。一方面,媒体的传播确实给了他们特别大的影响力。

另一方面,我觉得 Manus 的设计也很巧妙。它通过展示电脑操作过程,让普通用户更容易理解 Agent 的工作原理。以前很多产品会隐藏中间的操作过程,直接呈现最终结果。但 Manus 不一样,它直接用屏幕动画一步步展示操作过程,比如如何浏览网页、执行任务。

虽然这种“视觉操作”方式在效率上可能不如直接访问网页,但展示效果更直观,让用户更容易理解 Agent 的实际能力。

彭康伟:补充一下,我觉得Manus 之所以能出圈,是因为它是第一个提出“通用型 AI Agent”概念的产品。

以前有不少优秀的工具能帮助开发者写代码,但 Manus 将 Agent 的能力扩展到了更广泛的领域,让普通人也能使用它来完成各种任务。这是它的第一个亮点。

第二个亮点是 Manus 的工程能力提升明显。以价格比对任务为例:在电商场景下,要找到最优价格,需要检索大量信息,涉及不同的供应链和成本结构。Manus 能够整合这些复杂的信息,进行多层次的检索和分析,最终给出最佳方案。

这种跨场景、跨领域的通用能力,正是 Manus 与早期 Agent 产品的最大区别。

彭康伟:我觉得从技术角度看,Agent 的本质其实可以用刚刚“手”和“脑”来比喻。大模型相当于“脑”,而“手”就是调用各个网页和工具的能力。从技术上讲,复现这种交互能力其实并不难。

但真正的壁垒在于实现每个具体场景下的工程部署和优化。比如,面试、电商、编程等具体场景中,前后端的联调部署和代码集成都需要大量的工程工作。这种在不同场景下的定制化实现,才是建立壁垒的关键。

李博杰:我非常同意康伟的看法。Agent 的核心挑战不在于调用大模型或开放接口,而是能否在专业领域中积累工程经验。

对于通用任务,比如规划一份日本7日游行程单,Agent 可能表现很好。但在专业领域,比如医疗,Agent 需要具备专业知识和领域积累,而这些知识可能并不在公开语料中。因此,单靠通用模型的数据集,可能无法满足专业需求,仍需进行特定的微调和后训练。

此外,复刻别人已经完成的东西,其实是一个下限很低,上限很高的事情。比如我在用 Manus 做调研报告时,发现 OpenAI 的模型效果往往优于 Manus,因为 OpenAI 可能使用了自己未公开的模型,经过专门针对调研场景的后训练优化。Manus 团队目前无法打造出这种规模的专有模型,因此只能在开源模型基础上做调优。

即便有开源解决方案,比如 Owl 等的开源模型,但由于工程调优的能力不足,其实效果仍然与 Manus 有差距。

四、Manus未来如何盈利?发展方向?

彭康伟:从 Manus 团队之前做 Monica 的经验来看,他们在浏览器和插件领域积累了大量用户和使用场景,具备对用户需求的深刻理解。因此,打造一个“入口级”产品可能是一个合理的方向。

“入口级”意味着像抖音、微信这样的平台,吸引大量用户并建立生态。比如,打造一个类似 GitHub Copilot 的 Agent 平台,允许用户上传和共享专业领域的 Agent——比如电商、教育、法律等领域的细分 Agent。这不仅能够满足具体需求,还能通过用户和开源社区的力量,形成良性循环,完善整个生态。

即便 Manus 无法成为入口级产品,当前的市场热度也会推动开源生态的发展,让更多人将 Agent 技术应用到各行各业,创造真正的商业价值。

李博杰:我也认为打造入口级产品是最大的机会。但对于我这种资历更浅的创业者来说,直接挑战大厂和成熟产品并不容易。因此,更现实的路径可能是专注于客单比较高的垂直领域,打造高附加值的行业解决方案。

一些垂直领域客户对 AI 赋能有强烈需求,但自身技术储备不足。这就为 Agent 在行业场景中的落地提供了空间。此外,垂直领域的用户往往能承担更高的使用成本。

比如,当前 Manus 的模型推理成本较高,一次执行可能需要2美元以上。如果是日常使用,每天用5次就要花10美元,个人用户可能难以负担。但对于法律、金融等高附加值行业,AI 赋能后的增值足以覆盖这部分成本。因此,Manus 在商业化上可能更适合面向高附加值领域。

五、当前是不是Agent发展的机会点?

彭康伟:我认为当前确实是 Agent 发展的重要时机。Agent 早就出现了,但由于模型能力有限,加上调用成本高,之前的发展受到了限制。

但随着模型和推理技术的优化,以及调用成本的不断下降,Agent 的应用场景也变得更为广泛了。

李博杰:我补充一下。除了成本降低,模型能力的提升也是关键因素。早期的模型在面对复杂任务时往往很“笨”,即使配备了工具(如搜索网页、发邮件、计算器等),模型可能也不知道如何正确使用。

但今年的新模型,比如国内的 DeepSeek 等,已经解决了这一问题。模型在不确定时,能够主动调用外部工具,做出更可靠的判断。

此外,模型在解决复杂任务时的稳定性也在提升。假设某个任务需要10个步骤,每一步的准确率从90% 提升到99.9%,整体成功率就会从35% 提升到90%以上。这个稳定性提升,使得 Agent 在商业环境中的可用性大幅增强。

这正是为什么大家普遍认为2025年是“Agent 元年”。之前的模型太慢、太笨,难以满足实际需求。而今年的模型在推理速度、调用工具的能力和稳定性上都有了突破,才让 Agent 真正具备了广泛落地的条件。

目前,Agent 在编程领域的应用已经较为成熟,我认为今年这种能力会扩展到更多行业,真正实现跨领域应用。

六、模型能力提升会覆盖掉Agent能力嘛?

李博杰:我自己的感觉是会的。我理解这个问题是说,一些Agent通过精细调参或策略优化形成的功能性提升,是否会被更强的模型能力取代。比如,Manus 其实现在就是一个典型的“多 Agent 系统”,其中不同的 Agent 负责搜索、写代码、操作电脑等。

在过去,我们通常会基于人类的工作流程来设计 Agent,比如让它们先做 A,再做 B,这样可能效果更好。但如果模型能力提升,很多这些基于工程优化的 Agent 可能就不再需要。

我自己就吃过这个亏。之前在某个项目上做了很多优化,结果新模型一出来,之前做的精细化工程全都被淘汰了。我猜康伟在创业过程中可能也有类似的经历。

但从技术发展的角度看,功能性优化仍然有价值。因为未来每个人都能获得同样强大的模型,谁能在模型的基础上做出更好的工程优化,谁就能占优势。

彭康伟:我觉得这可能要分短期和长期来看。

长期看,很多技术团队和算法团队都认为,最终模型能力会覆盖掉 Agent 的能力。因为从人的意志出发,我们自然希望模型能够发展得足够强大,最终实现这一目标是大概率事件。

短期看,工程化优化仍然是必要的。我们在创业中所交的“学费”或“代价”是必须的,因为短期内模型不可能快速覆盖所有具体的行业场景。因此,做好工程化优化,既能形成壁垒,也能让产品更好地服务用户。

举个例子,这波大模型出来后,之前在 NLP 和 CV 领域积累丰富经验的公司,会更容易快速应用大模型,结合行业壁垒和经验,形成竞争力。

七、中小企业如何迎接Agent浪潮呢?

李博杰:如果是初级企业,对 AI 了解不多,可以先用低代码(low-code)工具或 DFI 系统,搭建基础的知识库,然后在此基础上构建一个简单的 Agent。低代码工具通过拖拽的方式,能快速搭建出 Agent 系统。

如果是有一定技术积累的公司,可以尝试“后训练”(fine-tuning)的方法,把行业知识和经验融入模型中。

这种方式相当于把知识“内化”到模型中,而不是每次都依赖知识库去查询。内化让模型知道大致的方向,但在面对具体问题时,仍需要借助知识库来确认细节。

企业在搭建知识库时,检索能力至关重要。比如,谷歌的搜索效果明显好于必应,就是因为谷歌基于用户反馈和排序算法,能更好地保证搜索结果的相关性。企业在搭建知识库时,也要注意优化检索算法,提升相关性和用户体验。

八、Agent发展是大厂游戏吗?

彭康伟:我觉得这个问题对创业者来说其实没那么严峻。Agent 本质上是为具体行业和产品服务的。

首先,Agent 不是终点,而是加速产品和服务的工具。其次,产品能否成功,更多取决于市场和用户反馈,而不是 Agent 本身的技术水平。

大厂虽然有资源,但它们不会做所有事情。我想说,大家也不必觉得过于焦虑,其实我们能做的事情很多,大厂的射程也是有限的,不然也不会出现那么多的上下游的公司,所以创业公司能做的事情还是有很多的。

李博杰:康伟说得很好。因为我也在大厂待过,我能感受到大厂往往在创新性产品上比较谨慎,只有当成本降低、准确度提高,产品成熟到“用户用了不会出错”时,才会推出。而创业公司没有这些顾虑,可以更灵活地迭代和试错。

比如,在 AI 辅助编程领域,微软等大厂可能早有原型,但因为担心破坏现有商业模式或成本过高而未发布。这就给创业公司留下了空间。

九、Agent元年的标志性会是什么?

李博杰:我自己感觉标志性事件可能会是一个能够综合调用视觉、听觉、语言等多种模态,能独立使用电脑、手机,甚至打电话,帮助用户完成日常任务的产品。如果这种能力在2025年实现,我觉得就可以称为 Agent 的元年。而且我也希望我能够做出来这件事情。

对于 AI Agent 而言,我认为它涉及两个核心层面:一个是多模态理解。就像刚才提到的,Agent 能够同时理解和处理视觉、听觉、语言等不同模态的信息。

另一个是多任务协同。这涉及我们所谈到的各种 Agent 场景,不论是在电商、制造、金融,还是在编程领域,Agent 都能高效完成任务并交付成果。

关键不只是完成任务的动作本身,而是在没有人类干预的情况下,能够高质量地完成任务交付。这与实习生完成任务不同,实习生在执行过程中可能会出错,需要人来纠偏(无论是目标上的调整,还是行动上的修正)。但 AI Agent 的目标,是在无需人为干预的情况下,自动调整并交付高质量的结果。

从这个角度看,我也很期待 AI 在任务交付和目标达成上的“智能涌现”时刻,这将标志着 AI 在任务理解和执行效率上,真正达到新的高度。

十、Agent当前能替代实习生吗?

李博杰:其实问题的关键还在于“记忆”。目前的 Agent 仍然停留在“事实性记忆”层面,比如“今天吃了什么”这种简单信息。但涉及“过程性记忆”(比如骑自行车的动作记忆),AI 仍然很难做到。

目前,基于知识库、检索和总结的方法,效果还是不如人类的记忆。AI 如果无法解决“记忆”问题,就无法真正替代人的长期学习能力,就相当于一个实习生在这个公司里干了一天和干了一年没有区别。

彭康伟:在特定领域(比如编程),Agent 已经可以替代部分实习生的工作。企业可以通过使用 Agent,或者让每位正式员工“带几个编程 Agent”,来实现降本增效。

在重复性、流程化任务中,Agent 的确有助于提高生产力。

出品 | 网易科技态度栏目

二、Manus为什么能够出圈?

四、Manus未来如何盈利?发展方向?

五、当前是不是Agent发展的机会点?

六、模型能力提升会覆盖掉Agent能力嘛?

七、中小企业如何迎接Agent浪潮呢?

八、Agent发展是大厂游戏吗?

九、Agent元年的标志性会是什么?

十、Agent当前能替代实习生吗?


本文地址: https://www.717b.com/zuixinwz/81.html
全局中部横幅
乐山公共资源交易平台

乐山公共资源交易平台门户首页

保温箱

食品保温冷藏配送解决方案

楼盘网

楼盘网是中国房地产家居门户信息网站,提供全面及时的房地产动态及楼盘楼讯.中国房地产楼盘一应俱全,是国内外房地产媒体公认的房地产家居网络传媒市场先驱者.

库卡机器人,库卡工业机器人,库卡焊接机器人培训及维保服务商工博士

工博士致力于KUKA库卡机器人销售,机器人应用培训、维保等于一体的工业机器人系统集成、智能工厂信息化服务商,提供库卡(KUKA)各种型号应用机器人,拥有广泛的应用技术,在各个行业和领域都积累了丰富的实战应用经验,深受广大用户好评。公司在众多行业与优秀的行业专家合作,为您提供机器人应用最理想的解决方案。通过自我的不断挑战,相信在不懈地追求更加完美的解决方案的道路上,我们能不断前进,赢得丰硕回报。

游玩网

浙江新世界国际旅游股份有限公司是一家以出境旅游,国内旅游组团与同业批发,华东地接,旅游景点开发,国际性修学活动,文体交流活动,会展会议,商务考察,旅游客运,旅游票务,旅游商品销售,自主开发电脑系统软件等相关业务并举的综合性旅游服务企业

城市经济导报

帝国程序,织梦程序,网站建站技术员交流,城市经济导报传媒技术大咖圈

武汉货运公司,武汉物流公司

正广通物流是一家从事武汉到全国的陆运、空运、海运物流服务的武汉物流公司。正广通物流公司以快捷、准时、安全、优惠的服务宗旨为广大客户服务!

杭州网尽信息科技有限公司

高新技术企业、浙江省软件企业、数字政协、政务应用、党建在线、议案提案、电子政务办公平台

修图网P114.COM

修图网P114.COM为广大影楼、摄影工作室与摄影后期修图师、设计师之间搭建服务交易与资讯交流的专业电商平台

全局底部横幅