日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”|算法|文生|agent

文章编号：22 2025-04-18 调用量算法文生豆包 agent 卡位战

用微信扫码二维码

分享至好友和朋友圈

出品 | 网易科技《态度》栏目

当DeepSeek以开源策略席卷开发者社区时，火山引擎用闭源的方式展示了另一种可能性。

“截至2025年3月底，大模型日均tokens已超过12.7万亿，是2024年12月的3倍，是一年前刚刚发布时的106倍。”

4月17日，在火山引擎FORCE LINK AI创新巡展上，火山引擎总裁谭待亮出一组数据，为闭源大模型的生存战注入强心剂。

如今，豆包大模型已成为众多企业AI转型的核心利器。就在巡展当日，

面向企业市场，全新的豆包1.5·深度思考模型正式登场，同时升级图模型3.0及视觉理解模型，还推出了OS 解决方案和AI云原生推理套件。

这一系列动作表明，在模型性能竞赛转向 “Agent生态卡位战” 的当下，火山引擎已精准锚定新的发展方向。

加量不加价，豆包深度思考模型开放API

官方技术报告显示，豆包深度思考模型采用MoE架构，总参数200B，激活参数仅20B，以较小参数实现了媲美顶尖模型的效果。得益于高效和高性能推理系统，豆包模型的API服务在保证高并发的同时，将延迟降至20毫秒，目前已通过火山引擎开放供用户体验。

在数学推理、编程竞赛、科学推理等专业领域，豆包模型的性能与openai o3-mini-high、Gemini 2.5 Pro等模型不相上下。

在通用任务上，豆包深度思考模型的人类评估表现比DeepSeek R1高出8%，

单位推理成本更是降低了50%，完美实现了性能与效率的平衡。

相较于仅限文字理解的 DeepSeek，豆包深度思考模型的多模态能力优势显著。

谭待介绍，升级后的豆包・视觉理解模型具备强大的视觉理解能力，使模型不仅 “会看会想”，还能进行立体思考。从识别菜单内容，根据用户口味和过敏食物提供点餐推荐，到分析航拍图上的颜色、形状等信息并结合地貌进行深度研判，豆包的多模态应用场景丰富且实用。

豆包・文生图模型3.0同样表现亮眼，其文字排版和图像生成能力进一步增强，支持2K高清图片生成，在影视、海报、绘画等领域应用广泛。在最新的文生图领域权威榜单Artificial Analysis竞技场中，豆包・文生图3.0模型已跻身全球第一梯队。

豆包这一次放的大招，可谓威力十足。目前豆包已经在AppStore内免费APP排行榜成功登顶，超越位居第三的DeepSeek和第九的腾讯元宝。

迎接Agent元年，“应用Agent”+“OS Agent”双管发力

强大的模型性能为AI Agent的发展奠定了坚实基础。

谭待指出：“

AI Agent应用主要分为应用型Agent和OS Agent两个方向。

应用型Agent专注于特定领域任务，如客服Agent、数据Agent、代码Agent 等；OS Agent则具备跨场景通用性和灵活性，可操作浏览器、电脑、手机等设备，完成复杂任务。”

在应用型Agent领域，面向专业开发者的代码Agent——Trae重磅推出。相较于传统AI插件产品，Trae将AI与IDE深度融合，带来更智能的开发体验。

在OS Agent方面，火山引擎正式发布OS Agent解决方案，整合豆包UI-TARS模型，以及veFaaS函数服务、云服务器、云手机等产品，实现对代码、浏览器、电脑、手机及其他Agent的高效操作。

针对Agent带来的大量推理消耗问题，火山引擎推出ServingKit推理套件，可在2分钟内完成671B DeepSeek R1的下载和预热，13秒完成推理引擎加载。

同时，通过优化火山引擎EIC，将KV cache命中率提高10倍，在100% cache命中场景下，TPS吞吐量提升至5倍以上；对算子、AI网关、VKE编排调度的升级，也大幅降低了gpu消耗。

对于GPU的折旧问题，谭待认为：“

如果把软件层面的工作做好，硬件的生命周期是可以拉长的。

而且不同的场景对模型的延迟、吞吐要求是不一样的。

更重要的是在软件层面和运营层面做好相关工作，这样就能使硬件的生命周期和投资回报率（ROI）都达到最佳状态。

”

模型好坏比开源闭源更关键，对豆包充满信心

“模型好坏，与开源闭源无关。火山引擎在适配DeepSeek方面表现出色，对豆包充满信心。”

火山引擎总裁谭待在采访中直言。

面对豆包大模型日均tokens调用量百倍的增长，谭待表示，技术发展短期易被高估、长期易被低估，tokens增长量取决于模型突破，如视觉推理、Agent等方面的进展，对未来模型调用量百倍增长持谨慎乐观态度。

2025年被称为Agent元年，但谭待认为：

“能写诗的不是Agent，能跑通供应链的才是。”

这一观点凸显了火山引擎的务实布局。

谭待指出，

“我们希望AI能够解决更复杂，更完整的问题，不再仅仅是对信息的感知、处理和生成，而是能端到端的处理任务。AI能做到这些，才能称之为一个合格的Agent。”

他认为，实现这一目标需完成三大技术突破：首先最核心的是要有更强的模型。要做好Agent，模型需要有能力做好思考、计划和反思，而且要一定得支持多模态。其次，开发OS Agent架构体系，实现数字与物理世界的双向交互。最后，通过AI云原生技术实现推理成本与延迟的指数级下降，支撑大规模应用落地。

目前，火山引擎已支持MCP协议，统一协议有助于降低开发成本、加速行业发展。未来，火山引擎不仅会推出数据智能体Data Agent等垂直类Agent产品，还将为通用Agent开发提供工具和方案。在谭待看来，判断真正的Agent，关键要看其能否完成复杂任务、是否运用深度思考模型。

当闭源模型凭借成本优势挑战开源阵营，当开源生态反哺商业创新，这场大模型竞争早已超越技术层面，演变为组织能力与生态运营的全方位较量。

可以预见的是，在Agent战场中，唯有那些将技术深度融入行业各个环节的参与者，才能最终脱颖而出。

“截至2025年3月底，大模型日均tokens已超过12.7万亿，是2024年12月的3倍，是一年前刚刚发布时的106倍。”

面向企业市场，全新的豆包1.5·深度思考模型正式登场，同时升级图模型3.0及视觉理解模型，还推出了OS 解决方案和AI云原生推理套件。

加量不加价，豆包深度思考模型开放API

在数学推理、编程竞赛、科学推理等专业领域，豆包模型的性能与OpenAI o3-mini-high、Gemini 2.5 Pro等模型不相上下。

在通用任务上，豆包深度思考模型的人类评估表现比DeepSeek R1高出8%，

迎接Agent元年，“应用Agent”+“OS Agent”双管发力

AI Agent应用主要分为应用型Agent和OS Agent两个方向。

如果把软件层面的工作做好，硬件的生命周期是可以拉长的。

更重要的是在软件层面和运营层面做好相关工作，这样就能使硬件的生命周期和投资回报率（ROI）都达到最佳状态。

模型好坏比开源闭源更关键，对豆包充满信心

“模型好坏，与开源闭源无关。火山引擎在适配DeepSeek方面表现出色，对豆包充满信心。”

“能写诗的不是Agent，能跑通供应链的才是。”

本文地址： https://www.717b.com/jxwxwz/22.html

上一篇：4月18日外媒科学网站摘要全球首张有毒金属

下一篇：市场监管总局将全力整治直播电商乱象网售市

八月瓜种植

八月瓜种植,曲靖散养土鸡,八月瓜种苗,曲靖生态土鸡散养,八月瓜种植技术首选曲靖林林农业有限责任公司.

电影视频 2025-04-18 19:25:05

【金多利挂车】半挂车

石家庄金多利专用汽车有限公司，是一家专业生产各种半挂车的厂家，品牌老厂、质量控制严格、售后服务保障，可信赖企业，欢迎垂询：15369170893。

商业服务 2025-04-19 04:02:44

四川成都高清地图

可查询@area卫星图片，查看@area的航拍图

图片摄影 2025-04-19 13:18:58

家庭生活指南

家庭生活指南(www.137766.com)分享生活一些技巧、生活知识、让你的生活更精彩

生活常识 2025-04-19 14:12:47

防阻燃服防静电面料厂家直销

吴江市友通纺织有限公司是专业功能性面料生产厂家，主要产品有防静电面料、防阻燃面料、阻燃服面料、阻燃防静电面料、电焊阻燃服面料、防酸碱面料，产品均为厂家直销，质量可靠，同时价格也合理，需要的客户可以联系。

电影视频 2025-04-19 16:29:38

云ASO

云ASO由原试客核心技术团队，依托7年行业经验，为ASO行业量身打造，致力于赋能ASO行业参与者，无需开发团队即可接单放量、自建积分墙。

手机软件 2025-04-19 19:16:29

淘宝优惠券,京东优惠券,拼多多优惠券,免费优惠券领取网站

优惠券网是淘宝优惠券免费领取网站,实时更新淘宝优惠券,淘宝优惠卷,天猫优惠券,天猫超市购物优惠券直接领取平台来全优惠领优惠卷下单比双十一还购优惠！我的小家记录网站

网站模板 2025-04-19 19:46:05

硼酸锌

硼酸锌、次磷酸铝、MCA、氢氧化铝、无卤阻燃剂、阻燃剂、泰星、济南斯博润新材料科技有限公司

科技创新 2025-04-20 05:47:19

pace6000,pace5000压力控制器,ge

瑞轩电子科技(上海)有限公司主营pace6000,pace5000压力控制器,gedruck压力校验仪,传感器,fluke仪器,压力传感器等仪器仪表设备！

科技创新 2025-04-20 09:14:46

太原市住房和城乡建设局网站

太原市住房和城乡建设局网站首页。

网站模板 2025-04-20 16:21:18

北京写字楼,办公楼出租租赁价格

北京58联合办公网为您提供北京写字楼,办公楼出租租赁价格信息，北京联合办公，共享办公信息，查找北京联合办公室出租租赁信息，服务式办公室，共享办公位出租信息，就上北京58联合办公网

商业服务 2025-04-21 06:37:15

中英文期刊推荐

期刊天空网是职称论文、职称专利与职称出书服务平台，提供中英文期刊推荐与发表指导，以及中英文著作出书指导、职称专利申请指导服务。

商业服务 2025-04-21 06:52:29

GSMA庞策：中国5G潜力巨大垂直应用将引领全球|运营商|中国移动|区战略

GSMA庞策：中国5G潜力巨大垂直应用将引领全球,运营商,中国移动,gsma,区战略,庞策

2025-04-18 20:21:01

刘大成教授：中国制造真正的核心优势是成本优势|物流|产业链

刘大成教授：中国制造真正的核心优势是成本优势,刘大成,中国制造,教授,物流,产业链

2025-04-18 20:20:07

绕地3天后返回，SpaceX壮举！平民机组训练几个月也能上太空|spacex|飞船|宇航员|太空之旅|火箭

绕地3天后返回，SpaceX壮举！平民机组训练几个月也能上太空,spacex,飞船,宇航员,太空之旅,火箭

2025-04-18 20:19:12

潮头|梁建章：放下包袱，我更新我|携程|乡村旅游|在线旅游|民宿|旅游业

潮头|梁建章：放下包袱，我更新我,梁建章,携程,乡村旅游,在线旅游,民宿,旅游业

2025-04-18 20:18:19

谁说小镇青年没前途|电商

谁说小镇青年没前途,电商

2025-04-18 20:17:25

羊毛真丝未必要送干洗告诉你洗烘一体机到底要怎么选？|烘干机

羊毛真丝未必要送干洗告诉你洗烘一体机到底要怎么选？,真丝,一体机,烘干机,羊毛,洗烘

2025-04-18 20:12:34

ROG掌机体验：性能畅玩3A大作实用性不止于游戏|rog|pc|xbox|模拟器

ROG掌机体验：性能畅玩3A大作实用性不止于游戏,掌机,游戏,rog,pc,xbox,模拟器

2025-04-18 20:08:28

小米手环8Pro上手：更轻更薄兼顾智能手表体验|可穿戴设备|手机|腕带

小米手环8Pro上手：更轻更薄兼顾智能手表体验,智能手表,手环,小米,可穿戴设备,手机,腕带

2025-04-18 20:08:02

一文看懂WWDC24：苹果与众不同的“AI”,wwdc,iphone,apple,ios,苹果,app,ipad

2025-04-18 20:06:21

OPPOFindN5深度体验：「年度真香折叠旗舰」薄到忘记自己是折叠屏|oppo|手机|哈苏|安卓机

OPPOFindN5深度体验：「年度真香折叠旗舰」薄到忘记自己是折叠屏,oppo,手机,折叠,哈苏,安卓机

2025-04-18 20:05:06

汤钊猷院士：太极拳对防病延寿有用，值得国家推广|中西医|肿瘤

汤钊猷院士：太极拳对防病延寿有用，值得国家推广,汤钊猷,中医,中西医,中医治疗,肿瘤

2025-04-18 20:03:20

深视频｜中国电商APP“霸榜”美国应用商店“泼天流量”折射民众真实心声|英国|特朗普|app|卡罗琳|礼物功能

深视频｜中国电商APP“霸榜”美国应用商店“泼天流量”折射民众真实心声,美国,英国,特朗普,app,卡罗琳,中国电商,应用商店,礼物功能

2025-04-18 19:53:01

文章推荐

北邮经管学院院长吕廷杰：5G时代最大的受益者是中小企业|运营商|互联网|大数据|史蒂夫·乔布斯

北邮经管学院院长吕廷杰：5G时代最大的受益者是中小企业,吕廷杰,中小企业,运营商,互联网,大数据,史蒂夫·乔布斯

2025-04-18 20:20:40

互联网资讯

北邮乔秀全：5G的消费级杀手应用可能诞生于XR设备|ar|浏览器|vr|互联网

北邮乔秀全：5G的消费级杀手应用可能诞生于XR设备,乔秀全,ar,浏览器,vr,互联网

2025-04-18 20:20:33

互联网资讯

“刘畊宏女孩”刷屏背后的终极推手|刘耕宏|潮头|周杰伦|抖音

“刘畊宏女孩”刷屏背后的终极推手,刘耕宏,潮头,周杰伦,抖音

2025-04-18 20:18:10

互联网资讯

孟晚舟重获自由，华为闯过至暗关口了吗？|任正非

孟晚舟重获自由，华为闯过至暗关口了吗？,孟晚舟,华为,任正非,华为公司

2025-04-18 20:16:17

互联网资讯

vivoX90全新告白配色版真机图赏：售价3999元起|蔡司|后壳

vivoX90全新告白配色版真机图赏：售价3999元起,vivo,配色,告白,蔡司,后壳,真机图

2025-04-18 20:12:39

互联网资讯

日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”|算法|文生|agent

相关文章

文章推荐