谁在中国“围猎”AIGC?|人工智能|算法|大模型|aigc

文章编号:161 互联网资讯 2024-02-08 人工智能 算法 大模型 aigc chatgpt

用微信扫码二维码

谁在中国围猎AIGC?人工智能算法

分享至好友和朋友圈

出品|网易科技《后厂村7号》栏目(ID: tech_163)

为什么中国没有出现ChatGPT?我们的差距在哪里?要投入多少资金才能与之抗衡?

“本质是专注和决心,是有没有做到AI First。”小冰CEO李笛直言,从技术层面来讲,的技术没有太多的秘密,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,中国甚至某些方面领先。

“背后的大模型是大资本的游戏,长期持续投入真的很贵。”资深研究专家田涛源告诉《后厂村7号》,在ChatGPT出现之前,较多企业不会选择把钱烧在一个未知的机会上。“GPT3.5训练一次需要花费300-460万美金,还只是算力的成本,没算人才的成本,Open AI一共375人左右,一年工资开支就要2亿美金,AI算力开支5亿美元,需要雄厚的资本支撑。”

但ChatGPT的惊艳四座,AIGC的技术质变,投射到广阔的中国互联网上,引燃了AI从业者的光荣与梦想、激情与野望,在喷薄、在跃动。

AI创业者陈东记得,临近过年的寒夜,在北京的朋友家里,他们吃着开心果、瓜子,彻夜交流,一晚上的话题几乎都与AIGC和ChatGPT有关,虽然不少人对此还是半懂不懂,却富有热情。

在被ChatGPT惊艳的同时,国内业界也在思考:AIGC的商业模式是什么?哪些方向存在更多机会?中国版ChatGPT的危与机?

(图为张颀AI绘画作品,由受访者供图)

中国AIGC生态初现:大厂搞基建,小厂做创新

当下,全世界互联网都刮起了一阵ChatGPT风。这款由OpenAI推出的全新聊天机器人模型,不仅可以回答人类的提问,承认自己的错误,还能作诗、编程甚至帮助大学生完成论文。它让马斯克感叹“好得吓人”,也代表AIGC向全世界喊出了“芝麻开门”。

在中国,围绕AIGC生长出的市场生态,已崭露头角。

“AIGC并不是一个多么新鲜的概念。”陈东谈到,大厂很多2C应用里,已经有不少内容是AI生成的,甚至出现过广告对外宣传已经在大规模使用AIGC技术,至少两年前就有这个方向的创业团队出现,并得到了一线美元基金的青睐和投资。

在他看来,AIGC不只是大厂的机会,也将新起很多创业公司。一类公司偏底层,在新场景中孕育大模型的突破,产研类似DALL·E、GPT等产生很多新模型;另外是在应用层中,也会出现很多新公司,包括生成文字、图像、视频、数字人等等。

在赶超ChatGPT的巨大诱惑下,大厂率先打响了追平基础大模型差距的“攻坚战”。

2月7日,经百度确认,百度类ChatGPT项目名字确定为“文心一言”,英文名ERNIE Bot,预计3月份完成内测,面向公众开放。除百度外,还有腾讯、阿里巴巴、快手、字节跳动、京东、网易、360、商汤、美图等大厂都在AIGC领域有所投入,加入到这场全球新一轮AIGC技术竞赛。

“好的人工智能大模型是非常费钱的。”在资深人工智能研究专家田涛源看来,这股预训练大模型的风潮之下,其实是一场拼数据、拼算力、拼财力的军备竞赛长跑。

他介绍,基础模型GPT3.5训练一次需要花费300-460万美金,还只是算力的成本,没算人才的成本,Open AI一共375人左右,一年工资开支就要2亿美金,算力开支5亿美元。“这真是很贵,而且前面那么多年是没商业回报的,基础模型的参数又是持续优化的过程,随着商业化进展加速要不断进行训练,需要雄厚的资本支撑,确实是小公司用不起来。”

但对于基础大模型、应用大模型未来的商业价值,行业从业者都有共识、有期待。

“AIGC生态最值得关注的就是大模型的建设能力,这将成为AIGC长期价值的重要增长点。”AI创业者“web3天空之城城主”激动地说,“这是用短期的投入换10年后千倍收益的事情。”

另一面,在细分行业中,AIGC的造富速度同样让人们睁大眼睛。

去年10月19日,以文字生成为主的AIGC项目Jasper.Ai完成了1.25亿美元的A轮融资。完成融资后,凭借15亿美元的估值跻身AIGC赛道独角兽俱乐部。就在Jasper.Ai宣布融资的前一天,Stability AI成功融得资金1.01亿美元,投后估值达10亿美元。

在AIGC的垂直技术场景中,按照模态区分,可以分为音频生成、文本生成、图像生成、视频生成等细分领域,均已出现中国企业的探索身影。

文字生成:小冰、Glow、清华九歌、彩云小梦、写作猫、澜舟科技、元语智能等。

图像生成:百度文心一格、盗梦师、TIAMAT、达利AI、6pen、图宇宙、Artflow等。

视频生成:抖音的剪映、快手的云剪、影谱科技、蓝标分身、商汤智影、诗云科技的Movio等。

音频生成:网易天音、StarX MusicX Lab、DeepMusic等。

数字人:启元世界、倒映有声等。

从独角兽到大厂,从使用者到投资人,从业界到学术界,AIGC在应用层的创新引发了广泛的关注。

资本涌入、互联网巨头纷纷布局的背后是AIGC巨大的经济价值和市场规模。

Gartner预测称,到2026年,全球30%的企业机构将拥有用于数字人和元宇宙的产品与服务。麦肯锡则预测,到2030年全球元宇宙相关支出或达5万亿美元。更值得期待是,AIGC正在逐步探索性地进入真实工业生产链条,应用到营销、游戏、代码、生命科学等多个领域。

尤其是一级市场,投资人的脉搏正在变快。

明势资本合伙人夏令直言,2021年年底他就和同事在梳理AIGC领域的机会,并且做了投资布局。AIGC让他感到兴奋的有三点:一是,用户在环、端到端数据驱动模型的上限极高,模型迭代+高质量反馈能带来持续效果提升;二是,以抖音、小红书为代表的内容制作再分发的逻辑有可能变为用户与AI系统共同创造个性化内容的逻辑;三是,新一代的AI技术范式将有机会让人类脑力劳动真正商品化。

去年底,知春资本董事总经理谢梦晖就观察到了这波创业的列车再一次提速。一个侧面反映,“我们之前投资的相关领域被投企业,尤其是基于ChatGPT模型进行商业化衍生的公司,开始频繁受邀参加各种技术和投资论坛。”

令他感到惊喜的是,这轮技术的迭代将推动创造商业的新增量。“在新的生产力基础上,现有的生产关系必然重构,对应的经济体系、组织模式必然会发生变革,创造力的估值将会呈指数级提升。”

AIGC的商业模式是什么?

生于1988年的创业者陈东意识到自己正身处历史之中,连续许多天大厂宣布入局chatGPT的消息席卷着他的注意力,创业者的朋友圈就像创投世界的温度计,“之前搞元宇宙、web3甚至NFT的都要搞AIGC”。他和朋友们感叹太疯狂了,“像王慧文这种大佬,在朋友圈发布人工智能入局宣言,说5000万美元,带资入组,不在意岗位、薪资和title,求组队。”

虽然陈东目前还没找到明确的方向,但已经和投资人喝上了咖啡,“他们其实也想更了解这个行业,尤其是如何商业化。”

自AI绘画工具StableDiffusion开源以来,国内大量主打AI绘画的网站和APP如雨后春笋般涌来。AI画师张颀作为AI绘画工具重度使用者,一些平台内测阶段就会主动找上门,让他提看法,找bug。“有的甚至前端的开发人员直接过来问,要如何调整才能提升大家的付费意愿?”

(图为张颀AI绘画作品,由受访者供图)

产业圈和投资圈对于AIGC,仍有一串真正严肃、令人如鲠在喉的问题:AIGC的商业模式是什么?在中国像open AI这样的公司在哪里?如何做成一个产品,既要普惠化,又要足够深,足够广?

借鉴美国的商业化经验,夏令大致将AIGC领域分为三类商业模式:一类是OpenAI这种专注于做大模型的公司,提供API,做细分场景应用的公司需要去调用它的API,按API去付费;第二类公司是既做大模型,又直接做垂直一体化应用的公司,比如在AI生成图像很火的公司 Midjourney,第三类公司是调用第一类公司的大模型API,基于对细分场景的深刻理解,重点开发具体场景的AI应用,比如Jasper这样的公司。

但对于像OpenAI这种提供API的商业模式,在中国能否真正work,还是个问号。

田涛源讲,这个方向不仅在研发阶段要承担巨大的人力成本、算力开支压力,即便真的推出效果类似ChatGPT的大模型,数据成本、调优、AI伦理优化依然居高不下。“目前ChatGPT每回答一个问题,成本至少要一美分,以这样的方式去做商业变现,面临着高昂的成本、海量的行业优化需求、多条科技战略路径决策选择。”

同时,ChatGPT类似第一代iPhone,上面尚没有成功的爆款APP(例如愤怒的小鸟),它离稳定性的商业服务还存在距离,没有跨过工业红线。在他看来,当下还处于从实验室基础技术转向产业界爆款应用服务的过程中,处于很早期。“但至少让大家看到了基础模型巨大的跨领域服务能力,找到了通用人工智能的一条可能成功的路。”

与此同时,在国内真正能做AI大模型的公司其实是极少的。

夏令观察,但凡能做底层的模型,不管是去做语言大模型的,还是去做强化学习的,只要以技术见长,以工程化产品化的思维做底层模型的公司,融资都非常不错,过去一两年VC都要抢着投进去。“可能资本的溢价没有像美国那么夸张,但一两年时间做到10亿美金估值的公司还是有一些的。”

王思捷和启元世界团队此刻正在经历创业以来最繁忙的日子:由于入局较早,从算法到工程整个一套的体系积累下来的能力,已经自建出百亿参数的game AI和数字人AI垂类大模型。风口降临后,有顶级游戏制作人已经主动上门寻求合作。

他引以为傲的是,这套垂类模型的训练和推理成本可以做到比Open AI同参数规模的模型低一个量级。在王思捷看来,先构建更小的垂类模型(比如百亿参数、十亿参数),让数据飞轮和模型训练能够很好结合,垂类模型在某些领域可能比open AI的效果更好成本更低。“这种想象能力是在中国更能跑通的。”

小冰CEO李笛则直言AIGC商业回报赛道最大的是数字人,“它的客单价明显会更高,我们做过终端内容的生成,感觉这是个菜市场般的内容市场,单价非常低,直到我们将AI生成能力捆绑到数字人身上,平均客单价迅速从20万提高到了300万,当然你的成品质量要足够高。”

但对于只懂用API调用生成内容的创业团队,参与本次采访的受访者大多表示,“价值有限。”

李笛试图放出一个警惕信号,奉劝想要进入AIGC赛道的创业者,要谨慎使用大厂提供的可调用接口,尽可能自建垂类模型。

“API调用的商业模式挣不到钱,所以即便是为了发展,大厂也一定会跳进去,去做生态链上面其他生态类企业的事情,首当其冲就是直截了当应用他们的技术来提供服务的人。”他判断最终的结果,“你要做起来一定会被吃掉,骨头都不剩。”

中美差距:不在技术,在专注

在被ChatGPT惊艳的同时,国内业界也在反思:为什么中国没有出现ChatGPT?

事实上,此前不乏有国内公司雄心勃勃想登上中文版ChatGPT的“王座”。但在可能的未来和确凿的现实面前,在巨额投入和业绩报表的冲突面前,选择了犹豫不前。

“大模型的技术没有太多的秘密。”李笛直言,在ChatGPT出现前,小冰从2017年就开始做AIGC相关的东西,从技术层面来讲,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,中国甚至某些方面领先。

事实上,国内,一群最勇敢、怀抱最狂野梦想的年轻创业者,已经带着自己的AI生成产品挑战海外市场,与世界一流的上市公司对标产品能力。

“AIGC 这件事要真正落地,门槛不仅仅是技术水平,更重要的是从 AI 到用户到数据,再到产品体验能够循环起来的一个飞轮。”从目前拿到手的海外用户反馈,他判断,“在这个方向上,我们现在技术和产品体验上,都是比较领先的。

对比海内外的团队,梁望最大的感受是大家对于创新的理解和投入度存在差异。例如,面对那些可能短期甚至中期内都看不到回报的创新,团队是否仍然拥有无论如何都要去做出来的精神和决心。

作为企业的一把手,李笛也深刻认知到中国和北美的商业和科技环境的不一样,国内大多企业没有那么多的钱会烧在一个未知的预测上。“要花很多的钱,要花很多时间,短期内难有商业价值,谁也不知道这个是不是可行。”

“本质是专注和决心,是有没有做到AI First。”李笛直言,好几年前看到Open AI,他们做到了全情投入,这也是唯一的不同,Open AI花了足够的时间和精力在赌,敢于相信一个暴力出奇迹的大模型,但他们那个赌小冰确实不敢赌,“创业生死一线间,某种意义上,如果Open AI不推出Chat GPT,他们今天可能很堪忧了。”

田涛源看来,这件事给大家一个启发:我们对人工智能硬件(例如芯片)非常重视,但是人工智能的基础软件(例如大模型、训练框架、大数据工具链),是不是长期投入不足、没有足够重视?有没有决心进行长期的基础研发投入?

中国投资与产业界更在乎短期商业回报上的表现,即快钱。“在中国是大家看到哪个技术到了商业价值转化的临界点,所有人一拥而上,对许多大型科技或实体行业龙头企业来说,AI基础科研重视程度不足,缺乏大模型自研能力和战略定力,大家以快速产出的应用为导向,而技术算法的研发必须要很长时间的积累。”田涛源讲。

但一些极擅长工程化的中国AI公司入场,也必将搅动全球AIGC市场。

夏令讲中国优秀的AI初创公司拥有非常明确的一点优势,就是具备很强的工程化能力,搭建一个相比openAI成本更低、迭代效率更高、更满足明确优化目标要求的模型是可以实现的。

同时,中国整个应用场景具备足够的丰富性。“我们这么大的人口基数,产业数字化基础也已经初步具备,中国在高质量反馈数量上有优势,而这对新一代AI模型格外重要。我们看重的AIGC公司要有比较好的工程化能力,对中国实际的商业场景有自己独到认知,我们认为只有这样的公司最有机会能够跑出来。”夏令讲。

随着ChatGPT爆火,这一旧金山诞生的技术引爆了全球人工智能产业,AI 公司近乎全面入局,经济链条的最上游资本市场也出现了震荡,预示变革的信号弹一枚接一枚地炸响。

(图为张颀AI绘画作品,由受访者供图)

“中国一定要有自己的GPT-4,即基础模型(大模型)。”

田涛源强调,“中国的科技创业团队应有危机感。”ChatGPT也好,基础模型也好,越多的开发者、越多样化的高质量数据、使用场景,对基础模型的反馈和优化就是越有价值。“谁先去做强化学习,谁就具备先发优势,这对于我们是一个很大动力和压力。”

而在机会的另一面,是所有ChatGPT面临的最大门槛——“安全和合规”。

2016年,微软就做出了聊天机器人,可以实时地通过用户反馈,并修改自己的回答,但一经发布后,24小时就被教成了种族主义者,很快就被下架了。“我们的实验室也有自己的对话机器人,过去这个是不敢放出来的。”一位头部AI公司创始人告诉《后厂村7号》栏目。

谈到具体落地,资深人工智能研究者田涛源提出:“OpenAI官方在2020年7月发布的《Language Models are Few-Shot Learners》报告中对提出了ChatGPT背后语言大模型的能力边界与挑战提醒:

1、表达问题:语义重复,长篇幅段落中失去连贯性、自相矛盾,偶尔不符合逻辑

2、缺少物理常识:GPT-3很难回答“如果我把奶酪放进冰箱,它会融化吗?”

3、训练效率差与世界模型:GPT-3与人类语言训练效率存在显著差距,但GPT-3在预训练期间学习的文本规模远大于人类一生中看到的文本,以物理世界中额外信息为基础、算法改进都可能提升效率。

4、不确定性:GPT-3的少样本学习存在不确定性、模糊性,未来在准确理解少样本学习原理的基础上,能在模型推理时“真正从头开始”学习新任务。(不清楚人类“从零学习”是否会受以往知识的影响)

5、大模型适用性不好:不方便进行推理,实用性不好,大模型蒸馏到可管理的大小,GPT-3等大模型包含广泛的技能,但在特定任务中并不需要,原则上激进的蒸馏“瘦身”是可能的方法,但在对千亿参数的大模型上还没有过尝试,可能会遇到“决策不易解释”、 “输入的预测不易校准”、 “训练数据的偏差”(数据偏见带来模型偏见,社会伦理影响)。”

“我看到像Open AI的负责人现在也跳出来,主动地说希望被监管。”

在上述AI头部企业创始人看来,这种大模型的最终落地,必然要接受非常严格监管。“如果放任发展,过十年它能让美国那一代学生的教育水平大幅度下滑。”

在他看来,ChatGPT真正在C端出圈,离不开想要借此抄作业的学生,背后涉及的是AI伦理问题。“在美国,10个学生有9个过去几个月迅速知道了ChatGPT,并通过它写作业上交,这是它会火爆的一个重要的推手,它解决了实际问题,但是这个解决问题的方法是不正确的。”

他对资本市场所谓的天气预报不感兴趣。这段时间,不乏有投资人找过来,提议去做ChatGPT类似的大模型,但他没有接受这根橄榄枝。“不是特别爱抢这种风头,我是不会推出一个让学生抄作业的东西,不管赚再多的钱。”

他希望,选择去做ChatGPT类似应用的同行,能够更多考虑AI伦理的自律问题,提前预估学生拿到它会做什么?被迅速铺开怎么办?“尽力做好安全和合规吧,让它last for long,能够持续的存在。”

业内有共识,对于ChatGPT的讨论,未来几年都不会停歇。

但明确的是,ChatGPT以及其对应的大模型发展,就是未来的一个技术革命,可能还没有到达大家想象的那种令人恐慌的程度,但确实会让未来几年的创新得以释放。

在田涛源看来,大家现在执着于去搞ChatGPT,放眼整个人工智能未来,只是其向前迈进的一块垫脚石。“再往上走,还有更多巨大的机会。”

在他的想像中,AI可以推动人类对航天的探索、对新能源的探索、对新材料的重大发现,随着它对物理规律认识的越透彻,对人、对环境、对生命体的认知越来越深刻,能够逼近一些人类认知范围以外的未知知识,甚至具备新知的可能性。

在这场或许比移动互联网更加颠覆的大变革里,对于中国AI企业,距离终点仍有漫长的道路要寻找、摸索、攀登。

(应受访者要求AI创业者陈东为化名)

出品|网易科技《后厂村7号》栏目(ID: tech_163)


本文地址: https://www.717b.com/hlwzxwz/161.html
关注5G网络技术,5G移动通讯网站-5G之家

5G之家是移动通讯,5G网络技术方面网站,涵盖手机通讯,工业互联等领域,还提供5G相关资讯资源。

建站本 - 建站菜鸟的网络记事本

建站本记录了自己的学习历程,建站经验与建站心得,网站SEO、搜索优化、网站推广引流技巧分享!

免费logo设计生成-抖音小店logo-logo在线制作-免费头像设计-丢盖网

最简单,最方便,最快捷的LOGO设计网站程序,输入LOGO名字就能输出海量LOGO方案,直接可以无限制免费下载,

北极熊乐器

北极熊乐器官方网站

足球直播_足球免费在线高清直播_足球视频在线观看无插件_24直播网

24直播网看体育⚽足球直播流畅,是国内最好的体育直播网站之一,提供绿色安全的⚽足球赛事直播,还有篮球直播、世界杯直播、NBA直播等一系列比赛在线免费观看,24直播网体育吧,篮球直播无插件在线观看免费,意甲直播,热门高清直播免费!

雷递网_传递有价值的互联网商业信息

雷递网是关注中国前沿科技,在这里读懂中国互联网,关注融资、上市、企业高层变动、财报。

担路云系统-D云系统-企业全生命周期的互联网工具商-低代码开发PaaS云平台

担路网为企业提供互联网工具(信息展示、营销工具、客户转化、客户管理、数据统计)优势:可自由设计的网页编辑器、可视化编辑的微信游戏、可配置的O2O电商系统

诺博教育 | 高品质幼儿园管理集团

诺博教育是一家高品质幼儿园管理集团、学前教育研究机构和国家高新技术企业,为托管幼儿园及家庭提供以「诺博教育体系」为核心,集课程,培训,评量和管理于一体的教育解决方案。

淘声网 - toSound声音搜索引擎 - 免费音效素材资源|视频游戏配乐下载

淘声网是全球免费声音素材聚合平台,独创toSound“吐司”声音搜索引擎,搭配AudioDown智能下载方案,游戏音效,影视配乐,实地录音,节奏音源,音乐样本,海量音频素材一键获取,免费个人/商业使用许可授权。

上海燕秦财税 | 一站式助力企业发展

上海燕秦集团,国内知名品牌公司,专注企业工商服务,注册、转让、企业变更、增资验资、代理记账、人事社保、商标注册等业务,一站式助力企业发展