AI圈冷处理,律师圈热讨论:Transformer专利会卡大模型厂商脖子吗?|谷歌|国家知识产权局|transformer|算法

用微信扫码二维码

AI圈冷处理,律师圈热讨论Transfor

分享至好友和朋友圈

出品 | 网易科技《态度》栏目

一场关于的讨论,正在两个世界里以截然不同的方式展开。

在AI圈,它几乎没引起任何波澜。

对他们而言,Transformer是一种常识级的存在,几乎像空气一样不言自明。他们认为:Transformer不仅是一项技术,更是一个生态。大家都在用,也早已与最初的模样不同,根本不可能动真格发动专利战。

当前部分使用Transformer架构的,DeepSeek整理,网易科技制图

但在另一个空间——律师圈,气氛却截然不同。

知名律所的专利律师正在朋友圈和会议室中频繁提及“注意力机制”“代理授权”“中国驳回”这些关键词。

有人在推演一旦专利通过后,哪些大模型公司会被波及;有人开始查阅中、美、欧专利数据库,一页页比对谷歌的申请文本;还有律师干脆直接到大模型公司登门拜访,告诉他们是时候注意到这件事情了。

一位律师感慨:“你们搞AI的啊,真是太乐观了。谷歌要是真开始收专利费,你们才知道什么叫全球化风险。”

于是,一个“毫无反应”的技术世界和一个“高度活跃”的法律世界,在谷歌Transformer专利复审这件事上,对着同一件事,双方没有对话,做出完全不同的判断。

但也正是这种割裂,在提醒着我们:

AI 的竞争绝不只是数据、算力与算法的竞速,更是关于规则制定、权利边界与商业博弈的复合战争。

谷歌的专利保护范围,针对“注意力机制”

在 AI 圈,Transformer 是常识,是已经嵌入无数大模型底层结构的“地基”。

它由谷歌研究团队于2017年,在论文《Attention Is All You Need》中提出,目前已成为大语言模型(如 gpt、BERT、Llama)的基石。

截至2025年3月,《Attention Is All You Need》论文已被引用超17万次,是 AI 领域最具影响力的研究之一。

该论文引入了自注意力机制和多头注意力机制,注意力机制让模型能在处理语言序列时,自主判断哪些词更重要,从而显著提高了效率与表达能力。谷歌围绕这一机制,已在全球布局了数十项同族专利,并在美国、欧洲、日本等地陆续获批。

谷歌Transformer发明专利全球布局概况

但在国内律师圈,它却仍是一个悬而未决的法律议题。

值得注意的是,

谷歌Transformer发明专利并非针对整个Transformer架构,而是针对其核心底层机制,也就是我们通常所讲的“注意力机制”。

2024年1月,中国以“不属于专利法规定的技术方案”为由,驳回了谷歌的专利申请。

驳回决定指出,

该专利主要涉及对神经网络算法的改进,未能解决具体技术领域的具体技术问题,未能采用专利法意义上的技术手段,也未能实现专利法意义上的技术效果。

听上去术语复杂,其实问题出在两个核心点:一是这项发明只是对神经网络算法的改进,并未解决某个具体的工程或技术问题;二是注意力机制是算法内部的计算逻辑,不属于被中国专利法承认的“技术手段”。

随后,谷歌主动调整。2024年4月,谷歌将专利限缩到“摘要”和“问答”两个应用场景,并向中国国家知识产权局提交复审请求。同年11月14日,国家知识产权局撤销此前驳回决定,专利进入实质性审查。

换句话说,谷歌不再主张整个注意力机制都属于自己,而是希望先在部分高频应用上取得突破。

这也意味着,

一旦大模型在“摘要”和“问答”两个应用场景中应用“注意力机制”,就很难逃脱谷歌的专利保护范围。

图注:谷歌Transformer中国发明专利的最新修改文本

但此后,新一轮的博弈又开始了。

图注:《国家知识产权局的第四次审查意见通知书》

但北京高文律所合伙人、专利律师王冬告诉网易科技,

无论删除权利要求还是据理力争,说明书公开不充分的问题不难克服。也就是说,这件中国专利未来授权概率很高。

如果这些同族专利最终获得授权,将有助于谷歌在 AI 时代构建全球技术壁垒,让Transformer变成企业必须“付费通行”的高速公路。

一旦谷歌主张专利侵权,企业或陷入“三选一”困局

一旦专利获得授权,问题就不再是“能不能用”,而可能是“怎么用”。

发明专利是专利体系中保护力度最强的,最长可达20年。此次我们所讨论的谷歌 Transformer 架构的专利,就属于发明专利范畴。

获得专利授权后,持有者可以通过许可、转让或诉讼实现商业收益,并对侵权者要求停止侵害,并赔偿损失。

当然,专利侵权的确认和范畴还需要复杂的界定。但一旦确认侵权,依赖该架构的企业,则或将面临三种选择:

· 继续使用但支付专利许可费;

· 另寻模型架构,规避技术壁垒。

对于巨头公司来说,支付授权费或许只是成本问题。但对技术路径已经依赖Transformer架构、资金资源有限的中小企业而言,这几乎等于一纸封路令。

更隐秘的风险在于:

如果谷歌的专利保护范围足够宽泛,即使后来者对架构进行了优化和改良,也依然可能落入其权利要求的“覆盖区”,

仍然构成侵权。这让谷歌专利更像是一条收费高速路,所有人都得“买票通行”。

但拥有专利,不等于主动开战。

行业人士向网易科技表示,

专利更多时候是一个防守型武器。它真正的价值,在于确立优先权——当有人对你发起专利诉讼,你可以用自家的专利组合进行反制。这也是为什么科技巨头普遍选择通过交叉授权来达成一种“核威慑”式的平衡。

谷歌过去在 AI 领域的专利布局,也更像是在修一座“技术护城河”。

它要的是位置,是议价权,而不是立即变现的通行费。

这背后还有现实考量:专利诉讼周期长、成本高、结果不确定。

比如甲骨文诉谷歌的 Java 侵权案,整整打了十年,最后谷歌虽然赢了,但双方都付出了巨额代价。

涉谷歌的部分专利纠纷案件及结果,DeepSeek整理,网易科技制图

综上,

谷歌主动对AI大模型公司发起专利诉讼的可能性极低。但这并不意味着它不会发生。

王冬律师指出,这就像达摩克里斯之剑——

它或许不会立刻落下,但谁也无法忽视它的存在。例如,谷歌可以将Transformer专利许可或转让给第三方专利运营公司,从而发起对大模型公司的狙击。这在通信行业早有前车之鉴。

Transformer并非唯一,大模型架构探索仍在继续

尽管谷歌专利引发了行业高度关注,但从技术演进的角度看,Transformer 可能并非不可替代的唯一选项。

元始智能联合创始人、COO罗璇向网易科技透露,虽然Transformer 仍是当前主流架构,但行业内已有迹象表明,头部 AI 公司和研究机构已经正在探索“非 Transformer ”架构的替代方案。

罗璇表示,

这不仅仅是一个国产化替代的问题,更是企业在面对 Transformer 架构能力瓶颈、算力资源紧张背景下,为追求更高效率和更强性能所做的主动技术突围。

腾讯混元 T1就引入了 Hybrid-Mamba-Transformer 融合架构,通过结构调整大幅降低计算复杂度,并优化 KV-Cache 的内存占用,提升推理和训练效率。

英伟达也在其开源大模型 Nemotron-H 中使用了类似的混合架构,推理速度达到同体量竞品的三倍,显著提高了在实际部署中的能效比。

而在部署层面,微软则更进一步:已在 Windows 系统中默认内置 RWKV 模型调用库。罗璇告诉网易科技,RWKV 作为一种非 Transformer 架构,已经成为当前部署最广泛的非transformer架构。

部分非Transformer架构的模型,DeepSeek整理,网易科技制图

在这些架构探索和专利博弈的背后,反映出的其实是一个更深层的行业逻辑:

AI 竞争的战场,从来不仅是技术优劣的单点比拼,更是围绕技术生态和制度规则的全局较量。

谁拥有更高的效率、更强的通用性,当然能在模型性能上占据先机;但谁掌握标准、协议的制定权,才能在全球范围内确立自己的主导地位。

对国内 AI 企业而言,

大模型不仅仅是技术课题,更是建立商业护城河、构建国际竞争力的核心资产。

谷歌的 Transformer 专利最终是否会成为 AI 产业的“紧箍咒”,尚未可知。但可以肯定的是:未来 AI 的竞争,早已不止是架构之争,也不止是参数规模的军备竞赛。

更激烈的较量,正在算法之外悄然展开。

工信部电子知识产权中心 2025-04-18 17:40:37

但在另一个空间——律师圈,气氛却截然不同。

AI 的竞争绝不只是数据、算力与算法的竞速,更是关于规则制定、权利边界与商业博弈的复合战争。

谷歌的专利保护范围,针对“注意力机制”

它由谷歌研究团队于2017年,在论文《Attention Is All You Need》中提出,目前已成为大语言模型(如 GPT、BERT、Llama)的基石。

但在国内律师圈,它却仍是一个悬而未决的法律议题。

谷歌Transformer发明专利并非针对整个Transformer架构,而是针对其核心底层机制,也就是我们通常所讲的“注意力机制”。

该专利主要涉及对神经网络算法的改进,未能解决具体技术领域的具体技术问题,未能采用专利法意义上的技术手段,也未能实现专利法意义上的技术效果。

一旦大模型在“摘要”和“问答”两个应用场景中应用“注意力机制”,就很难逃脱谷歌的专利保护范围。

无论删除权利要求还是据理力争,说明书公开不充分的问题不难克服。也就是说,这件中国专利未来授权概率很高。

一旦谷歌主张专利侵权,企业或陷入“三选一”困局

当然,专利侵权的确认和范畴还需要复杂的界定。但一旦确认侵权,依赖该架构的企业,则或将面临三种选择:

如果谷歌的专利保护范围足够宽泛,即使后来者对架构进行了优化和改良,也依然可能落入其权利要求的“覆盖区”,

但拥有专利,不等于主动开战。

专利更多时候是一个防守型武器。它真正的价值,在于确立优先权——当有人对你发起专利诉讼,你可以用自家的专利组合进行反制。这也是为什么科技巨头普遍选择通过交叉授权来达成一种“核威慑”式的平衡。

它要的是位置,是议价权,而不是立即变现的通行费。

这背后还有现实考量:专利诉讼周期长、成本高、结果不确定。

更关键的是,如果谷歌今天挥舞专利大棒,明天就可能面对整个行业的联合反弹。

谷歌主动对AI大模型公司发起专利诉讼的可能性极低。但这并不意味着它不会发生。

王冬律师指出,这就像达摩克里斯之剑——

Transformer并非唯一,大模型架构探索仍在继续

这不仅仅是一个国产化替代的问题,更是企业在面对 Transformer 架构能力瓶颈、算力资源紧张背景下,为追求更高效率和更强性能所做的主动技术突围。

AI 竞争的战场,从来不仅是技术优劣的单点比拼,更是围绕技术生态和制度规则的全局较量。

大模型不仅仅是技术课题,更是建立商业护城河、构建国际竞争力的核心资产。


本文地址: https://www.717b.com/zuixinwz/69.html
全局中部横幅
广东海德集团

珠三角领先的城市综合运营商

保温材料

溧阳新彤保温材料厂主营各种保温材料,包括岩棉管、岩棉板、石棉绳、硅酸铝制品、离心玻璃棉制品、橡塑管、橡塑板、聚氨酯制品、树脂等;以及外用保温材料,包括铁皮、镀锌铁皮、彩钢皮、铝板、不锈钢、普通铝箔、镜面铝箔、玻纤布和铝箔玻纤布。价格实惠,物美价廉。

广东纺织职业技术学院

广东纺织职业技术学院是经广东省人民政府批准、国家教育部备案的一所省属全日制普通高等学校,是广东省唯一的纺织服装类综合院校,是全省纺织服装行业人才培养的重要基地。学院位于广东省佛山市高明区富湾镇西江新城,校园秀丽雅致,环境优美。学院现设有8系2部,即纺织系、服装系、经济管理系、轻化工程系、艺术设计系、机

落尘劫

落尘劫,【晋江文学城】作者,代表作《(反叛的鲁鲁修)时间之海》

悦企科技

悦企科技是互联网视觉创意团队,以数据为核心结合营销、创意,为品牌客户提供专业的网站建设,高端网站制作,小程序开发,APP开发,品牌设计,电商设计策划咨询等服务。我们永远以客户为中心,让更多企业走向的品牌数字化营销,帮助企业实现移动互联网转型,联合创新共同实现价值!

福州中阀厦洋阀门制造有限公司

福州中阀厦洋阀门制造有限公司生产的产品有城市煤气快速启闭闸阀、中、低压闸阀,止回阀、截止阀、快开排泥阀、旋塞阀、过滤器、全喷塑软密封闸阀、蝶阀等

奇精机械股份有限公司

奇精机械股份有限公司是一家具有持续创新能力的多元化智能制造企业,现已形成家电零部件、汽车零部件及电动工具零部件三大业务的产业格局。总部位于浙江宁波,并在宁波宁海、合肥、上海、泰国等地设立多家子公司...

中国知识产权人才网

思博网-中国知识产权垂直领域人才培养领航者,2009年创办,汇集了超过50万知识产权行业专业人才汇聚思博网络平台。也是全国专利代理人资格考试、知识产权师考试、专利代理人工程师考试专业辅导机构,为超3000家企业及机构提供知识产权人才招聘等服务,是行业细分领域知名品牌。

海南广联达通科技股份有限公司

海口广联达商城是专业电脑配件批发网,全国闪电发货支持担保交易并且售后包售,我们提供完美的售后服务,海口广联达(海口广联达科技)商城是电脑配件进货渠道的首选!服务热线:18976869321

全局底部横幅