OpenAI推降速换降价新服务!模型使用费直接腰斩|openai|人工智能|谷歌|人工智能公司|token
用微信扫码二维码

分享至好友和朋友圈
4月18日消息,为更强势抗衡等公司的竞争,宣布推出“弹性处理”(Flex Processing)服务。这一新选项通过牺牲响应速度并接受“偶发性资源不可用”,将模型使用成本降低50%。
openai表示,弹性处理服务目前以测试版形式向新发布的o3和o4-mini推理模型开放,主要适用于模型评估、数据富化和异步任务等低优先级“非生产”场景。
根据定价方案,o3模型在弹性处理模式下,每百万输入(约75万字)费用从标准模式的10美元降至5美元,每百万输出token从40美元降至20美元;o4-mini模型的每百万输入token价格则从1.1美元降至0.55美元,每百万输出token价格从4.40美元降至2.20美元。
在高端人工智能模型成本持续攀升、竞争对手纷纷推出更廉价高效的“经济型”模型之际,OpenAI推出弹性处理服务可谓恰逢其时。本周四,谷歌发布了Gemini 2.5 Flash推理模型,性能相当或超越deepseek R1模型,且单位输入token成本更低。
OpenAI在发给客户的电子邮件中提到,OpenAI使用层级体系中的第1至第3层用户(层级由用户在OpenAI服务上的消费金额决定)若要调用o3,必须完成新增的身份验证流程。此外,o3及其他模型的推理摘要功能和流式API支持功能也需通过身份验证后方可使用。
OpenAI先前表示,身份验证旨在防止恶意用户滥用使用政策。(辰辰)
本文地址: https://www.717b.com/zuixinwz/53.html