涨价浪潮下,DeepSeek推动AI“价格战”:百万Token输入0.25元
甫一发布便成为外界焦点的DeepSeek V4开启限时折扣。
4月26日,澎湃新闻记者获悉,DeepSeek最新发布的DeepSeek-V4-Pro模型API开启2.5折价格特惠,输入(缓存命中)价格为0.25元/百万Tokens,输入(缓存未命中)价格为3元/百万Tokens,输出价格为6元/百万Tokens,优惠期截至5月5日。
而据Open Router数据显示,最新推出的海外知名AI大模型GPT-5.5 Pro加权平均输入价格为30美元/百万Token,输出价格为180美元/百万Token,从输入价格就和DeepSeek V4 Pro相差超700倍,此外,GPT-5.5标准版加权平均输入价格为5美元/百万Token,输出价格为30美元/百万Token,包括Anthropic Claude Opus系列、OpenAI GPT-5.4,以及谷歌Gemini 3.1 Pro系列大模型的输出价格在12-25美元之间,均和调价后的DeepSeek V4 Pro拉开较大差距。
值得注意的是,在今年AI行业整体算力集体涨价的背景下,DeepSeek V4再次将“AI降价”的理念贯彻到底,进一步打响业内的“价格战。
此前4月13日,阿里云宣布,旗下大数据开发治理平台DataWorks对标准版、专业版用户取消每日调用API的数量限制,本次变更从2026年4月14日起逐步发布。其中,DataWorks标准版调用API的免费额度调整为10万次/月,DataWorks专业版调用API的免费额度调整为50万次/月,超出部分采用OpenAPI按量付费的方式。
3月18日,百度智能云官网发布公告称,受全球AI应用快速发展影响,算力需求持续攀升,核心硬件及相关基础设施成本出现显著上涨。为保障平台长期稳定运行与服务质量,4月18日起,AI算力相关产品服务上调约5%至30%,并行文件存储等上调约30%。
今年以来,腾讯云也连续两次宣布涨价。继3月11日对部分模型启动正式收费及涨价后,4月9日,腾讯云称鉴于全球AI算力需求持续激增,核心硬件供应链成本大幅上涨,将于2026年5月9日起,对AI算力、容器服务及弹性MapReduce(EMR)相关产品刊例价进行调整。
除了云端之外,下游模型端同时出现价格上修信号。国产大模型厂商智谱已在年内进行三次API价格上调。2月12日,智谱对GLM Coding Plan套餐实施结构性调价,整体涨幅自30%起。智谱在价格调整函中明确表示,涨价源于“市场需求持续强劲增长,用户规模与调用量快速提升”。
3月16日,智谱发布专为智能体“龙虾”(OpenClaw)场景深度优化的通用大模型GLM-5-Turbo,并上调其API价格,涨幅为20%。4月8日,智谱正式发布GLM-5.1,再度提价10%。调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6水平。
此次DeepSeek在全球范围内再次广受关注,除了创新性的技术架构,核心在于对于国产芯片的全面适配,实现国产AI算力的快速崛起。华为计算发布信息称,昇腾超节点产品全面支持DeepSeek V4。本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。
在DeepSeek V4发布后,寒武纪也在第一时间宣布,基于vLLM推理框架完成了对此次DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配,适配代码已开源到GitHub社区。
其中,昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。
据DeepSeek的技术论文披露,DeepSeek V4的核心创新叫做"混合注意力架构",由两种机制交替叠加构成:CSA(压缩稀疏注意力)和HCA(重度压缩注意力)。两种机制交替出现在模型的不同层:CSA处理精细的中程信息,HCA处理粗粒度的超长程信息。同时,每个注意力层还保留了一个"滑动窗口注意力分支",专门负责最近128个token的近邻局部信息,弥补压缩机制容易丢失局部细节的缺陷。
在100万token的超长上下文场景下,与上一代V3.2相比:V4-Pro的推理计算量(FLOPs)只需 27%,KV缓存(模型的"工作记忆")只需 10%;V4-Flash更极端,推理计算量降至 10%,KV缓存降至 7%。
- EAACI Congress 2025 - Breaking Boundaries in Allergy, Asthma, and Clinical Immunology
- 庆中秋 迎国庆——艺术家单峰献礼全国人民!
- 世界自由区组织推出新的企业形象
- 纳入医保,福州爱尔眼科已有多位患者受惠!国际眼科创新药物——法瑞西单抗单支注射费节省超过8000元
- Rigaku开发出揭示生物大分子特性的新型电子密度拓扑技术
- Brightcove推出全新“发布者洞察”功能
- Acronis Ecosystem Reaches 300 Technology Integrations, Drives New Opportunities for MSPs and ISVs
- 持续锋芒!招商大城红盘背后藏着什么样的硬核实力?
- 无万卡,不VLA:元戎启行与阿里云的“想法”和“解法”
- AGF Management Limited Reports Third Quarter 2025 Financial Results
- 2025年度义乌购十大经营户评选即将揭晓! 义乌购直播探店再添助力!
- 行业大咖驻场!超7万人次观看!itc保伦股份线上沉浸声技术专题讲座圆满成功!
- 锐仕方达创始人黄小平新书《猎变》由中信出版集团正式出版发行
- 强生庆祝CARTO三维电生理导航系统问世三十周年,以创新守护健康心跳
- 华领医药荣获上海市创新型企业总部授牌
- From Fossil Fuels to Green Futures: Oxford and EBC Financial Group on What’s Holding Us Back
- 全国食药同源去糖之城无糖之都研讨会在深圳召开
- Silicon Motion Announces Chief Financial Officer Transition
- WHOOP宣布与Cristiano Ronaldo建立全球合作伙伴关系
- Bureau Veritas Acquires ArcVera Renewables to Accelerate Growth and Create a New Stronghold in the R
- 内蒙古凯瑞高分子有限公司:以创新驱动发展,绘就产业新蓝图
- 九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理
- 线下陪诊APP平台如何帮助用户解决就诊“难”的问题?
- 新松多可机器人亮相 2026 中国人形机器人生态大会
- Freshworks Announces Strategic Collaboration Agreement with AWS to Increase the Reach of its AI-boos
- 人气摄影比赛获奖者在大型新展览开幕之际公布,展现世界各地混凝土的重要作用和美感
- PLIDCO® Introduces Industry-Leading 10-Year Limited Warranty
- 扬先生领航疤痕修复新纪元,“互联网+”赋能美容业增长!
- Rimini Street Launches Rimini Manage™ for Dayforce
- 泰康惠赢人生(爱家版):夯实财富基石,锁定幸福人生
推荐
-
看新东方创始人俞敏洪如何回应董宇辉新号分流的?
(来源:中国证券报)
东方甄选净利润大幅下滑
资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工
昨天(26日),新疆最大的热电联产项目—&md
资讯
-
国足13次出战亚洲杯首次小组赛0进球
北京时间1月23日消息,2023亚洲杯小组
资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态!
2月20日凌晨2点,奥运冠军刘翔更新社交账号晒
资讯
-
王自如被强制执行3383万
据中国执行信息公开网消息,近期,王自如新增一
资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理?
记者从国家医保局了解到,近期,全国大部分地区
资讯
-
中央气象台连发四则气象灾害预警
暴雪橙色预警+冰冻橙色预警+大雾黄色预警+
资讯
-
大家一起关注新疆乌什7.1级地震救援见闻
看到热气腾腾的抓饭马上就要出锅、村里大家
资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷
星标★
来源:桌子的生活观(ID:zzdshg)
没
资讯
-
周星驰新片《少林女足》在台湾省举办海选,吸引了不少素人和足球爱好者前来参加
周星驰新片《少林女足》在台湾省举办海选,吸
资讯

