开发学院

您的位置:首页>资讯>正文

资讯

深度求索旗舰模型永久降价 75% 人工智能推理成本迎来结构性重置

开发学院2026-05-23 08:16:01
近期,人工智能基础设施领域发生重要变动,深度求索官方证实旗下旗舰级 API 模型将在促销期结束后实施永久性价格调整,幅度高达四分之三。

  近期,人工智能基础设施领域发生重要变动,深度求索官方证实旗下旗舰级 API 模型将在促销期结束后实施永久性价格调整,幅度高达四分之三。这意味着前沿级人工智能推理市场的基准价将被重新定义,调整后未缓存的输入 Token 价格从每百万个 1.74 美元降至 0.435 美元,输出价格则由 3.48 美元下调至 0.87 美元,折合人民币约为三元与六元每百万 Tokens。这一举措并非短期的优惠券活动,而是对行业定价逻辑的一次根本性修正。


  支撑如此大幅度降价的核心在于底层架构的颠覆式创新。该模型采用了混合注意力架构,结合了压缩稀疏注意力与重度压缩注意力技术,在百万级上下文的场景下,其单 Token 推理算力需求仅为前代产品的百分之二十七,KV 缓存占用更是缩减至一成左右。这种技术突破直接导致长文本处理的算力成本大幅下降,尤其是在重复使用上下文的场景中,其已缓存输入 Token 的成本远低于国际主流竞品,差距可达百倍之多,这对需要频繁扫描代码库、合同及历史案例的智能体系统产生了决定性的影响。


  若以实际工作负载进行成本测算,市场格局呈现出明显的两极分化。在处理千万级输入与百万级输出的典型任务时,部分顶级竞品的成本是此次调价后模型的数十倍甚至上百倍。这种惊人的性价比并非盲目的商业补贴,而是源于算法与工程层面的极致优化。对于缺乏自有工作流或数据的 API 转售商而言,过去依靠转手高价 Token 赚取利差的商业模式将面临利润崩塌的风险,而针对普通模型进行简单包装的 SaaS 服务商也将直面客户精算成本的挑战。然而,对于高 Token 消耗量的开发者来说,这无疑是黄金时代的开启,无论是 AI 编程智能体还是合规自动化领域,过去受限于输出成本的瓶颈已不复存在。


  随着价格门槛的降低,行业价值链条正在发生转移。深入探究背后的结构性差异可以发现,该模型源自国内量化对冲基金背景,运营环境将开源 AI 与技术自给自足视为明确目标,且已针对国产 AI 芯片进行了优化适配,使其不仅是一款商业产品,更被视为国家级的算力基础设施投资。相较于部分海外竞争对手需要维持高额估值并假设模型使用权保持稀缺,当具备竞争力的对手打破这种稀缺性时,API 层面便陷入了结构性通缩,价值将加速向上游转移,流向工作流所有权、私有数据与垂直整合领域。历史经验显示,廉价电力最终并没有让发电厂暴富,而是催生了无数改变世界的工厂,在 AI 新时代,真正的赢家将是那些能够为每位用户提供强大推理能力、动态套利模型质量与成本,以及掌握专属工作流的参与者。