阶跃星辰Step3.5 Flash连续三天登上OpenClaw榜首

StepFun's Step-3.5 Flash model has ranked first in API call volume on the OpenClaw benchmark for three consecutive days, according to data from the global AI model API aggregator OpenRouter. Since March 2026, the top three positions have been held by Chinese models: Moonshot AI's Kimi K2.5, StepFun's Step-3.5 Flash, and MiniMax's M2.5, signaling a shift in AI competition towards application-layer metrics like cost-efficiency and inference speed.

阶跃星辰Step3.5 Flash连续三天登上OpenClaw榜首

全球AI模型API聚合平台OpenRouter的最新数据显示,阶跃星辰的Step-3.5 Flash模型在OpenClaw基准测试上的调用量已连续三日位居全球首位,标志着中国大模型在技术应用层面的一次显著突破。这一排名变化不仅反映了模型性能的市场认可度,也预示着全球AI应用层竞争正从单纯的技术参数比拼,转向更注重实际可用性和成本效益的实战阶段。

关键要点

  • 调用量登顶:阶跃星辰的Step-3.5 Flash模型在OpenRouter平台的OpenClaw基准测试中,调用量连续三天排名全球第一。
  • 三强格局:自2026年3月以来,全球调用量前三名依次为月之暗面的Kimi K2.5、阶跃星辰的Step-3.5 Flash和MiniMax的M2.5,形成了稳固的中国模型第一梯队。
  • 平台权威性:数据来源于OpenRouter,该平台是全球最大的AI模型API聚合器,其调用量数据是衡量模型市场受欢迎程度和实用性的关键指标。
  • 竞争焦点转移:排名表明,AI竞争已深入至应用层,模型的推理速度、成本效率和API稳定性成为开发者选择的核心因素。

OpenRouter数据揭示的中国大模型新格局

根据OpenRouter平台发布的实时数据,阶跃星辰(StepFun)推出的Step-3.5 Flash模型近期表现突出。该模型在专门用于评估API模型综合能力的OpenClaw基准测试集上,其API调用请求量已持续超越包括GPT-4 Turbo、Claude 3.5 Sonnet在内的国际主流模型,稳居榜首。这一成就并非偶然,数据显示,从2026年3月开始,全球调用量排行榜的前三把交椅就一直由中国公司包揽:月之暗面(Moonshot AI)的Kimi K2.5、阶跃星辰的Step-3.5 Flash以及MiniMax的M2.5

OpenRouter作为连接开发者与众多AI模型API的枢纽,其调用量数据直接反映了开发社区的真实选择。调用量领先意味着Step-3.5 Flash在性价比、响应速度或特定任务性能上获得了大量开发者的用脚投票。这通常与模型提供商极具竞争力的定价策略、稳定低延迟的API服务,以及在长上下文、代码生成等关键场景下的优化密切相关。

行业背景与深度分析

此次排名变化并非孤立事件,而是中国大模型产业经过数年技术积累后,在应用落地层面集体爆发的缩影。与OpenAI、Anthropic等公司主要通过在MMLU(大规模多任务语言理解)、GPQA(专业问答)等学术基准上刷新高分来确立技术领导地位不同,中国头部模型公司正采取一种更贴近市场的“应用优先”策略。OpenClaw等基准更侧重于API层面的综合体验,包括推理速度、成本、可用性等实战指标。

从技术路径看,Step-3.5 FlashKimi K2.5的领先,凸显了长上下文处理能力已成为当前的核心竞争力。例如,Kimi早前因支持数百万字超长上下文而闻名,而Step-3.5 Flash很可能在保持长上下文优势的同时,通过模型蒸馏、架构优化等手段大幅提升了推理效率并降低了成本。相比之下,虽然GPT-4在综合能力上可能仍占优势,但其更高的API成本和有时出现的速率限制,可能促使成本敏感型开发者转向性价比更高的替代品。

市场数据也支撑了这一趋势。根据SimilarWeb估算,Kimi Chat的全球网站访问量在2024年曾出现指数级增长,峰值时月访问量超过数千万,这为其API模型的推广奠定了用户基础。同时,中国大模型公司在资本市场上也备受青睐;以月之暗面为例,其在2024年初完成的融资估值已超过百亿美元,充足的资金为其技术迭代和市场扩张提供了燃料。这种“技术突破 -> 用户增长 -> 开发者生态繁荣”的正循环正在加速形成。

未来影响与发展趋势

这一排名格局对未来AI行业将产生多重影响。首先,全球AI模型市场将进一步多元化。开发者将拥有更多来自中国供应商的高性价比选择,这可能会对OpenAI等公司的定价策略构成压力,推动全球API服务价格的整体下降,最终惠及广大开发者和终端用户。

其次,竞争焦点将深化至垂直领域与生态系统。当基础模型能力逐渐接近时,胜负手将转向谁能更好地服务于特定行业(如金融、法律、编程),以及谁能构建更繁荣的开发者工具和代理(Agent)生态系统。调用量是生态健康的先行指标,排名靠前的公司有望吸引更多开发者,从而巩固其护城河。

最后,需要关注可持续性与下一代技术突破。调用量的领先依赖于持续的运营优化和技术迭代。下一步的观察点在于:第一,这些模型在更严苛的学术基准(如最新版的MT-BenchHumanEval代码基准)上的表现是否同步提升;第二,各家公司在下一代“超级模型”(如对标GPT-5/Gemini 2.0 Ultra级别)的研发进度;第三,如何将流量优势有效转化为商业收入,实现可持续发展。

总而言之,OpenRouter的数据清晰地揭示了一个新趋势:中国顶尖的大模型公司已不仅在论文或封闭测试中证明自己,更在开放的全球开发者市场中赢得了实实在在的份额。这标志着AI竞赛进入了以“应用采纳度”为核心的新赛段,将对全球AI产业格局产生深远影响。

常见问题