Breaking: Step-3.5 Flash Tops OpenClaw for 3 Days Straight

全球AI模型API聚合平台OpenRouter的最新数据显示，阶跃星辰的Step-3.5 Flash模型在OpenClaw基准测试上的调用量已连续三日位居全球首位，标志着中国大模型在技术应用层面的一次显著突破。这一排名变化不仅反映了模型性能的市场认可度，也预示着全球AI应用层竞争正从单纯的技术参数比拼，转向更注重实际可用性和成本效益的实战阶段。

关键要点

调用量登顶：阶跃星辰的Step-3.5 Flash模型在OpenRouter平台的OpenClaw基准测试中，调用量连续三天排名全球第一。
三强格局：自2026年3月以来，全球调用量前三名依次为月之暗面的Kimi K2.5、阶跃星辰的Step-3.5 Flash和MiniMax的M2.5，形成了稳固的中国模型第一梯队。
平台权威性：数据来源于OpenRouter，该平台是全球最大的AI模型API聚合器，其调用量数据是衡量模型市场受欢迎程度和实用性的关键指标。
竞争焦点转移：排名表明，AI竞争已深入至应用层，模型的推理速度、成本效率和API稳定性成为开发者选择的核心因素。

OpenRouter数据揭示的中国大模型新格局

根据OpenRouter平台发布的实时数据，阶跃星辰（StepFun）推出的Step-3.5 Flash模型近期表现突出。该模型在专门用于评估API模型综合能力的OpenClaw基准测试集上，其API调用请求量已持续超越包括GPT-4 Turbo、Claude 3.5 Sonnet在内的国际主流模型，稳居榜首。这一成就并非偶然，数据显示，从2026年3月开始，全球调用量排行榜的前三把交椅就一直由中国公司包揽：月之暗面（Moonshot AI）的Kimi K2.5、阶跃星辰的Step-3.5 Flash以及MiniMax的M2.5。

OpenRouter作为连接开发者与众多AI模型API的枢纽，其调用量数据直接反映了开发社区的真实选择。调用量领先意味着Step-3.5 Flash在性价比、响应速度或特定任务性能上获得了大量开发者的用脚投票。这通常与模型提供商极具竞争力的定价策略、稳定低延迟的API服务，以及在长上下文、代码生成等关键场景下的优化密切相关。

行业背景与深度分析

此次排名变化并非孤立事件，而是中国大模型产业经过数年技术积累后，在应用落地层面集体爆发的缩影。与OpenAI、Anthropic等公司主要通过在MMLU（大规模多任务语言理解）、GPQA（专业问答）等学术基准上刷新高分来确立技术领导地位不同，中国头部模型公司正采取一种更贴近市场的“应用优先”策略。OpenClaw等基准更侧重于API层面的综合体验，包括推理速度、成本、可用性等实战指标。

从技术路径看，Step-3.5 Flash和Kimi K2.5的领先，凸显了长上下文处理能力已成为当前的核心竞争力。例如，Kimi早前因支持数百万字超长上下文而闻名，而Step-3.5 Flash很可能在保持长上下文优势的同时，通过模型蒸馏、架构优化等手段大幅提升了推理效率并降低了成本。相比之下，虽然GPT-4在综合能力上可能仍占优势，但其更高的API成本和有时出现的速率限制，可能促使成本敏感型开发者转向性价比更高的替代品。

市场数据也支撑了这一趋势。根据SimilarWeb估算，Kimi Chat的全球网站访问量在2024年曾出现指数级增长，峰值时月访问量超过数千万，这为其API模型的推广奠定了用户基础。同时，中国大模型公司在资本市场上也备受青睐；以月之暗面为例，其在2024年初完成的融资估值已超过百亿美元，充足的资金为其技术迭代和市场扩张提供了燃料。这种“技术突破 -> 用户增长 -> 开发者生态繁荣”的正循环正在加速形成。

未来影响与发展趋势

这一排名格局对未来AI行业将产生多重影响。首先，全球AI模型市场将进一步多元化。开发者将拥有更多来自中国供应商的高性价比选择，这可能会对OpenAI等公司的定价策略构成压力，推动全球API服务价格的整体下降，最终惠及广大开发者和终端用户。

其次，竞争焦点将深化至垂直领域与生态系统。当基础模型能力逐渐接近时，胜负手将转向谁能更好地服务于特定行业（如金融、法律、编程），以及谁能构建更繁荣的开发者工具和代理（Agent）生态系统。调用量是生态健康的先行指标，排名靠前的公司有望吸引更多开发者，从而巩固其护城河。

最后，需要关注可持续性与下一代技术突破。调用量的领先依赖于持续的运营优化和技术迭代。下一步的观察点在于：第一，这些模型在更严苛的学术基准（如最新版的MT-Bench或HumanEval代码基准）上的表现是否同步提升；第二，各家公司在下一代“超级模型”（如对标GPT-5/Gemini 2.0 Ultra级别）的研发进度；第三，如何将流量优势有效转化为商业收入，实现可持续发展。

总而言之，OpenRouter的数据清晰地揭示了一个新趋势：中国顶尖的大模型公司已不仅在论文或封闭测试中证明自己，更在开放的全球开发者市场中赢得了实实在在的份额。这标志着AI竞赛进入了以“应用采纳度”为核心的新赛段，将对全球AI产业格局产生深远影响。

阶跃星辰Step3.5 Flash连续三天登上OpenClaw榜首

关键要点

OpenRouter数据揭示的中国大模型新格局

行业背景与深度分析

未来影响与发展趋势

常见问题

关键要点

OpenRouter数据揭示的中国大模型新格局

行业背景与深度分析

未来影响与发展趋势

常见问题

相关推荐

阶跃星辰Step3.5 Flash连续三天登上OpenClaw榜首

阶跃星辰Step3.5 Flash连续三天登上OpenClaw榜首

美团联合联想百应上线OpenClaw远程部署服务

前大疆工程师创业，宇树天使投资人出手，仿生柔性机器人公司完成新融资｜硬氪首发

美团联合联想百应上线OpenClaw远程部署服务

clawhub — Skill Directory for OpenClaw