一、Step-2 mini 的基本介绍
2025 年 1 月 20 日,阶跃星辰推出 Step-2 mini,它是 Step-2 系列语言模型的新品。参数量小但性价比高,仅用 3% 左右的参数量就保有 Step-2 80% 以上的性能。计算处理速度快,输入 4000tokens 时平均首字时延仅 0.17 秒。定价亲民,输入 1 元 / 百万 token,输出 2 元 / 百万 token。
技术架构上,采用自主研发的新型注意力机制架构 MFA 及其变体 MFA-Key-Reuse,相比常用的 MHA 架构,节省近 94% 的 KV 缓存开销,推理速度更快,成本更低,在对响应速度要求高的场景优势明显。

二、Step-2 mini 的相关介绍
Step-2 mini 源于强大的 Step-2 语言模型,Step-2 于 2024 年表现出色,在指令遵从能力方面,在 LiveBench 的 IFAverage 测试中位列全球第五。
Step-2 采用的 MoE 架构通过选择性激活部分专家网络提升性能和计算效率。阶跃星辰选择从头开始训练的策略,虽难度大、资源投入高,但能提升模型性能上限。
Step-2 mini 继承了 Step-2 的优秀特质,并在参数量、性价比、生成速度等方面改进优化,MFA 架构与 MoE 架构分别在推理速度和整体性能上做出贡献。
三、Step-2 mini 的应用场景
(一)文本生成相关应用
可用于快速生成文字内容的场景,如撰写新闻简讯、商业文案、创意写作等。
(二)交互领域
适用于智能聊天机器人开发或优化,如小型在线客服、社交聊天 APP、在线教育平台的智能答疑等。
(三)作为基础模块协助其他系统
可嵌入其他软件系统或工作流程,如自动化文档处理、智能写作辅助工具、代码批注生成等。
四、Step-2 mini 的使用方式
用户可在阶跃星辰开放平台调用其 API 接口使用,按规定输入数据并接收输出,输入按 1 元 / 百万 token 计费,输出按 2 元 / 百万 token 付费。使用时要合理评估输入任务,参考官方开发文档掌握准确方法。
五、Step-2 mini 的优缺点
(一)优点
-
性价比高
适合预算有限的小型企业、创业团队和个人开发者,以低成本获得较好的语言处理能力。 -
生成速度快
在实时性要求高的场景如实时聊天和新闻编写中表现出色,能及时回复和快速出稿。 -
推理成本低
采用的架构节省 KV 缓存开销,降低计算开销,能应对更多交互请求。
(二)缺点
-
参数量有限带来的性能局限
处理高度复杂和深度推理任务时可能吃力,如复杂学术研究论文创作。 -
可能不太适合大规模深度定制
相对紧凑的结构和性能设定,可能不适合企业级大型定制项目。