5月19日有投资者向科大讯飞(002230)提问:Token消耗仅为竞品1/3,星火flash模型如何做到极致降本?商业化优势有多大?
6月11日公司回答表示:您好,公司于2026年4月29日正式发布讯飞星火X2-Flash(30B),同步开放API,实测效果接近业界万亿级参数模型,Tokens消耗成本大幅优化。此次星火X2-Flash在国产算力上实现性能提升与成本下降的双赢,主要原因系数据、模型结构和训练推理系统的协同优化。1、智能体数据高效闭环,突破高质量数据瓶颈。针对智能体数据轨迹长、逻辑复杂等问题,讯飞在国产算力上构建了可验证的星火大规模智能体数据自动合成平台,依赖Agent自主搭建环境、检测结果准确性,实现了智能体数据高效合成和闭环。2、上下文大幅拓展,攻克国产算力长文本训练难题。星火X2-Flash率先在国产算力上实现了DSA(稀疏注意力)与MTP(多token预测)结合的长文本高效训练,上下文拓展至256K,通过亲和国产芯片的算子和分布式训练策略深度优化实现训练效率相比同规模A800集群从20%提升到90%,解决了智能体长上下文在国产芯片训练慢的难题。3、采样与解码效率提升,扫清RL训练耗时障碍。在智能体强化学习训练场景,星火X2-Flash通过上述的算法创新+工程创新,大幅提升了采样推理效率,相对于非DSA结构的采样解码效率最高可以提升2倍以上。该突破,一定程度缓解了910B上智能体长交互场景下采样效率过低影响RL训练问题,为后续的大规模强化学习对齐训练扫清了算力障碍。经AstronClaw实测,星火X2-Flash在深度研究报告、Skill管理与调用、系统控制与执行等多类“养龙虾”最常用的任务上效果接近业界万亿级参数模型效果;在相同工作流下,整体 token 消耗不到当前主流大尺寸模型的三分之一,显著降低了开发者构建复杂 Agent 应用的使用成本。感谢您的关注。



