
今天(3月4日),中国大模子创业公司阶跃星辰继开源Step 3.5 Flash模子后,又开源了这款Agent基座模子的预磨练权重(Base)、中磨练权重(Midtrain)以及配套的Steptron磨练框架。这一举动在面前大模子开源趋于保守的环境下,显得颇为澈底,在开源社区激发烧烈反响。


据了解,Step 3.5 Flash选拔寥落MoE架构,每个token仅激活约110亿参数(合计1960亿),在单央求代码类任务上最高推理速率可达每秒350个token。在Agent场景和数学任务上,Step 3.5 Flash的身手靠拢闭源模子,简略胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模子。
{jz:field.toptypename/}在拓荒者社区和本体诓骗中,Step 3.5 Flash照旧速即获取了商场考据。律例当今,这款模子在Hugging Face高下载量已超30 万次。就在3月2日,Step 3.5 Flash单日调用量已越过40B,在OpenClaw(被中国网友称为“小龙虾”)的调用量榜中排行第二。
OpenClaw 调用量模子排行
值得一提的是,向来低调的阶跃星辰研发团队,陌生地现身连络社区回答群众拓荒者联系Step 3.5 Flash的发问。
有拓荒者发问:在操办Step 3.5 Flash时,你们是否心中照旧对准了这个特定的“最好均衡点”:89 tokens/参数,AG庄闲游戏官网首页而且恰恰卡在消耗级硬件限制的上限(128GB用于Q4量化,11B激活参数以保确认用的起初速率)?
阶跃星辰CTO朱亦博回应称,团队确切有明确蓄意,即让连络模子简略起初在128GB内存系统中。他发现,当今商场上约230B限制的模子,刚好超出了其个东说念主MacBook Pro竖立4位量化的承受规模,因此他便条目团队对模子限制进行了合适缩减。从拓荒者的角度去研发财具,而不是闪拓荒者来适住持具。有拓荒者说,这恰是他以为雀跃的场地。
在与阶跃星辰研发团队的疏通中,有拓荒者但愿阶跃星辰不错将基础模子与领导/想考模子悉数发布,这么社区就不错对它进行微调了。
阶跃星辰对拓荒者有问必答——今天,阶跃星辰将Step 3.5 Flash的预磨练权重、中磨练权重以及配套的Steptron磨练框架一同开源,但愿通过更澈底的开源,闪拓荒者简略以Step 3.5 Flash为基座进行更深度模子定制,打造真实属于我方的Agent。

新民晚报记者翔实到,短时辰内,外洋社区对阶跃星辰进一步开源的响应相配横暴。
业内巨匠分析,跟着OpenClaw等Agent平台热度抓续升温,Step 3.5 Flash的开源或将进一步加快中国模子在群众Agent生态中的浸透。