快乐彩app官方下载 上海大模子发力!稀奇Grok,阶跃星辰开源语音模子登顶巨擘评测榜单

{jz:field.toptypename/}

{jz:field.toptypename/}

新民晚报记者今天(1月15日)从上海大模子创业公司阶跃星辰获悉:寰球闻明巨擘大模子评测榜单Artificial Analysis Speech Reasoning更新,阶跃星辰原生音频推理模子Step-Audio-R1.1登顶榜首,以96.4%准确率,稀奇Grok、Gemini、GPT-Realtime等主流一线模子,刷新历史最佳获利。现在,阶跃星辰已将这款模子开源,确立者不错下载体验。

阶跃星辰原生音频推理模子Step-Audio-R1.1登顶Artificial Analysis Speech Reasoning榜首

据了解,该榜单是现在业界评估“原生语音模子”(Native Audio Models)最巨擘的第三方基准之一。中枢考量模子获胜惩办音频并进行复杂逻辑推理的智商,主要锤真金不怕火维度包括准确率、首包延迟等。

笔据榜单评测,在性能与速率的抽象量度上,Step-Audio-R1.1全面“碾压”同类语音模子。

2025年11月,开云app官方阶跃星辰发布了寰球首个开源原生音频推理模子Step-Audio-R1,不错在不加多特地时延的情况下,端到端雄厚语音实质,并简略“像东说念主类一样听到对话即可想考”。此次发布的Step-Audio-R1.1模子,是Step-Audio-R1的升级版,快乐彩app下载兼顾更强及时对话和复杂语音推贤达商。竣工的及时语音API将在2月上线,现在洞开的chat模式已搭载Step-Audio-R1.1中枢,维持边想边说的流式推理。

和大言语模子同理,语音模子相同需要具备广大推贤达商,才略提供更高阶智能、更当然交互。基于推贤达商,Step-Audio-R1.1不仅能准确识别声息,还不错捕捉到声息背后的情怀和心思情状、意在言外,并能基于环境音推导对物理天下的雄厚。比如当听到最近爆火集聚的“海豹舞”音频时,模子不仅能识别出韩语歌词,更判断出这是典型言语学习或发音老到的音频,而非当然对话。

一种行业共鸣是,语音是末端场景下最主流的交互形态。自2025年发力“AI+末端”战术,阶跃星辰接踵发布了业内首个产等级的开源语音交互模子Step-Audio、端到端语音模子Step-Audio 2系列、音频裁剪模子Step-Audio-EditX、寰球首个开源原生音频推理模子Step Audio R1。

值得一提的是,在刚刚终结的2026年国际铺张电子展上,祯祥展示了搭载阶跃语音大模子的祯祥星河M9国际版,凭借极具真东说念主感的交互成果激发国际不雅众的热议。【延长阅读:“活东说念主感”智能座舱本来如斯丝滑!阶跃星辰端到端语音模子国际“出圈”】祯祥星河M9亦然业内首个搭载端到端语音模子的量产车型。