首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

小米MiMo首次公开模型推理系统全链路优化技术细节|序列|小米集团|开源模型|知名企业|小米mimo

5月30日,小米正式公开MiMo-V2.5系列模型的推理系统全链路优化方案。据小米方面介绍,团队围绕Hybrid SWA+MoE+多模态的复合架构,系统性重构了从KVCache管理、分级缓存、前缀缓存到调度策略与Prefill/Decode链路的完整推理栈,KVCache存储压缩至同级方案的约1/7,在长序列场景下推理成本大幅下降——这是本次降价的核心技术基础。5月27日,MiMo-V2.5系列API完成永久降价,最高降幅达99%,不区分输入长度。

📚 相关阅读

• 我国测控装备智能化测评技术迈上新台阶|计量|先进水平
• OpenAI将通过亚洲云服务商Datasection进行最新模型部署|微软|云平台|知名企业|openai|datasection
• 浙江联通今日起全面关停3G网络|资费|通信|中国联通|3g网络|三大运营商
• 广东:运用人工智能技术优化芯片设计、制造全流程|广东省
• 科技早报 | 抖音否认DeepSeek研究员近亿元年薪入职字节;大疆OSMO Pocket 4开售|谷歌|台积电|知名企业|埃隆_马斯克|deepseek
• Kimi、千问等AI集体押注世界杯⋯⋯大模型不再比拼聊天,为何集体扮演“懂球佬”?|足球|王岩|张庆|胡延平|kimi