首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

腾讯混元提出Stem稀疏注意力算法,首字延迟降低3.6倍|算子|hpc|stem|知名企业

6月5日,腾讯混元宣布提出Stem稀疏注意力算法,已被机器学习顶会ICML-26收录。根据Stem算法×HPC算子的全栈加速方案,算法层面,Stem通过Token位置衰减(TPD)和输出感知度量(OAM)实现25%预算下的近无损精度;算子层面,HPC开源的Stem+BSA算子将稀疏收益转化为真实硬件加速,128K上下文下首字延迟降低3.7倍。

📚 相关阅读

• ChatGPT将迎史上最大改版,从单一聊天变身“超级应用”|谷歌|智能体|人工智能|网络信息|知名企业|openai
• 人形机器人规模化元年:保险如何破解用户“不敢用”困局?|本体|保险产品|火山引擎
• 国家航天局:要布局太空算力、太空制造!|卫星|商业航天|中国航天日
• 影响市场重大事件:  马斯克:SpaceX今年或在火箭的完全快速可复用性方面取得成功;我国“逐日工程”研究取得重大进展,为太空筑起“无线充电站”奠定基础|摩尔|人工智能|埃隆_马斯克|spacex|太空探索技术公司
• 海信回应:主流品牌空调都用铜管,“真铜实料”非格力原创|海尔|格力电器
• “龙虾热”能持续多久?AI智能体重塑软件业的危与机|工作流|大模型|人工智能