首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

大语言模型会在蒸馏中“夹带”自己的偏好|算法|私货

财联社4月16日电,《自然》15日发表的一项研究显示,大语言模型(LLM)可能会将某些自己的偏好“夹带私货”传授给其他算法,即使在训练数据中清除原始特征后,这些本不需要的特征,仍可能持续存在。在一个案例中,一个模型似乎通过数据中的隐含信号,将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明,在开发LLM时,需要进行更彻底的安全检查。

📚 相关阅读

• 深圳“细胞十条”发布,推动细胞与基因产业提速发展
• 又一颗“力箭”待发!中科宇航将执行一箭8星任务|航天早参|商业航天|中国卫星|火箭发射协议
• 汽车公司上新越来越多,为何却更难塑造爆款?|新车|电动汽车|中国汽车|新能源汽车产业
• 鼎龙股份:拟3000万元扩建生产线,重点布局玻璃基板CMP抛光垫等|cmp
• 微软Bing搜索结果引入AI摘要功能,逐步推进智能搜索体验|搜索引擎|bing|ai摘要|财务会计|财务报表|蓝屏事件|MicrosoftBing
• 腾讯云:调整CodeBuddy、WorkBuddy计费方案|企业版|知名企业|workbuddy|codebuddy