首页国内国际社会军事科技财经体育娱乐

🔄 采集科技文章

谷德专业资讯网专业·及时·权威

首页采集科技文章返回首页

通义实验室推出通用智能体评测基准PawBench|人工智能模型|pawbench

📰 谷德专业资讯网 ⏰ 2026-06-05 21:48 👁 22195 阅读

6月5日，通义实验室推出评测基准PawBench，v1.0版本已开源。它面向个人助理与通用智能体场景，将底座模型与运行框架（Harness）纳入同一评测体系。据介绍，PawBench不是单纯做一个模型排行榜，而是把“模型、Harness、任务”三者放在一起做交叉评测。

本文标签：科技人工智能

🔥 专题推荐

经济发展报告

洞察经济趋势

科技创新前沿

探索科技未来

2024全国两会

聚焦两会热点

🔥 科技热门

• 机构：一季度全球OLED智能手机面板出货量约

• 腾讯云率先支持Hermes Agent云端快

• 中央网信办：将发布《人工智能应用伦理安全指引

• Kimi即将完成20亿美元融资 DeepSe

• 中汽协：3月新能源汽车销量同比增长1.2%|

• 动力电池专委会召开2026年第一次标准评审会

🏷️ 热门标签

社会新闻交通电影房价战机直播大数据明星就业银行 AI 综艺 A股环保世界杯足球合作 5G 装备俄罗斯