图片来源:princeea网站
如果AI系统作出了正确预测,但却以完全不同的方式解释其得出的这些结果,会发生什么?DFKI数据科学团队介绍了“X-hacking”给AI可信度带来结构性风险的研究成果。
X-hacking一词源于统计学中的P-hacking。所谓P-hacking指的是研究人员可通过一些数据操作技巧,在统计学上得出一个有显著意义的结果,即使这个结果实际上并无意义。这相当于一种数据篡改,可能会导致发布假阳性结果。
相应的X-hacking描述了两种核心机制:一是Cherry-picking,即从众多同样优秀的模型中,精心挑选出解释能力最强、最能支持预期结果的模型;二是定向搜索,AutoML系统不仅能优化预测性能,还能精准地找到具有特定解释模式的模型。但这里面存在的风险往往被低估。
即使模型得出的结果几乎相同,所谓的特征重要性也可能存在巨大差异。这在医学研究或社会科学等应用领域尤为敏感,因为在这些领域,可解释的模型通常构成关键决策的基础。
AutoML代表了开发、选择和优化机器学习模型的自动化流程。软件工具接管了许多以前只有经验丰富的机器学习工程师才能完成的任务,例如选择合适的模型架构、数据预处理和超参数优化等。在医学、工业或社会研究等数据密集型领域,AutoML有望实现更快的开发速度、更低的进入门槛和可重复的结果。
然而,这种自动化使得人们难以理解模型决策的制定方式,这是可解释AI的一个关键问题。因此,DFKI研究团队建议,使用AutoML的学科应该意识到方法的风险,而不仅仅只是信任软件。
关键词:
凡注有"环球传媒网"或电头为"环球传媒网"的稿件,均为环球传媒网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网",并保留"环球传媒网"的电头。
- 北京防汛一级应急响应 遇极端情况地铁将立即封站区段停运 新消息
- 人民日报刊文评陈佩斯喜剧艺术:一位喜剧人的艺术探索和理论自觉 每日快看
- 探访全球最大塔机工厂,中联重科:海外市场成新增长引擎,占比六成|最新消息
- 国家发展改革委紧急安排5000万元支持河北暴雨洪涝灾害灾后应急恢复
- “十四五”以来税务部门共查处违法纳税人6.21万户,挽回各类税款损失5710亿
- 6月中国规上工业企业利润同比降幅收窄 每日资讯
- 微动态丨水淋淋的是什么意思?水淋淋的是什么梗?
- 《海南历史文化名人丛书》全系列100种面世首发 焦点要闻
- 世运会探馆Vlog:“顺势”建成的水上项目场地
- 每日热讯!三伏天来了,这些养生误区要避免
资讯
焦点
- 入股不亏是什么意思?入股不亏是什么梗?
- 浙江长兴:外卖骑手组队为高龄老人免费送餐到家
- 播报:税务总局:从今年个税汇算看,超1亿纳税人依法申请退税1300多亿,700多万纳税人申报补税480余亿
- 即时:事关3800万货车司机!交通运输部部署保障司机合理劳动报酬
- 热议:“竹梦”抵达成都熊猫基地 成龙携火炬登顶“笋子塔”
- 全国东西南北中羽毛球大赛鸡西大区赛开赛 头条焦点
- 甘肃魏晋画像砖特展长沙开幕 “砖”看古人生活日常|热点
- 你已超过99%的人!助力世运火炬传递没你不行
- 新华社权威速览·非凡“十四五”|减轻看病就医负担,医保支付这样发力!-每日热议
- 拼盘动画片如何摆脱“番剧感”? 从《聊斋:兰若寺》的6段故事说起