财 经 科技 | 股 票 房 产 原 创 |   中国经济时报电子版
商 业 地 方 | 文 化 汽 车 APP |   中国经济时报数字报

新品看台

首页 > 科技频道 > 新品看台

DeepMind推用于顺序决策的元学习模型

中国经济新闻网 2019-06-18 10:56:56

  6月18日消息,DeepMind在推特上宣布,研究人员引入了一个统一的概率框架来解决从贝叶斯优化到contextual bandits框架以及强化学习的顺序决策问题。该框架基于概率模型的方法,并能够在解释观察到数据的同时,在决策过程中捕获预测不确定性。这种概率模型被选择为元学习系统,它允许从相关问题的分布中学习,允许数据有效地适应目标任务。研究人员将该框架应用于如控制问题,推荐系统和对RL代理的对抗性攻击等领域,展示了一种高效且通用的黑盒学习方法。

来源:智东西 编辑: 蒋帅       
微信公众号

相关阅读

中国经济新闻网版权与免责声明:

本网所刊登文章,除原创频道外,若无特别版权声明,均来自网络转载;
文章观点不代表本网立场,其真实性由作者或稿源方负责;
如果您对稿件和图片等有版权及其它争议,请及时与我们联系,我们将核实情况后进行相关删除。

联系电话:81785256;邮箱:cetcopyright@163.com

报纸订阅  关于我们  CET邮箱 
微信公众号
微信公众号
中国经济新闻网 版权所有 未经书面允许不得转载、复制或建立镜像
联系电话:(010)81785256 投稿邮箱:cesnew@163.com wlzx@cet.com.cn
中国经济时报社 地址:北京市昌平区平西府王府街 邮政编码:102209 电话:(010)81785188(总机) (010)81785188-5100(编辑部) (010)81785186(广告部) (010)81785178(发行部) 传真:(010)81785121 电邮:info@cet.com.cn 站点地图 Copyright 2011 www.cet.com.cn. All Rights Reserved
举报
不良信息举报中心
互联网新闻信息服务许可证10120180005       京ICP备07019363号-1       京公网安备110114001037号