OnetoAll一种策略控制多个智能 - 预防 - 肺气肿能不能治好肺气肿能不能治好

查看: 23\|回复: 0	OnetoAll一种策略控制多个智能 [复制链接]

发送短消息 UID 222 精华 0 查看公共资料搜索主题搜索帖子 TUhjnbcbe TUhjnbcbe 组别新手上路生日帖子1 积分12 性别注册时间2020-03-27	1^# 字体大小: t T 发表于 2024-10-25 16:13 \|只看楼主克白灵苏孜阿甫片 https://m-mip.39.net/czk/mipso_4329419.html 作者陈大鑫编辑丛末还记得三年前DeepMind研究的AI跑酷吗？火柴人成功突破墙壁的障碍，兴奋的手舞足蹈：火柴人在学习跑、跳（jump）：（火柴人就是agent，中译为智能体，这里表现出来的就是在模拟器环境下的智能小人。） “AI跑酷”是DeepMind在AlphaGo之后开发的另一项强化学习算法。然而当时的强化学习算法只能每次使用一种策略来训练一个智能体模型。那如果想要一次训练几十上百种智能体模型（如上图所示）该怎么办？难道要训练几百次吗？近日，一篇发表在ICML上的论文提出了一种方法：仅仅需要一种策略就可以同时训练所有的智能体。这篇论文在Twitter上获得了很大的
	分享转发

	TOP

OnetoAll一种策略控制多个智能 [复制链接]