首页
增强学习可让人工智能通过探索和理解来进行决策
根据《自然》最新发表的一项研究,一类增强学习算法在雅达利经典游戏中的得分超过了人类玩家和已有的人工智能系统。这类算法被统称为go-explore,它改善了对复杂环境的探索方式,或有望朝着实现真正智能学习体迈出重要一步。
增强学习可以让人工智能系统通过探索和理解复杂环境来进行决策,并学习如何以最优的方式获得奖励。然而,当遇到很少给予反馈的复杂环境时,目前的加强学习算法似乎很容易碰壁。
但go-explore突破了这些障碍。它可以对环境进行全面探索,同时构建一个档案库来记住它去过的地方,确保自己不会忘记通往有望成功的中期阶段或是最终胜利(奖励)的路线。
利用这类算法,论文作者解决了之前未能解决的2600个雅达利游戏,验证了这类算法的潜力。作者指出,记住并回到有望成功的探索区域的简单原则,是一种强大、通用的探索方法。他们认为论文所报道的算法有望应用于机器人、语言理解和药物设计。
3C行业工业机器人将迎来一轮新的爆发
拓维信息联合湘江实验室发起成立全国首个开源鸿蒙创新研究院
LTC3202充电泵提高了为白光LED供电的效率
全集成型CMOS LDO线性稳压器设计
GAMEMAX电竞2号机箱评测 的确是良心之作
增强学习可让人工智能通过探索和理解来进行决策
无人驾驶技术和Apollo平台走进社会大众
关于ispMACH4000系列CPLD的功能介绍
美光科技推出专为消费类应用设计的新型闪存
PCB在军队的运用 航空航天和国防
中国智能制造已走30%路程 产业升级待资本助力
室内电气工程基础知识之配线的注意事项
工程师深入解说笔记本爱护小常识
F5G与5G的协同联动将加速开启一个万物互联的智能世界
Onepanel通过PaaS平台来支持人工智能的开发
Intel发布补丁 修复vPro安全漏洞
RS485总线连接采用什么样的线缆呢?多台RS485设备如何连接呢?
奥克斯空调走心玩转跨界营销 微电影有大内涵
面向物联网,风河推出计算套件和免费云连接操作系统
Altium发布NanoBoard 3000 FPGA开发板