您现在的位置:新闻首页>科技
无需调控而胜任不同任务 这种AI更接近人类思考方式
纽约大学心理学与认知科学教授马库斯最近和人工智能企业“深层思维”(DeepMind)杠上了。继前不久在推特(Twitter)上质疑美国通用人工智能研究组织OpenAI的解魔方机械手之后,近日他又对“深层思维”新推出的《星际争霸2》智能体“阿尔法星”(AlphaStar)进化版提出六大质疑。此次,他的质疑点并不是游戏表现本身,而是指向了更高的层面:未来通用智能研究的意义。
近年最酷成果都来自深度强化学习
此次OpenAI推出的解魔方机器手,并不是像以往一样使用专业算法来解决某一个特定任务(如果换一个任务,还需要重新编程),而是通过某种学习方法,对机器人进行训练,让机械手具备类人手的解决问题的能力。但马库斯却认为这个成果描述有误导,更恰当的描述应该是“用强化学习操纵魔方”或者是“用灵巧的机器人手操纵物体的进展”。
“马库斯过于强调‘用强化学习操纵魔方’有点挑剔字眼,其实OpenAI魔方机器手和‘深层思维’发布的《星际争霸2》智能体‘阿尔法星’进化版都使用了深度强化学习技术。深度强化学习是目前公认的在现有技术中最有可能实现通用人工智能的技术。”天津大学智能与计算学部软件学院副教授郝建业解释说,目前机器学习有三大分支,监督学习、非监督学习和强化学习,深度学习属于监督学习里目前最主流的一类技术。深度强化学习是深度学习与强化学习的融合,是将深度神经网络整合到强化学习框架当中。
“近几年,深度强化学习发展迅猛,它在处理复杂、多方面和决策问题方面显示出巨大的潜力。目前深度强化学习技术主要应用在一些游戏、比赛中。”郝建业介绍,2016年,谷歌的“阿尔法围棋”(AlphaGo)击败了世界顶级围棋选手李世石、柯洁,轰动一时,成为人工智能领域的一个里程碑。“阿尔法围棋”的核心就在于使用了深度强化学习算法,使得计算机能够通过自对弈的方式不断提升棋力。此后又有脸书(Facebook)在DOTA2游戏中打败了顶级职业选手;CMU团队研发的德州扑克AI冷扑大师轻松击败顶级玩家。
此外,“深层思维”还运用深度强化学习优化了数据中心的耗能;谷歌则利用深度强化学习完成深度神经网络的自动架构搜索,提出了AutoML服务,借此将机器学习作为一种服务推广到千家万户。在我国,对于深度强化学习技术的应用也不少,阿里、腾讯、百度等国内团队将深度强化学习应用到搜索、推荐、营销、派单和路径规划等实际问题的决策中。
最有可能实现通用人工智能的技术
人工智能发展到现在的高度,技术上较大的功臣应该属于深度学习算法。深度学习利用多层神经网络,从海量的数据中学习,从而实现对未来的预测,并使人工智能系统越来越智能。目前我们应用的安防监控、自动驾驶、语音识别、百度地图等都是深度学习技术在图像视觉、语音识别、自然语言理解等领域的应用。
而强化学习也是目前机器学习领域的热门技术,与基于已知标签训练模型的监督学习不同,强化学习能够在没有计算机的明确指示下,像人一样实现自主学习。当达到一定的学习量之后,强化学习系统就能够预测出正确的结果。“强化学习的基本思想是,学习在不同环境和不同状态下,哪种行为能够使得预期利益最大化。”郝建业介绍,新版“阿尔法星”智能体就采用了强化学习的自对战技术,其学习过程不需要数据标注,而是由奖励函数进行主导。智能体获得奖励得分或赢得一场比赛,它会得到积极的反馈,智能体就会根据对战的成绩好坏,来调整行为动作。这犹如婴儿学走路,会根据产生的结果好坏来调整行为动作。
目前对通用人工智能的定义主要有两个特点,一是端对端的学习,二是任务自适应, 无需人类参与调控而胜任不同的任务。深度强化学习可以将深度学习的感知能力和强化学习的决策能力相结合,直接根据输入的信息进行控制,是一种更接近人类思维方式的人工智能技术。在与世界的正常互动过程中,强化学习会通过试错法利用奖励来学习,这跟自然学习过程非常相似。比如单手解魔方机器手,它可能需要利用深度学习的识图技术等看到魔方,而后还需强化学习的模型让机器手在不断的试错过程中自主学习。在强化学习中,可以使用较少的训练信息,这样做的优势是信息更充足,而且不受监督者技能限制。深度强化学习朝构建对世界拥有更高级理解的自主系统又迈出了一步,这也是为什么说深度强化学习是目前公认的在现有技术中最有可能实现通用人工智能的技术。
- 凡本网注明"来源:的所有作品,版权均属于中,转载请必须注明中,http://www.fj.zawww.cn。违反者本网将追究相关法律责任。
- 本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
- 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
- 01黑洞吸积物理图像“最后一块拼图”完成
科技日报讯(记者吴长锋付毅飞)记者从中国科学技术大学获悉,该校团队与中国极地研究[详细]
- 02英特尔20亿美元收购以色列人工智能芯片制造
美国芯片制造商英特尔公司16日宣布,以约20亿美元收购以色列人工智能芯片制造商哈巴纳[详细]
- 03北斗快速辅助定位系统用户已突破3亿
记者从中国兵器工业集团有限公司(以下简称兵器工业集团)11日召开的2019年科技工作会[详细]
- 04机器人图书馆上岗 海量图书各就各位
在图书馆借书时,有没有遇到这样的尴尬,明明数据库显示要借的书就在某书架上,但就是[详细]
- 055G 工业互联网 释放乘数效应
5G是新一代信息通信技术升级的重要方向,工业互联网是制造业转型升级的发展趋势。当技[详细]
- 06美欧贸易紧张升级:美上调欧盟进口飞机关税
中新网2月15日电 据外媒报道,当地时间14日晚间,美国政府宣布,将于2020年3月将欧盟[详细]
- 07我国最大潮流能发电机组研制成功
科技日报哈尔滨1月13日电 (记者李丽云 通讯员王学善)记者13日从哈电集团获悉,新年[详细]
- 08我首次完成太阳帆在轨关键技术试验
记者从中科院沈阳自动化所获悉,由该所研制的“天帆一号”(SIASAIL-I)太阳帆,搭载[详细]
- 09刷脸支付智能导航 你想要的便捷这条地铁都
不用带手机、不用带钱、不用带卡,刷脸就可以过闸坐地铁;走过一体化智能安检闸机,就[详细]
- 01生命化学分子如何起源于太空?碳分子形成环
我们已知道太空中遍布多环芳烃物质,事实上,银河系大约20%的碳都锁定在多环芳烃。 新[详细]
- 02中兴通讯与奇瑞汽车签合作协议 打造5G行业
近日,中兴通讯与奇瑞汽车在安徽芜湖签署战略合作协议,双方将共同研究基于5G的车联网[详细]
- 03支付宝:近700万人从事40余种新职业 最高月
新浪科技讯 12月6日上午消息,支付宝首次公布在其平台上诞生的新职业。自支付宝2004年[详细]
- 049月1日起北京公交可刷码乘车
北京公交刷码乘车服务将于9月1日起公开测试。北京青年报记者昨日从北京公交集团了解到[详细]
- 05智能分类回收机 投递全程不超过30秒
新华社讯(记者程迪李嘉盈)清早,南昌青山湖高新技术产业园区丹石社区居民万辉鹏拎着[详细]
- 06科普:什么是人工智能? 会干啥?真能取代
中新网5月25日电(吴涛)随着柯洁对战AlphaGo两局失利,人工智能(AI)又引发大众关注。那[详细]
- 07共享停车亟待破坎前行
这段时间,全国不少地方频频探索共享停车的实招、妙招,随着共享停车市场扩大,一些深[详细]
- 08应用场景不断拓展 市场需求倒逼机器人产业
我国机器人产业经过多年发展水平如何?近日,由中国机器人产业联盟主办的2019年中国机[详细]
- 099月推出面向高中生的人工智能教材
1月7日,由图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长姚期智领衔主编的[详细]
- 01报告显示:我国大数据智能化及5G应用走向深
新华社重庆8月27日电(记者黄兴)中国信息通信研究院在此间举行的中国国际智能产业博览[详细]
- 02打破国外技术垄断!磁基板给信号开“VIP通
打破国外技术垄断 降低手机生产成本 磁基板给信号开个“VIP通道” 坐公交、地铁,无需[详细]
- 03美“火星2020”拟于明年夏季升空
据美国太空网12日报道,美国国家航空航天局(NASA)的“火星2020”火星车拟于明年夏季[详细]
- 04OPPO开始在日本市场采用“新策略”
OPPO开始在日本市场采用“新策略” 参考消息网10月10日报道日媒关注到,中国智能手机[详细]
- 05工信部:从未要求运营商降速 4G将与5G长期
从未要求运营商降速4G将与5G长期并存 工信部回应网传4G降速 本报北京8月22日讯 记者侯[详细]
- 06地球首次生物大灭绝持续时间仅20万年
进入显生宙以来,地球一共发生过5次全球性大规模集群灭绝事件。其中,发生在4亿多年前[详细]
- 071毫升唾液检测DNA 将3.4万个家谱数据化意味
将3.4万个家谱数据化意味着什么 23魔方开发基因检测新应用场景 陶玉祥 本报记者 盛 利[详细]
- 08人工智能继续迭代 类脑计算悄然走红
深度学习正遍地开花,但它可能并非人工智能的终极方案。无论是学术界还是产业界,都在[详细]
- 09地球可能并非最宜居星球 系外行星或拥有更
TRAPPIST-1行星系统的艺术图,其中有3颗行星处于宜居带内。图片来源:物理学家组织网 [详细]