您当前所在位置: 竞技宝电竞体育 > 干玫瑰牛皮简介 >
干玫瑰牛皮简介 李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能
作者:admin    发布时间: 2021-07-17 21:54

   

机器学习能够隐微挑高智能体的学习效果和泛化能力。

然而在现实世界的行使中,机器人的设计往往比其他题目更添棘手,由于机器人必要大量的训练和专科知识才能完善设计。

针对这个题目,李飞飞团队说相符英伟达挑出了一个崭新的技能训练手段Skill Learning In Diversified Environments(SLIDE),经由过程自动生成的一系列差别的义务来发现清淡化的技能。

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

与之前无监督的技能发现做事差别的是,他们是在相通的环境下训练产生差别的技能,而这篇论文中的手段将每个技能与一个可训练的义务生成器产生的稀奇义务结相符首来。

为了鼓励清淡化技能的展现,对于每个被配对到的义务都进走技能训练干玫瑰牛皮简介,并最大化生成义务的众样性。在生成的义务中定义一个义务判别器来推想众样性现在标的证据下界。

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

机器人的技能是经由过程自动生成义务来学习的。每一项技能都与一项由可训练的稀奇义务相匹配义务生成器。这些技能被训练成特意从事被匹配到的义务。经由过程生成的众样化义务来发现差别的技能。

手段中发现技能的关键是设计训练技能条件义务的现在标函数生成器g来创建差别的义务。为了让更通用的技能能够被学习出来,钻研人员认为技能间(inter-skill)的众样性和技能内部(intra-skill)的众样性都必要被考虑,在训练义务生成器g时答当正当均衡。

技能间的众样性鼓励每项义务为配对到的技能挑出更稀奇的挑衅。而内部技能众样性衡量每个义务所能挑供的环境转折。

对于机器人操作义务,开发人员肯定期待机器人拿手差别类型的互动(如推、抓、放等)具有特定类型的对象。同时,也期待每项技能都有有余能力往处理场景转折和义务初首的通用性。

末了干玫瑰牛皮简介,还必要考虑了义务的可走性以防止在无法解决的义务中学习技能。

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

上图就是经由过程SLIDE模型发现的示例义务和技能,经由过程展现两个有关的采样轨迹来展现技能间和技能内的众样性。每一个灰色区块中都有相通的技能指数。每列表现生成的义务的初首化和技能的实走。差别颜色外示差别物品类别的现在标地,包括罐头(红色)、盒子(绿色)和餐具(蓝色)

文中的实验设计的主要现在标是回答以下题目:1)SLIDE能够经由过程生成的义务来学习到差别的技能吗?2) 经由过程SLIDE学到的技能,能够被行使和泛化到其他没见过的义务上吗?3)SLIDE中的设计选项如何影响学习技能和义务绩效?

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

为了学习机器人技能并评估其对未知现在标义务的泛化能力,设计了两个桌面操作区域。每个域定义一个包含共享相通状态和行为空间但差别的环境设计和奖励功能。这两个义务空间由众个离散和离散变量参数化用于定义初首化、动力学和奖励功能。

最先训练技能发现的手段,经由过程从参数化义务按程序生成义务异国现在标义务概念的空间。然后训练行使分层策略解决每个没见过的现在标义务从联相符周围学到的技能。

钻研效果外明,相对于现有的深化学习和技能学习手段干玫瑰牛皮简介,论文中挑出的手段学会的技能能够有效地挑高机器人在各栽异国现在标的义务中的外现。

文章的主要贡献在于挑出了在众样化的环境中学习技能的模型SLIDE,它经由过程自动生成一组差别的义务。经由过程最大化生成义务的众样性,SLIDE手段能够发现各栽义务以启用技能策略来激发机器人学习到各栽各样的走为。

经由过程训练分层组织,行使所学技能的深化学习算法行为矮层策略,在两个桌面操作区域,能够有效地挑高了隐性现在标义务的学习能力与学习效果。

在今后的做事中有几个方面能够改进。最先,挑出的手段是专为学习肯定数目的技能而设计的,一个兴趣的钻研倾向是对义务进走盛开式技能发现和变通的技能数目。

其次,文中黑示了在现在标义务中对现在标义务是有效的,并倘若参数化奖励函数在义务中预定义,但异日的做事能够生成响答义务义务基于内在激励的奖励函数。

末了干玫瑰牛皮简介,期待这项做事能鼓励更众的人竭力行使面向机器人学习和相通行使的程序化内容生成,能够为更普及的行使周围挑脱手段,比如视觉导航和仿人机器人。

文章的第一作者Kuan Fang是斯坦福大学Vision and Learning实验室的别名博士生,由Silvio Savarese教授和李飞飞教授共同请示,主要钻研倾向是计算机视觉、机器人和机器学习。

他的本科在清华大学,曾在Google Brain, Google X, 微柔亚洲钻研院演习。

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

本文的第二作者Yuke Zhu是德克萨斯州大学奥斯汀分校计算机科学系的助理教授,也是机器人感知和学习实验室的主任,同时照样 NVIDIA 钻研中央的高级钻研科学家。

主要钻研倾向是为机器人和具身代理人构建智能算法,这些机器人和具身代理人能够推理并与现实世界互动,这项钻研是机器人学、计算机视觉和机器学习的交叉。重点钻研了感知和限制的手段和机制,以实现通用机器人的自立性。

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

这篇论文的导师是李飞飞,2020年当选为美国国家工程院院士,美国国家医学院院士,2021年当选为美国艺术与科学院院士。她的做事包括括受认知启发的AI,机器学习,深度学习,计算机视觉和AI+医疗保健,尤其是用于医疗保健交付的环境智能编制。

她还从事认知和计算神经科学方面的做事。她发清新ImageNet和ImageNet Challenge,其中ImageNet Challenge是一项主要的大周围数据集和基准测试做事

李飞飞的华人斯坦福博士挑出SLIDE模型 与英伟达追求通用人造智能

【编辑选举】干玫瑰牛皮简介

Experian是如何行使分析和人造智能来协助客户的 2021年十大人造智能创新趋势 吾国“人造智能”有关企业超 43 万家,2021 年上半年数目同比添长 150.8% WPF五子棋军师开发详解/MVVM/C#/AI/人造智能/机器视觉/WebApi/Win32Api 手机跑SOTA模型快8倍 Facebook AI开源超强全栈视频库PyTorchVideo

Powered by 竞技宝电竞体育 @2018 RSS地图 HTML地图