当前位置: 首页 >> 学堂公告 >> 正文

第十一期“泰山学子讲堂”学术报告会预告

2021年04月13日    阅读量:

 

 

报告题目:Recent advances and opportunities in adversarial robustness (对抗鲁棒性最新的进展与机会)

报告人:张景锋,目前是RIKEN-AIP “Imperfect Information Learning Team“的博士后研究员。2016年获得山东大学学士学位,2020年在新加坡国立大学(QS排名全球第11位)计算机学院获得计算机科学博士学位。研究方向主攻机器学习的鲁棒性,他的长期研究目标是使人工智能对人类安全。

 

内容简介:

对抗样本可以通过向自然数据中添加难以察觉的噪声来轻易地欺骗经过标准训练的深度学习模型,从而在医学,金融和自动驾驶等应用中导致严重的安全问题。到目前为止,对抗训练(adversarial training, AT)是针对对抗样本获得对抗鲁棒性的最有效的方法。本次演讲主要分为以下两个部分:

首先,人们普遍认为对抗鲁棒性和模型准确性是互斥的。我们通过提出以下三种对抗训练方法来挑战这一认知:(a)我们提出了一种友好的对抗训练(friendly adversarial training, FAT)方法,它可以在保证鲁棒性的同时提高准确性;(b)我们提出了几何感知实例重加权对抗训练(geometry-aware instance-reweighted adversarial training, GAIRAT),该训练可以提高鲁棒性,同时保持准确性;(c)我们提出了一种新颖的数据增强框架,即引导插值框架(guided interpolation framework, GIF),以进一步增强各种对抗训练方法的对抗鲁棒性。

其次,除了对抗性训练方法之外,我们还将讨论两个相关主题:用于对抗性鲁棒性的网络结构和用于其他领域(例如标签噪声,深核)的对抗性机器学习。例如,我们发现对抗训练具有很强的平滑效果,与标准训练相比,受噪声干扰较小。这表明对抗训练本身就是一个嘈杂的标签校正器。


 

报告题目:基于角色的深度协作学习

报告人:王同翰,现就读于清华大学交叉信息研究院,硕士三年级,研究方向为深度强化学习,到目前为止已在ICML, NeurIPS, ICLR, AAMAS等人工智能国际顶级会议发表论文8篇,其中两篇被评选为NeurIPS, ICLR会议spotlight论文。曾获清华大学国家奖学金,山东大学校长奖学金,被评为ICLR 2021杰出审稿人。提出的基于角色的深度合作学习方法在主流多智能体合作任务集上取得目前国际最佳性能。

 

内容简介:

 

会下围棋的AlphaGo和掌握复杂即时策略游戏StarCraft的智能体AlphaStar是深度强化学习在近年来取得的重要科技进展。然而,实际应用中广泛存在的任务往往涉及多个决策主体,例如无人飞行器和传感器网络。针对此类系统的控制策略学习仍然是一个重大挑战。其中,所面临的主要问题是以指数速度增长的策略学习空间。为解决此问题,我们提出基于角色的深度协作学习,通过学习角色分解复杂的任务来实现学习可扩展性。本次报告将先讨论如何从复杂行为中激励可识别的、具有行为分化特征的合作策略,并基于此探讨如何高效的探索和发现一组有效的角色。利用角色的涌现,我们还将展示如何实现将多智能体合作策略快速迁移到数倍规模的陌生环境中。


此次活动采用线下线上相结合的模式,活动时间:2021年4月17日14:00至17:00,线下会议地点:中心校区数学楼309,线上腾讯会议号:870 859 555。本次活动由14级学长尹若愚主持,将邀请计算机取向教授小组组长 任昭春 教授、计算机取向2020级班主任陈竹敏教授作特邀嘉宾。

 

上一条:关于开展2021届本科毕业论文(设计)中期检查的通知 下一条:泰山学子讲堂第十期预告

关闭

最新添加
热门阅读