2023年8月28日下午,同济大学金博副教授和香港中文大学(深圳)李文浩博士受语音及语言信息处理国家工程研究中心杜俊副教授的邀请,在科大高新校信智楼楼C301会议室分别做了题为“去中心化多智能体强化学习”和“合作多智能体强化学习:理论、算法及应用”的精彩报告。本次报告由杜俊副教授主持,工程研究中心部分师生、科大讯飞相关工程师参加了报告会。
金博副教授首先以等竞技强化学习模型切入来介绍了强化学习的发展,引入了单智能体和多智能体的强化学习策略概念,并首先介绍了单智能体强化学习的相关概念,随后介绍了经典的演员-评论家(Actor-)框架为例,引申至多智能体强化学习,并以其团队在在智慧农业,智慧医疗的调度为例说明了多智能体的诸多应用场景。
随后,金教授介绍了求解的经典框架CTDE,它把所有的信息汇聚,来统一地中心化地训练,这导致其可能会面临维度灾难、中央节点的缺失等问题,另外,传统中心化多智能体强化学习方法香港中文大学,博士,在处理智能体间非交互性以及维度灾难等问题时具有局限性美国藤校留学,且通常需要在智能体间传输大量信息才能处理完全协作任务。
针对这些问题,金教授介绍了其团队设计的最优化驱动的基于原始-对偶混合梯度下降方法的完全去中心化MARL 算法框架F2A2,它可以用于将非去中心化的模型更改为完全去中心化的模型,灵活实现了智能体的独立学习和分布式控制。
接着,李博士以多智能体强化学习的背景入手,介绍了单智能体强化学习算法的应用,包括机器人控制、运筹规划等,随后引入基于多个个体的自动驾驶、智慧物流等真实场景下的强化学习应用,说明了多智能体强化学习的是群体智能的重要研究方向
随后,李博士以博弈论研究的典型模型为例,说明超过90%的问题为合作问题,而随着智能体数目的增大,传统博弈论已经无法满足多智能体问题的求解需求,李博士进而介绍了合作问题的多智能体强化学习范式:中心化训练-去中心化执行,以及其面临的挑战:非平稳状态下的策略评估,也即多个智能体之间相互影响,造成了环境本身不断发生变化。
李博士将多智能体面临的问题整合为以下三个科学问题以及其对该问题的研究成果:
一、完全合作场景下的高精度策略评估:联合置信区域分解、动作空间表示学习以及结构化合作涌现
二、自利合作场景下的高可靠策略评估:承诺机制、以声誉系统为基础的算法框架、分层声誉驱动的合作多智能体强化学习方法,基于信息设计的合作多智能体强化学习方法
三、高维合作场景下的高保真策略优化:生成流网络、分层扩散模型、基于分层扩散模型的离线序列决策方法
李博士还介绍了多智能体强化学习在诸多民生领域的应用香港中文大学,博士,同济大学金博副教授和香港中文大学(深圳)李文浩博士来访语音工程研究中心 并做学术报告,包括智慧医疗、智慧农业,智慧仓储AGV路径规划等,并分享了自己关于强化学习未来发展的看法,包括基于预训练大模型的自省学习、情境强化学习等。
最后,金教授和李博士耐心地聆听与回答了在场师生的提问。本次报告会在探讨与掌声中圆满结束。
金博,博士,同济大学软件学院副教授,上海市自主智能无人系统科学中心可信人工智能研究所所长助理。主要研究方向为群体智能、深度强化学习理论算法及应用。主持与参与科技部科技人工智能2030专项、国家863项目、工信部产业技术基础公共服务平台项目、工信部人工智能产业创新任务揭榜挂帅、国家自然科学基金重点项目与青年项目、装发预研项目、上海市科委创新行动计划人工智能支撑项目与重点项目及企业合作十余项;已发表IEEE TPAMI、IEEE TMI、、JMLR、CVPR、ICLR、KDD、WWW、IJCA、SIGIR、AAMAS、PR中国科学等顶级论文近60篇,发明专利20余项。2021年获中国商飞“大飞机奋斗者”荣誉称号。
李文浩博士毕业于华东师范大学,由周爱民教授和查宏远教授联合指导。李博士目前在机器学习顶级期刊JMLR、TPAMI、TCYB以及会议ICLR、ICML、AAMAS、CVPR、IJCAI、KDD、ICRA上发表论文近20篇,主持博士后自然科学基金面上项目1项;博士论文《合作促进多智能体强化学习》荣获上海市计算机学会评定的“2022年度优秀博文论文奖提名奖”。
香港招聘博士,香港中文大学生物医学院招聘博士、博士后和研究助理
想要出国访问学习的小伙伴看过来啦!香港中文大学生物医学院招聘博士、博士后和研究助理。美捷登访学通每周定时更新最新的访学招聘信息,感谢关注。
美捷登海外访学,快人一步拿OFFER!
限时免费咨询与评估
Email:
推荐1人成功服务访学通
即可获得400元礼品卡
研究所简介
香港中文大学(The of Hong Kong)是一所国际领先的亚洲顶尖大学,于2018年成立了组织工程与再生医学研究所。
同时香港創新科技署将于2022年成立創新香港研發平台-神经肌肉骨骼再生医学中心。 是特区政府的重点项目,旨在发展香港成为环球科研合作中心香港招聘博士,香港中文大学生物医学院招聘博士、博士后和研究助理,当中涉及与香港科学园成立世界级的创新平台,由国际知名的大学和科研研究机构设立研发实验室,进行科研合作。神经肌肉骨骼再生医学中心是计划推出以来,由香港中文大学(The of Hong Kong)和瑞典卡罗林斯卡学院( )合作共创的研发实验室。
卡罗林斯卡学院在全世界的高等教育中,是最大的一所单一医学院,同时也是世界上最有威望的医学院之一。学院中有一个委员会,专门负责颁发诺贝尔生理学或医学奖。至今为止,共有5名诺贝尔生理学或医学奖获得者出自卡罗林医学院。
导师简介
合作导师一:段崇智教授。段崇智教授为国际知名生物医学科学家,专注于肌肉骨骼生物学及组织再生研究,成果涵盖基本科学,工程学,转化及临床应用。他的研究成果包括细胞和发育生物学、干细胞、生物材料、再生医学、3D打印以及组织芯片技术。他领导一系列跨学科研究项目,探讨于肌肉骨骼组织发育、生长、功能、健康有关联的生物活动,并利用研究成果研发技术,以修复因创伤、衰老受损的骨骼组织。段教授迄今发表于四百五十项研究著作,现任发育生物学期刊Birth 及著名干细胞期刊Stem Cell and 创刊编辑。
合作导师二:王丹教授,课题组PI,现为香港中文大学组织工程与再生医学研究所和矫形外科及创伤学系研究助理教授。王丹教授于中山医科大学口腔医学专业获得学士和硕士学位;匹兹堡大学牙学院获得博士学位;随后于斯坦福大学从事博士后的研究工作。王丹教授具有多维度交叉学科的经历,包括临床实践和基础研究。在目前的研究项目中,王丹教授和她的团队专注于细胞外基质(ECM) 组分及环境应力在干细胞微环境中的作用QS200名校留学,并进一步应用于开发具有免疫调控效能的新型骨肌腱组织生物材料。研究成果曾在 ,, Group Asia ,Stem Cell & 等领域多个著名期刊上发表。
现主持基金项目详情可于网站 了解。
研究方向
研究主要围绕于骨肌腱组织工程开展,具体研究方向包括:(i) 研究干细胞和细胞外基质(ECM)之间的相互作用,开发仿ECM生物材料; (ii) 调控干细胞外泌体技术促进组织修复;(iii) 免疫调节生物材料的开发。
福利待遇
薪资和职级由申请人的资格和工作经验决定,任命将以合同为基础,为期一年香港招聘博士,在表现良好且双方有意愿的前提下可续约。
岗位职责
开展课题研究,主要内容包括细胞培养实验,动物实验,生物材料制造和测试。协助PI,进行实验室相关管理工作。
招聘要求
(i) 具有生物医学,生物工程学,生物信息学或相关学科背景,或具有上述研究方向相关经验者优先;
(ii) 良好的英语沟通能力和写作能力;
(iii) 敬业投入,认真细致,具有良好的组织协调,执行能力和团队协助精神。
美捷登海外访学,快人一步拿OFFER!
限时免费咨询与评估
Email:
推荐1人成功服务访学通
即可获得400元礼品卡
往期精彩回顾
美国德州大学MD安德森癌症中心招收博士后
美国梅奥诊所正在招收访问学者、博士后
德克萨斯大学西南医学中心招收博士后或访问学者
英国比特森癌症研究所招收博士后
如果您需要降低文稿重复率,或者有进一步的润色需求,您可以将您的文稿上传到美捷登投稿系统(电脑端):
香港大学电气与电子工程博士,香港中文大学(深圳)教授张大鹏当选加拿大皇家科学院院士
近日,加拿大皇家科学院(RSC,The Royal of )宣布了评选出的新增院士。其中,来自香港中文大学(深圳)数据科学学院的张大鹏教授名列其中。
据了解,张大鹏教授毕业于北京大学计算机科学专业,于1982年和1985年分别获得哈尔滨工业大学计算机理学硕士及博士学位。1986年至1988年,作为中国首批博士后从师于清华大学著名导师常桐院士,并于1994年香港大学电气与电子工程博士,又获加拿大滑铁卢大学( of ) 电气和计算机工程博士。而后担任香港理工大学教授,创建主持了香港特区政府资助的生物识别研究中心(UGC/CRC)。目前,张大鹏教授为港中大(深圳)计算机与人工智能领域的校长讲座教授,参加创建该校理工学院和数据科学学院。
作为国际图像和图形学报(IJIG)以及国际生物识别丛书(KISB)的创始人和主编,30多年来香港大学电气与电子工程博士,香港中文大学(深圳)教授张大鹏当选加拿大皇家科学院院士,张大鹏教授一直从事模式识别,图像处理以及生物特征识别研究,是掌纹识别美国top30名校留学,中医四诊量化及人脸美学等研究领域的开创者和领军人。其研究成果曾多次获奖,如中韩政府授予的发明金奖及特殊金奖、日内瓦发明展银奖,以及香港“裘槎( )优秀科研者”奖等。出版了20多部专著,400余篇国际期刊论文和40多项美国/日本/香港/中国专利。自2014-2019年,已连续六年被 (前身为汤森路透)列为高被引科学家。最近,又在国际计算机科学和电子学的Top 1000名科学家排序中,以H-Index 115进入全球前83名。张教授是美国电气和电子工程师学会(IEEE)和国际模式识别协会(IAPR)。
见习编辑 王子烨