【研究方向】
1. 机器人:多机器人系统、模块化自重构机器人、软体机器人等
2. 人工智能:群体智能、多机器人协同环境感知、多机器人相互定位、多机协同操作、异构多机器人多任务规划、去中心化控制等
【应聘资格】
1. 机器人、计算机、自动化、机械、电子等相关专业学历;
2. 较强的学术和研究背景;
3. 主动积极,有强烈的责任心和团队合作精神;
4. 良好的语言表达和沟通能力;
5. 熟练英语,包括听,说港中文全奖博士,读,写。
6. 其他需求:
【薪酬福利】
博士研究生–根据学生能力将提供各类奖学金支持:
1. ” “,这将包括(i)在正常修读期间,提供每学年税后180,000元的生活津贴,在此期间学生需担任至少四个学期(包含暑课学期)的教学助理; (ii)同时学生可获得一定的学费减免。
2. “”,在正常修读期间,(i)学生可享有学费半免资格,学生的导师可以资助另一半学费;(ii)学生通过担任教学助理(TA)或研究助理(RA)获得相应津贴,每月税后最高可达5,000元(共12个月/年)。
3. AIRS卓越博士生科研计划,A类科研津贴:20-35万/年(税前),B类科研津贴:10-20万/年(税前)
【申请程序】
请准备好完整的1) 成绩单、2) 英文简历及3) 科研成果介绍PPTQS200名校留学,通过电邮发送给Prof. Tin Lun LAM ()。只有入围的申请人会收到通知。
【香港中文大学(深圳)简介】
香港中文大学(深圳)是一所经国家教育部批准,按中外合作办学条例设立,传承香港中文大学的办学理念和学术体系的大学。以创建一所立足中国、面向世界的一流研究型大学为己任,致力于培养具有国际视野、中华传统和社会担当的创新型高层次人才。香港中文大学(深圳)已经面向全球引进了350余位世界一流的优秀人才,包括诺贝尔奖/图灵奖/菲尔兹奖得主7位、国内外院士16名、国家级人才专家30余名等。
香港中文大学(深圳)将采用香港中文大学学术质量控制和学位颁授标准,由港中大教务会负责审批和监督香港中文大学(深圳)的学位课程,并指导及管理授课和教学有关事宜港中文全奖博士,香港中文大学(深圳) 机器人与人工智能实验室招多名全奖博士生(奖学金最高35万元/年),监管香港中文大学(深圳)学位资格认证的水准。符合香港中文大学学位要求的香港中文大学(深圳)学生将获颁授香港中文大学学位证书,而按照国家教育部有关规定,完成学业并符合毕业条件的学生将另颁发毕业证书。香港中文大学(深圳)作为省市博士后创新实践基地,目前主要依托中国科技大学等高校,采用双导师制联合招收博士后。
【机器人与人工智能实验室简介】
香港中文大学(深圳)机器人与人工智能实验室(座落于大湾区的科创核心引擎深圳并由国际知名机器人与人工智能专家徐扬生院士带领。是深圳发改委和国家发改委重点建设单位,已获批建设“深圳机器人与智能制造工程实验室”和“机器人与智能制造国家地方联合工程实验室”。实验室继承了徐扬生院士从1997年在香港中文大学所建立的先进机器人实验室的科研积累,在机器人传感、认知、控制、交互、能源等多方面从事机器人与智能控制系统研究,取得了一系列突破性科技成果,成果包括:著作8部、期刊论文134篇、会议论文281篇、申请专利113项。该团队是世界最活跃的机器人学术研究团队之一,承担了大量国家科研计划,在围绕着航天机器人、工业机器人、服务机器人、特种机器人、医疗机器人、智能无人运载系统等多个领域已经成功研制了30多个机器人和智能系统,研究成果世界领先且具有广阔的应用前景。实验室在徐扬生院士的带领下,与美国、德国、日本等多所海外著名机器人研究机构建立了良好合作关系。
【导师简介】
林天麟教授,IEEE高级会员,香港中文大学(深圳)助理教授、机器人与人工智能实验室执行副主任(及深圳市人工智能与机器人研究(AIRS)院智能机器人研究中心主任(。多年来一直从事机器人系统研发、智能控制理论及人机交互技术等方面的研究,致力于联合国际一流专家研究新型共性机器人技术,以推动机器人技术在新领域的应用。他研发了多台机器人及自动化系统,当中包括模块化自重构机器人、替身机器人、爬树机器人、全方位四轮转向车、水面无人船、六轴工业用机械臂、巡逻机器人、救援机器人、家庭服务机器人及教学机器人等。在研究工作的基础上发表了两部专着、六篇国际期刊论文、三十多篇国际学术会议论文及获得五十多项授权专利。大部分论文均刊登于机器人及自动化领域中顶尖的期刊和会议如TRO、JFR、T-MECH、ICRA、IROS等。基于他的研究发表,他分别于2011及2020年获得了IEEE/ASME T-MECH最佳论文奖以及IROS机器人机构及设计最佳论文奖。林教授所做出的科研成果亦获得包括, , , Wired, IEEE 等众多国际知名媒体关注及报导。林教授积极主持并参与了国家自然科学基金委员会(NSFC)、国家发展和改革委员会、深圳市科技创新委员会、深圳市发展和改革委员会、香港创新科技署及香港研资局等多个政府支助研究项目。林教授亦积极参与机器人领域的国际期刊及会议论文的编委及审稿工作。
港中文博士计算机,星药科技李成涛:人工智能在药物研发中的应用
不到现场,照样看最干货的学术报告!
嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。
人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术、作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。2020年8月29日,第18期“AI未来说·青年学术论坛”(“AI+X”领域专场)以“线上平台直播+微信社群图文直播”形式举行。星药科技李成涛带来报告《人工智能在药物研发中的应用》。
星药科技创始人&CEO李成涛博士本科毕业于清华姚班,随后在麻省理工学院获得计算机博士学位。他曾先后在人工智能顶级会议上发表多篇论文,其研究成果落地在药物发现领域中的多个重要环节。
人工智能在药物研发中的应用
李成涛博士的报告内容是关于人工智能在药物研发的应用,内容涉及到一些落地的应用以及人工智能在药物研发流程当中的具体地位。整个药物研发流程是一个非常漫长的过程,大概分为两个阶段:临床许可是分界线,之前是候选药物阶段,之后是临床实验阶段。临床实验可能大家耳熟能详,以这次新冠疫情为例,大家可能知道有些国家已经有一些相关的临床实验,具体来说就是现在开发了一款新药或者使用已有的药,进一步想要尝试该药在新冠病人身上能不能发挥作用。此时就需要招募一些病人在医院当中尝试这样的新药,看一看最终的反应,到底是不是像想象的那样可以痊愈,之后药品可能就会上市。临床之前也需要很多类似的过程,从靶点开始。生病吃药其实本质上就是一个调控体内蛋白质的方式,服用的药物小分子在体内会与相应的蛋白质进行结合,调控蛋白质功能,这个蛋白质就是所谓的靶点。根据靶点的性质和三维结构,可以设计一些药物,经过一系列的设计、筛选、优化,再到体内外的实验,测试一下有效性和毒性。如果一切顺利就进入临床许可阶段,如果不行的话可能需要回去返工,重新优化分子的性质,让它能够达到实验想要的目的。整个流程是非常长的,大概需要五到八年的时间。
如此长的研发时间和投入也对应着更多的研发成本。现在平均每一款药的研发成本将近30亿美金,是非常昂贵的。药物研发领域其实出现一个非常奇怪的现象,叫做EROOM定律(Eroom’s Law),即摩尔定律(Moore’s Law)的反向。大家普遍会期待随着时代进步、科技进步,药物研发成本会逐渐下降,但是药物研发领域的成本其实是逐渐上升的。现在这个阶段需要投入巨大的人力物力,也需要花费巨量的时间和财力,才能做出一款药物。与之相反的是这么大的投入换来的是不够对等的回报。从2010年开始,研发投入的回报率是逐年走低的,从2010年的10.1%到2018年的1.9%。目前整个产业处于这样一个状态,一方面成本非常高、研发时间非常长,另一方面大家做出来之后又赚不到多少钱,所以业界这边就一直在思考怎样找到一个非常好的方式,能够降本增效。
人工智能近年来有爆发式发展,、硬件算力和各种各样的算法导致很多领域都有了优化的场景,对于医疗影像,AI可以帮助医生来做诊疗的判断港中文博士计算机,星药科技李成涛:人工智能在药物研发中的应用,其他方面,例如自动驾驶做得很好,关于围棋的应用也非常不错。的核心算法其实跟药物研发是非常近的关系,李成涛博士会在后面会介绍是如何应用到药物研发场景当中的。
AI能够提供的价值主要是药物研发的前期部分。从刚开始的靶点识别到根据靶点的三维结构等信息进行分子设计、筛选和优化,找到一些和靶点有相互作用的小分子。现在所有的这些东西都是在电脑当中,需要把它合成出来才能做各种各样的实验。所以怎样才能合成这些新的分子也是一个很大的议题,这就涉及到合成路径的设计。AI提供的落地场景还是很多的,本次报告主要讲的就是关于分子设计优化以及合成路径设计的内容。
李成涛博士首先介绍了分子设计优化。很多同学都知道紫杉醇是抗癌的天然产物。为了让计算机能够读取分子信息,有两种信息表达的方式可以表示整个紫杉醇分子。第一种是将整个分子都序列化,每一个序列都会唯一地对应一个分子,这里可以应用到NLP相关的技术,后续会做介绍。另外一种更加直观,如上图中右图所示,把整个结构看成一张图,每个原子表示成一个图里的节点,不同原子是不同颜色的节点;不同的化学键,可以表示成不同的边,所以现在既有不同的节点也有不同的边,组成了这样一个 Graph(分子图)。它本质上在计算机里面是一个邻接矩阵加上性质的标签。这是现有的两种比较有代表性的表示方式。
根据前面描述的内容,如果要做分子生成,可以把问题转变为一个序列生成问题。序列生成有很多方法,报告中举的例子是直接用VAE,即把序列作为输入,输出也是序列,使用编码解码网络。做过NLP的同学基本上都比较清楚。编码网络和解码网络的中间的 Space就是把整个 Space离散化了,对应的每个Local Part就是特异的分子,通过从整个空间当中一些比较想要的分子来达成目的。
但是如果直接用 作为分子的Input和,直接产生序列有很大的弊端。第一点是它本身有一定的语法,从而在的时候不一定每次都能够在语法上正确的分子;第二点,即使能够语法上正确的分子,但是某些原子的价位可能不太一样,或者某些原子此时不能接这个基团,否则在化学意义上会有语义上的错误,这个问题是很难避免的;第三点,结构相似的分子可能有完全不一样的 ,如上图底部所示,最下面有两个分子,它们在结构上是非常相似的,化学上普遍认为结构相似的分子有相似的性质,进而希望它们的表示方式尽可能相似。实际上,左边分子和右边分子的 是完全不一样的,这就给做序列模型提出了比较严峻的挑战,进一步转换思路采用另外一种方法。本质上,序列的编码和解码对应的是把整个的二维图结构变成了一维序列信息,原本二维结构图里面的结构信息在一维序列里面不是很好发掘。
另外一种方法就是直接用图作为输入和输出,图本身是一个邻接矩阵,所以计算机可以读取。现在面临的是全新的输入和输出,第一个问题是怎样编码一个图,涉及到最近比较火的图神经网络。如上图所示,现在有一个分子图,放到计算机里面,每个原子都有一个对应的向量,设计多层的 机制,每个原子对应的向量可以和邻近的向量进行信息交换。比如蓝色的会和邻居以及自己进行信息的整合和交换,最后达到所有原子上都有一个编码邻近信息的向量,最后通过把所有的向量都整合到一个向量里,直接做加和或者平均。
下一步是怎样解码,之前并没有特别好的解码方法从一个定长的向量当中解码出来不定大小的图。不过最近已经出现了很多的方法,这里以JTVAE为例进行介绍。很多分子当中都有一些常见的基团港中文博士计算机,苯环在很多有机化合物当中都会出现。五元杂环也算是一个基团,也可以抽象出来,这些东西都抽象出来之后变成一个点。如果把所有环类的东西都抽象成一个点,由于图中就没有环了,一个无环的连通图就是一棵树。树做和就相对容易一些,原本每次生成一个原子需要考虑生成之后怎么和已有的原子进行连接,但是现在不需要考虑环的情况,只需要考虑树的情况,而树是可以直接用RNN生成的。如上图所示,每个节点有两个方向的生成,一个生成,另一个生成,直到每个节点都选择停止,这个时候整个或者就完成了,加上树和图之间可以进行相互转换,最后就得到一个从图到图的VAE,即 Tree VAE。
知道了做VAE的和,和也相应可以明确。即拿一些图作为输入和输出,然后去做Auto 。是在之后直接用解码器,在隐空间中采样一些定长的向量,然后解码成一些图,这个图是分子图,每个分子图是一个分子,所以已经达到了生成分子的目的。
关于合成路径设计,李成涛博士对具体思路进行了介绍。对化学合成路线设计有一定的启示作用。围棋每一步都有数十种、上百种可能性,每次都可能在棋盘的空位落子,每一步都会造成之后策略的相应调整。下围棋的最终目标是赢,但是要下几百步才能知道到底是赢还是输,所以需要搜索的空间是非常大的,需要搜索几百步,搜索空间是巨量的。当时是用MCTS做了这些估算,然后找到一些相对来讲非常好的路径做了搜索。这些东西和化学逆反应合成有一定的关系。入上图所示,绿框里面的分子是想要合成的分子。最开始无法知道怎么合成,但是知道图中A和B可以经过几步合成目标分子,把A和B分别的合成路径不断往回倒推,直到出来的分子可以直接买到时停止。这个概念就像打游戏要合成一些游戏装备,最开始需要合成非常基础的东西,然后逐渐地往上合成,一直到最后能够合成出来非常高级的装备,它们本质上是一样的。
星药科技本质上做这个合成是往回倒推的过程,其中最大的问题是搜索空间是非常大的。假如要合成A,对于A来讲可以有很多种可能的合成方式,B和C、B和D、C和E都可以合成A美国藤校留学,但是现在B和D不知道怎么合成,可能E和F可以合成D,或者H和G可以合成D,所以每一步其实都有几十种甚至上百种合成方式,每决定一条路、每决定一步其实对后面的合成方式会有一定的影响。可能某一次选择的是B和D,下次可能选择B和C,这个时候目的是要合成B和C,而不是合成B和D,它们之间有很大的差别。最终目标就是找到一种可行的合成方式,涉及到非常巨大的搜索空间,造成了计算的复杂度,实际上它可以用蒙特卡洛树搜索的方式来做。
2018年有研究人员在《》上发表了一篇论文,通过蒙特卡洛树搜索的方法找到可行路径,也是第一次通过Deep 加上RL来做到以前大家都做不到的事情。目前为止仍然有很多的化学物质其实是不知道怎么合成的,AI可能会为它们提供一些新的思路。
化学合成的AI方法分为单步逆反应预测和多步逆反应搜索,目前有很多的论文在做这件事情,尤其是最近两年。星药科技和 Brain、MIT、蚂蚁金服的研究人员一起做了一系列相关的工作,在和 ICML上发表了数篇关于单步和多步反应的文章,大家感兴趣的话欢迎去关注。
星药科技去年下半年才成立,是一家非常年轻的公司。我们想要通过人工智能来基于靶点设计、筛选和优化分子,目的就是希望尽可能降低整个药物研发的成本,能够让药物研发的时间缩到更短,也能够让合适的药物到达患者手中。星药科技去年年末入选默克加速器,同时获得了包括高榕、源码、DCM、晨星这些基金的支持和认可,现在他们也在积极地开展合作,包括一些知名高校科研机构,国内的上市药企都是星药科技的合作伙伴。非常欢迎感兴趣的同学可以联系星药科技公司()对这一块做交流和探讨。
(整理人:张雪丰)
AI未来说*青年学术论坛
第一期 数据挖掘专场
1. 李国杰院士:理性认识人工智能的“头雁”作用
2. 百度熊辉教授:大数据智能化人才管理
3. 清华唐杰教授:网络表示学习理论及应用
4. 瑞莱智慧刘强博士:深度学习时代的个性化推荐
5. 清华柴成亮博士:基于人机协作的数据管理
第二期 自然语言处理专场
1. 中科院张家俊:面向自然语言生成的同步双向推断模型
2. 北邮李蕾:关于自动文本摘要的分析与讨论
3. 百度孙珂:对话技术的产业化应用与问题探讨
4. 阿里谭继伟:基于序列到序列模型的文本摘要及淘宝的实践
5. 哈工大刘一佳:通过句法分析看上下文相关词向量
第三期 计算机视觉专场
1. 北大彭宇新:跨媒体智能分析与应用
2. 清华鲁继文:深度强化学习与视觉内容理解
3. 百度李颖超:百度增强现实技术及应⽤
4. 中科院张士峰:基于深度学习的通用物体检测算法对比探索
5. 港中文李弘扬 :物体检测最新进展
第四期 语音技术专场
1. 中科院陶建华:语音技术现状与未来
2. 清华大学吴及:音频信号的深度学习处理方法
3. 小米王育军:小爱背后的小米语音技术
4. 百度康永国:AI 时代的百度语音技术
5. 中科院刘斌:基于联合对抗增强训练的鲁棒性端到端语音识别
第五期 量子计算专场
1. 清华大学翟荟: with
2. 南方科技大学鲁大为:量子计算与人工智能的碰撞
3. 荷兰国家数学和计算机科学中心(CWI)李绎楠:大数据时代下的量子计算
4. 苏黎世联邦理工学院(ETH)杨宇翔:量子精密测量
5. 百度段润尧:量子架构——机遇与挑战
第六期 机器学习专场
1. 中科院张文生:健康医疗大数据时代的认知计算
2. 中科院庄福振:基于知识共享的机器学习算法研究及应用
3. 百度胡晓光:飞桨()核心技术与应用实践
4. 清华大学王奕森: : and
5. 南京大学赵申宜:SCOPE – for
第七期 自动驾驶专场
1. 北京大学查红彬:基于数据流处理的SLAM技术
2. 清华大学邓志东:自动驾驶的“感”与“知” – 挑战与机遇
3. 百度朱帆:开放时代的自动驾驶 – 百度计划
4. 北理宋文杰:时空域下智能车辆未知区域自主导航技术
第八期 深度学习专场
1. 中科院文新:深度学习入门基础与学习资源
2. 中科院陈智能:计算机视觉经典——深度学习与目标检测
3. 中科院付鹏:深度学习与机器阅读
第九期 个性化内容推荐专场
1. 人民大学赵鑫:基于知识与推理的序列化推荐技术研究
2. 中科院赵军:知识图谱关键技术及其在推荐系统中的应用
第十期 视频理解与推荐专场
1. 北京大学袁晓如:智能数据可视分析
第十一期 信息检索与知识图谱专场
1. 北京邮电大学邵蓥侠:知识图谱高效嵌入方法
2. 人民大学徐君:智能搜索中的排序-突破概率排序准则
3. 百度周景博:POI知识图谱的构建及应用
4. 百度宋勋超:百度大规模知识图谱构建及智能应用
5. 百度冯知凡:基于知识图谱的多模认知技术及智能应用
第十二期 年度特别专场
1. 复旦大学桂韬:当NLP邂逅 Media–构建计算机与网络语言的桥梁
2. 清华大学董胤蓬: of Deep
3. UIUC罗宇男:AI-
4. 斯坦福应智韬:Graph
第十三期 AI助力疫情攻关线上专场
1. 清华大学吴及:信息技术助力新冠防控
2. 北京大学王亚沙:新冠肺炎传播预测模型
3. 百度黄际洲:时空大数据与AI助力抗击疫情——百度地图的实践与思考
4. 百度张传明:疫情下的“活”导航是如何炼成的
第十四期 深度学习线上专场
1. 中国科学院徐俊刚:自动深度学习解读
2. 北航孙钰:昆虫目标检测技术
3. 百度尤晓赫:,加速企业AI转型
4. 百度邓凯鹏:飞桨视觉技术解析与应用
第十五期 大数据线上专场
1. 复旦赵卫东:大数据的系统观
2. 中科大徐童:AI×数据驱动的智能人才计算
3. 百度李伟彬:基于PGL的图神经网络基线系统
4. 中科大张乐:基于人才流动表征的企业竞争力分析
第十六期 NLP前沿技术及产业化线上专场
1. 复旦大学黄萱菁:自然语言处理中的表示学习
2. 中科院刘康:低资源环境下的事件知识抽取
3. 百度何中军:机器翻译 —— 从设想到大规模应用
4. 百度孙宇:百度语义理解技术ERNIE及其应用
5. 哈佛邓云天: Text with
6. 复旦大学桂韬:—Aware
第十七期 百度奖学金特别专场
1. 麻省理工学院赵明民:能穿墙透视的计算机视觉
2. 卡内基梅隆大学梁俊卫:视频中行人的多种未来轨迹预测
3. 清华大学丁霄汉:深度网络重参数化——让你的模型更快更强
4. 南京大学赵鹏:动态环境在线学习的算法与理论研究
5. 上海交通大学方浩树:人类行为理解与机器人物体操作