2021年5月7日上午,许东教授应吉林大学计算机科学与技术学院邀请,以线上形式做了题为“Deep-learning Protein Localization Prediction with Residue-level Interpretation”的学术讲座。
许东老师是美国密苏里大学电子工程和计算机科学系的Paul K 和Shumaker讲座教授,同时担任Christopher S. Bond生命科学中心研究员和信息技术专业主任。许东教授在北京大学获得本科与硕士学位,于1995年在伊利诺伊大学获得博士学位。他在美国国家癌症研究所做了两年博后工作,此后在橡树岭国家实验室做了六年研究工作,一直到2003年加入密苏里大学,从2007-2016年,他担任该校计算机科学系的系主任。许东教授的研究主要集中在生物信息学方面,包括机器学习在生物信息学的应用,蛋白质结构预测,蛋白质定位预测,蛋白质翻译后修饰的识别,单细胞数据的分析,还有植物、微生物和癌症的计算机模拟研究,以及生物信息系统。他的蛋白结构预测工作获得2001 年R&D 100大奖。许东教授目前已发表400多篇论文,他是美国科学促进会(AAAS,2015年)会士和美国医学和生物工程研究院(AIMBE,2020年)会士。
讲座中,许东教授首先对蛋白质定位预测任务进行了简单的介绍,然后详细介绍了论文中提出的基于深度学习的定位预测框架MULocDeep,该框架可以预测蛋白质在亚细胞和亚组织水平的多个定位,接下来介绍了MULocDeep中使用的注意力机制,通过引入注意力机制,不但提高了实验的准确率而且还增强了模型的可解释性。之后介绍了MULocDeep在不同数据集下跟其他模型的比较结果。许东教授还在线演示了MULocDeep Server的使用。
最后,许东教授悉心回答了老师和同学们的问题。超过130位同学和老师参加了本次报告,本次活动受到了我院师生的一致好评。