北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH
北京大学深度学习实验室开放日活动暨招生咨询会

2017-11-29

为进一步促进北京大学深度学习的学术交流,将于2017年12月2日,在北京大学静园六院211会议室,举办第一次北京大学深度学习实验室开放日暨招生咨询会活动,欢迎有志于在数据科学、深度学习、强化学习以及机器学习方面研究的数学、统计及计算机等相关专业的本校大二、大三学生报名参加。


深度学习实验室(www.dl.pku.edu.cn)是北京大学大数据科学研究中心最重要的基础研究机构。它集结了北京大学在计算机科学、应用和计算数学、统计学等领域的最活跃的学者。希望用三到五年的时间建成世界一流的研究机构,成为中国深度学习和人工智能学科的最主要的基础研究中心。


实验室的任务是研究机器学习的机理,包括但不限于深度学习和强化学习,并且运用机理去解决现实问题。发展机器学习理论,研究新的机器学习模型和原型,设计高效的算法以及实现大规模的算法软件库/平台。目前研究方向主要集中在以下几个方面:


  1. 发展理解深度学习机制的理论;

  2. 发展高效的优化多层神经网络的算法;

  3. 针对不同类型问题的网络结构设计;

  4. 贝叶斯模型和产生式博弈模型;

  5. 强化学习及其应用;

  6. 自然语言处理、计算机视觉、量化经济等领域的应用。


欢迎有志于数据科学、深度学习、强化学习及机器学习的优秀学生加入我们!


北京大学深度学习实验室开放日活动——暨招生咨询会


宣讲时间

2017年12月2日 10:00-12:00(大二学生专场)

2017年12月2日 13:00-15:00(有意留校继续深造的大三学生专场)


宣讲地点

北京大学静园六院211会议室



实验室教师成员(按首字母顺序)


崔斌、董彬、鄂维南、穆亚东、孙栩、邰骋、王立威、文再文、严睿、张立、章斯鑫、张志华、朱占星、邹磊




崔斌,北京大学信息学院教授、博士生导师,担任网络与信息系统研究所长。他的研究方向包括数据库系统设计和性能优化、数据挖掘、大数据管理与分析等。他合编过一本书籍,发表了100多篇学术论文,其中50余篇发表在一流国际会议和期刊,包括ACM SIGMOD、VLDB、IEEE ICDE、TKDE等。他主持和承担多个科研项目,如国家自然科学基金、核高基项目、863计划等。他担任中国计算机学会数据库专委会秘书长,VLDB理事会理事,IEEE TKDE、VLDB Journal、Information Systems、DAPD等国际期刊编委,担任过数十个国际会议的程序委员会委员,包括一流国际会议SIGMOD、VLDB、ICDE、KDD等。于2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会 “CCF 青年科学家奖”,2014年获教育部自然科学二等奖,2016年入选教育部长江学者特聘教授。

个人主页

http://net.pku.edu.cn/~cuibin/

科研项目

支持大数据分析的分布式机器学习系统设计、算法优化。



董彬,北京国际数学研究中心研究员,北京大数据研究院生物医学影像分析实验室副主任。2009年在美国加州大学洛杉矶分校(UCLA)数学系获得博士学位。博士毕业后曾在美国加州大学圣迭戈分校(UCSD)数学系任访问助理教授、2011-2014年在美国亚利桑那大学(University of Arizona)数学系任(Tenure-Track)助理教授,2014年底入职北京大学、北京国际数学研究中心。主要研究领域为应用调和分析、变分法、偏微分方程、机器学习及其在图像和数据科学中的应用,应用包括图像重建及修复、生物医学成像、生物医学影像分析、疾病量化、治疗方案自动优化、半/无监督学习等问题,在包括《Journal of the American Mathematical Society》,《Applied and Computational Harmonic Analysis》,《Mathematics of Computation》, 《SIAM系列期刊》,《Journal of the Royal Statistical Society Series B》在内的国际重要学术期刊和会议上发表论文40余篇,拥有2项美国专利。于2014年获得求是基金会的求是杰出青年学者奖,2015年入选中组部第十一批“千人计划”青年人才。

个人主页

http://bicmr.pku.edu.cn/~dongbin

科研项目

  1. 生物医学成像:CT、PET、核磁图像/信号重建;冷冻电镜三维结构重建;超分辨成像;

  2. 医疗影像分析:医疗影像(CT、核磁)特征提取、定量分析、智能辅助诊断;

  3. 深度学习:从应用数学角度研究深度学习,融合两个领域的优点,指导深层网格构架涉及,解决图像科学中有挑战的问题。



鄂维南,北京大数据研究院院长、北京大学元培学院院长;中国科学院院士;美国数学学会、美国工业与应用数学学会会士;北京大学国际数学研究中心和数学学院教授;普林斯顿大学数学系和应用数学研究所教授。1996 年获首届美国总统青年科学家与工程师奖;2003 年获国际工业与应用数学协会科拉兹(Collatz) 奖;2009 年获美国工业与应用数学学会克来曼(Kleinman) 奖;2014 年获美国工业与应用数学学会卡门 (Theodore von Karman) 奖。现任中国计算数学学会第九届理事会理事长;国家973 计划项目“非结构数据的统计学习:数学基础及算法”首席科学家;中国大数据专家委员会副主任委员;中国计算机学会大数据专家委员会委员。

个人主页

https://web.math.princeton.edu/~weinan/



穆亚东,北京大学研究员、博士生导师,2016年入选国家“青年千人计划”.2004年在北京大学计算机系获得理学学士学位,2009年获得北京大学理学博士学位。穆亚东博士曾在新加坡国立大学(NUS)、美国哥伦比亚大学、华为香港诺亚方舟实验室、美国电话电报公司研究院(AT&T Labs)担任研究职位,2016年5月加入北京大学计算机科学技术研究所。主要研究领域为计算机视觉、多媒体内容分析、大规模机器学习以及通信运营商数据挖掘,在国际主流会议和期刊发表论文40余篇,其中在CVPR/ICCV/ICML/SIGKDD等中国计算机学会(CCF)论文推荐列表A类会议发表论文超过二十篇,申请PCT/美国/中国专利近二十项。曾经作为Columbia-IBM  Watson联合项目组的主要成员,参与美国军方资助的多媒体语义事件检测ALADDIN工程。在华为香港工作期间,作为主要算法设计师参与上海联通海量通信位置数据挖掘系统。在美国电话电报公司研究院(AT&T Labs)工作期间,参与客户服务数据挖掘系统IAX的机器学习子系统、美国电信客户流失分析(churn analysis)系统等。穆亚东博士在数据哈希技术这一课题有深入研究。目前主要从事机器智能相关的研究工作,特别是多媒体事件监测、大规模机器学习、深度神经网络、自动驾驶算法等。

个人主页

http://www.muyadong.com

科研项目

  1. 大规模视频语义分析:视频分类、视频事件检测、视觉语义概念嵌入模型等;

  2. 基于视觉的自动驾驶算法:基于视觉信息的车辆驾驶模型、目标(行人、车辆、交通标注等)检测、基于视觉信息的定位与导航算法等;

  3. 机器学习与深度学习:分布式凸优化算法、半随机梯度下降算法、图数据的深度学习等。



孙栩,北京大学信息学院研究员,博士生导师。日本东京大学博士。先后在日本东京大学、美国康奈尔大学、香港理工大学担任研究职位。曾在微软公司美国雷蒙德研究院实习。研究方向为自然语言处理、机器学习、人工智能,目前关注自然语言的结构表示与学习、自然语言的自动生成。先后在国际高水平会议和期刊ACL, ICML, NIPS, AAAI, IJCAI, EMNLP, TKDE, CL等发表30余篇论文。担任EMNLP、IJCNLP等国际学术会议的领域主席;ACL, IJCAI, AAAI, COLING, EMNLP, NAACL等国际学术会议的程序委员会成员;IEEE TPAMI, Comput. Linguist.等期刊的审稿人。2014年入选中组部第十批“千人计划”青年人才。2015年获得求是杰出青年学者奖(香港求是科技基金会)。2016年获得大川研究助成奖(日本大川情报通讯基金会)。

个人主页

http://xusun.org

科研项目

  1. 自然语言的结构表示与学习:研究自然语言的内部结构以及如何去建模学习,包括自动分词、句法分析、篇章分析等(如NIPS 2014,ACL 2016)

  2. 自然语言的自动生成:研究自然语言是怎么产生的,包括paraphrasing,自动文本摘要,神经机器翻译等(如ACL 2017)

  3. 深度学习方法的创新研究:深度学习方法、模型方面的创新研究(如ICML 2017)

  4. 互联网文本处理(如AAAI 2017)




邰骋,北京大学大数据科学研究中心助理研究员,北京大数据研究院研究员。2016年获得普林斯顿大学应用数学博士学位。主要研究领域包括大规模机器学习、人工智能算法和系统,应用调和分析等。在SIAM,JMLR,ICML等期刊会议发表多篇论文。曾获得普林斯顿大学C.V.STARR Fellowship奖项。邰骋及其团队研发了新一代大规模生物识别系统,被业界广泛应用。

科研项目

  1. 深度学习、增强学习的算法和机理;

  2. 机器学习辅助的系统模拟;

  3. 非结构化数据分析和搜索,计算机视觉应用;

  4. 大规模机器学习系统。



王立威,北京大学信息科学技术学院教授,清华大学交叉信息研究院兼职教授。长期从事机器学习基础理论研究,在机器学习领域国际权威期刊会议发表论文100余篇。2011年获人工智能国际奖AI’s 10 to Watch,是该奖项设立以来首位入选的亚洲学者。2012年获首届国家自然科学基金优秀青年基金,并入选新世纪优秀人才。担任人工智能国际权威会议NIPS等领域主席和多家学术期刊编委。目前为中国计算机学会模式识别与人工智能专委会委员、中国人工智能学会模式识别专委会委员。

个人主页

http://www.cis.pku.edu.cn/faculty/vision/wangliwei/

科研项目

  1. 深度学习泛化理论;

  2. 深度神经网络表示理论;

  3. 深度强化学习算法;

  4. 机器学习在医疗影像中的应用



文再文,北京国际数学研究中心研究员。分别于2001年、2004年和2009年在上海交通大学、中科院数学与系统科学研究院和美国哥伦比亚大学获学士、硕士和博士学位。 主要研究最优化理论与算法及其在数据科学和材料科学中的应用 。2012年获得教育部新世纪优秀人才支持计划。2013年获得国家自然科学基金优秀青年基金。2015年获得中组部青年拔尖人才计划。2016年获得中国青年科技奖。 已经在SIAM J. on Optimization、SIAM J. on Scientific Computing、 Mathematical Programming 等国际重要杂志发表论文30余篇。开发有 MGLS,FPC_AS,LMaFit, OptM和Arrabit等多个学术软件包。现为 “Mathematical Programming Computation”等杂志编委。

个人主页

http://bicmr.pku.edu.cn/~wenzw

科研项目

  1. 正交约束优化,非线性特征值问题;

  2. 矩阵优化和带结构优化问题;

  3. 机器学习,增强学习等模型的优化算法与理论。



严睿,北京大学计算机科学技术研究所助理教授(研究员),前百度公司资深研发,华中师范大学与中央财经大学客座教授与校外导师。主持研发多个开放问答系统和服务对话系统,发表高水平研究论文近50篇,其中CCF A类论文20余篇,担任多个高水平学术会议(KDD, SIGIR, ACL, WWW, AAAI, CIKM, EMNLP等)的(高级)程序委员会委员及审稿人。

个人主页

http://www.ruiyan.me

科研项目

  1. 语言处理:理解自然语言的形成,理解,挖掘,以及处理,并应用于实际语言类项目中;

  2. 认知学习:通过(深度)机器学习的方式,探索包括但不仅限于自然语言相关的认知课题。



张立,北京大学大数据科学研究中心助理研究员,北京大数据研究院研究员,北京大学健康医疗大数据研究中心、生物医学影像分析实验室研究员。2010年在武汉大学物理学院获得学士学位。2015年在美国爱荷华大学电子与计算机工程获得博士学位。博士毕业后爱荷华大学担任博士后研究员,2016年8月入职北京大数据研究院、北京大学健康医疗大数据研究中心、生物医学影像分析实验室。主要研究领域为图搜索、图割算法的优化问题及其在图像分割、图像配准等医学影像分析上的应用,以及机器学习算法在影像分析上的应用,在临床应用方面包括心血管主动脉CT、MRI图像的三维分割和定量分析,冠状动脉血管内超声和OCT图像的管壁重建以及斑块分析,大脑皮层和不同分区的MRI图像分割技术以及眼底照片、OCT图像分割技术,在包括《IEEE Transaction on Medical Imaging》,《JAMA ophthalmology》,《American Journal of Ophthalmology》,《Visual Neuroscience》在内的重要学术期刊上发表论文15篇。

个人主页

https://scholar.google.com/citations?user=VcfDUwgAAAAJ&hl=en

科研项目

CT、MRI、OCT、超声、眼底影像的图像分割和定量分析;基于深度学习方法的生化检测/病理图像分析;针对生物医学影像的全卷积深度神经网络设计。



章斯鑫,北京大学大数据科学研究中心助理研究员,北京大数据研究院研究员。2016年在美国纽约大学获得计算机博士学位,导师Yann LeCun。主要研究领域为深度学习及分布式优化算法。目前在法国巴黎高等师范学院从事博士后研究工作,导师Stephane Mallat。研究课题为深度学习与图像表示。

个人主页

cims.nyu.edu/~zsx



张志华,北京大学数学科学学院统计学教授,北京大数据研究院教授。之前曾经先后任教于上海交通大学和浙江大学,任聘计算机科学教授。主要从事于统计机器学习与人工智能领域的研究和教学。是国际机器学习旗舰刊物Journal of Machine Learning Research的执行编委,并多次受邀担任国际人工智能顶级学术会议的程序委员或高级程序委员。其网络公开课“统计机器学习”和“机器学习导论”受到广泛关注。

个人主页

http://www.math.pku.edu.cn/teachers/zhzhang/

科研项目        

  1. 深度学习:深度强化学习、自然语言处理、游戏娱乐、深度学习优化算法等;

  2. 机器学习基础:贝叶斯方法、大规模机器学习模型的求解算法等;

  3. 理论计算机科学:随机算法、在线博弈、区块链等。



朱占星,北京大学大数据科学研究中心助理研究员,北京大数据研究院研究员。2016年在英国爱丁堡大学获得机器学习方向博士学位。 主要研究领域为人工智能,机器学习,深度学习的优化方法,深度学习机制理论,大规模贝叶斯计算与优化理论,机器学习在交通大数据应用及计算机图形学中的应用等,在机器学习领域顶级期刊及会议有多篇文章发表,包括NIPS, ICML, ACL, AAAI及 ECML 等。

个人主页

https://sites.google.com/view/zhanxingzhu/

科研项目

  1. 深度学习及机器学习方法论:深度学习机制,深度学习优化方法,大规模优化,大规模贝叶斯计算,MCMC等;

  2. 深度学习及机器学习在大数据中的应用:深度学习在交通大数据中的应用,深度学习/增强学习在计算机图形学中的应用,机器学习在工业系统控制系统中的应用。



邹磊,北京大学教授,博士生导师,国家自然科学基金优秀青年基金项目获得者。邹磊分别于2003年和2009年毕业于华中科技大学计算机科学与技术学院,获得工学学士和工学博士学位;其博士学位论文获得2009年中国计算机学会优秀博士学位论文提名奖和湖北省优秀博士论文奖。2009年9月加入北京大学计算机科学技术研究所。他目前的研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理,面向知识图谱的自然语言问答系统。目前他已经发表了30余篇国内外学术论文,包括CCF-A类的数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)20余篇;其论文被引用超过1400多次(根据Google Scholar的统计),单篇最高被引用320余次。2014年所主持的项目“海量图结构数据存储和查询优化理论研究”,获得中国计算机学会自然科学二等奖(邹磊排名第一)。邹磊承担了包括国家自然基金、国家重点研发项目等多项国家科研攻关项目;其研究也到了包括微软、腾讯等产业界公司的资助。

研究组主页

http://www.icst.pku.edu.cn/db/en/index.php/Main_Page

科研工作

  1. gStore:   面向百亿边的开源的知识图谱图数据库系统

    http://www.gstore-pku.com/

  2. gAnswer: 面向知识图谱的自然语言问答系统

    http://ganswer.gstore-pku.com/