北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH
研究中心与实验室
大数据分析与应用技术国家工程实验室

  大数据分析与应用技术国家工程实验室是由北京大学牵头,联合中国科学院数学与系统科学研究院、北京奇虎科技有限公司、北京嘀嘀无限科技发展有限公司、中山大学、中国信息安全研究院等单位共同建设,并于2017年获国家发改委正式批复同意。 实验室以北京大数据研究院为支撑平台,计划建设大数据预处理技术平台、大数据共性模型与算法平台、数据挖掘技术平台、可视分析平台、智能知识管理与决策支持平台等五个研发平台。各研发平台主要依托北京大学进行建设,根据重点行业应用和产业发展的需要,联合开展研究开发、人才培养、成果应用和产业化。实验室核心团队包括院士4人,千人计划3人,长江学者3人以及“杰青”6人,“优青”8人,青年千人5人等一大批活跃在大数据领域的年轻学者、业界专家。

深度学习实验室

  北京大学深度学习实验室是北京大学数据科学研究中心(北京大数据研究院)最重要的基础研究机构。它集结了北京大学在计算机科学、应用和计算数学、统计学等领域的最活跃的学者。实验室主任由机器学习领域国际上最活跃的学者之一张志华教授担任。希望用三到五年的时间建成世界一流的研究机构,成为中国深度学习和人工智能学科的最主要的基础研究中心。

  实验室的使命是研究机器学习的机理,包括但不限于深度学习和强化学习,并且运用机理去解决现实问题。发展机器学习理论,研究新的机器学习模型和原型,设计高效的算法以及实现大规模的算法软件库/平台。目前研究方向主要集中在但不限于以下几个方面:

1.  发展理解深度学习机制的理论;

2.  发展高效的优化多层神经网络的算法;

3.  针对不同类型问题的网络结构设计;

4.  贝叶斯模型和产生式博弈模型;

5.  强化学习及其应用;

6.  自然语言处理、计算机视觉、量化经济等领域的应用。

  实验室将在数据科学专业招收直博生和硕士生,并单独培养;同时依靠北京大学数学学院和北京国际数学中心招收博士后研究员。

人工智能及机器学习实验室

  人工智能及机器学习实验室成立于2016年,是大数据研究院基础研究的重要实验室。研究团队由北京大学数学学院张志华教授领衔,主要成员包括邰骋研究员(普林斯顿大学应用数学博士)、朱占星研究员(爱丁堡大学机器学习博士)、国家青年千人计划穆亚东副教授等。实验室旨在进行世界一流的人工智能、机器学习以及深度学习领域的研究创新,为大数据研究院其他核心项目与研究中心提供相关的技术支持,以及在北京大学和大数据研究院进行相关教学科研,来培养一流的人工智能方面的人才。

  实验室的主要研究内容包括:深度学习、强化学习、贝叶斯方法、大规模优化算法、机器学习建模理论等,也涵盖机器学习在各个领域的应用,如计算机视觉、自然语言、智能交通以及医学影像等。

  实验室的开设课程:《深度学习》、《统计机器学习》、《数据科学导论》等。

自然语言处理与认知智能实验室

  自然语言处理与认知智能实验室,是北京大数据研究院的重要的基础实验室之一。研究团队由赵东岩教授、万小军教授、穗志方教授、王厚峰教授、严睿博士、徐剑波、孙薇薇、冯岩松、张翔等人组成,研究方向主要包括深度语义分析与知识萃取、大规模高精度语义知识库构建、知识问答与智能文本对话;拟研制面向互联网的文本语义分析引擎、大规模汉语语言和中文语义知识库、文本知识问答系统、自动写作机器人与人机对话平台;目前已有多项研究成果,包括包含130万以上实体、超过1300万知识条目的中文RDF语义知识库 PKUBase;支持十亿规模的知识图谱,查询响应时间平均400毫秒的语义查询引擎 gStore;在网宣、新闻出版、安全、教育等多个领域得到广泛应用的智思舆情监测系列产品等。

大数据安全实验室

  大数据安全实验室科研队伍主要来自于2009年成立的网络与软件安全保障教育部重点实验室。实验室面向国家大数据战略和网络空间安全战略需求,致力于大数据安全基础理论研究、关键技术与系统研发。团队由吴中海教授牵头,主要研究人员由教授、副教授、讲师、博士生、硕士生梯队组成。其中教授3人,副教授2人,讲师2人,博士生5人,硕士生15人。研究队伍平均年龄37岁,均获博士学位,并长期从事大数据与云安全、网络与系统安全等领域的研究工作,积累了丰富的理论研究基础和实践经验。大数据安全实验室研究方向为大数据安全理论、大数据平台安全、隐私保护技术、云存储安全、安全态势感知等。实验室的总体目标是为大数据安全保障体系建设提供理论指导和科学依据;对前沿性和前瞻性大数据安全领域的关键问题进行探索与创新研究,以促进和推动数据科学和网络空间安全学科的融合发展;研发具有自主知识产权的大数据安全关键技术和可信服务,以满足国家和行业企业的需求,为国家培养高水平的大数据安全专业人才。实验室研究团队承担了国家重大科技专项、国家重点研发计划专项、国家自然科学基金、863计划、科技支撑计划、国防科技计划等国家与省部级重要项目30余项,与IBM、英特尔、微软、AWS、华为、腾讯、奇虎360、台达电子等企业合作研究项目50余项,发表论文200余篇,获得国际、国内发明专利30余个,登记软件著作权10余项。

生物医学影像分析实验室

  生物医学影像分析实验室成立于2016 年,是北京大数据研究院的跨学科研究的重要组成部分。实验室旨在采用智能影像处理技术,对医学影像分析与处理、临床疾病的预测、计算机辅助诊疗等相关领域做出突出贡献。内容包括医学影像技术基础理论的研究、核心技术的研发,先进技术成果的推广应用和专业高级人才的培养。目前,实验室主任由美国麻省总医院Gordon 医学影像中心人工智能研究室主任李全政教授担任。

  实验室的主要研究方向为医学影像分析与处理的理论研究和算法设计,兼顾专科医学影像的图像处理技术,包括肿瘤病理图像人工智能分析,心血管胸主动脉CT、MRI 图像的三维分割和定量分析,冠状动脉血管内超声和OCT 图像的管壁重建以及斑块分析,大脑皮层以及不同分区的MRI 图像分割技术,肺部热结节X射线、CT 图像的定位检测与定量分析,肾脏病理图像的识别技术以及眼底照片、OCT 图像分割技术等多专科多模态多方向的医学影像处理技术。

  医学影像分析实验室力争成为生物医学工程、计算机技术与临床科学等交叉领域国际领先的科研单位。同时,希望与国内外相关学术机构、产业界开展广泛深入的合作,搭建医学影像分析学科的国际创新网络。

公共安全大数据重点实验室

  北京公共安全大数据重点实验室,由北京大数据研究院与北京市公安局合作共建。实验室以强化应对和处理重大突发公共安全事件的数据支持,提高公共安全保障能力,维护国家安全和社会安定为目标,以社会公共安全极端案件、社会突发群体性事件、涉网突发安全事件、涉恐暴恐活动袭击的预测预警为手段,依托生物特征识别、监控视频分析、大数据情报、社交媒体数据分析等基础技术,围绕社会治安防控大数据感知探测、社会公共安全信息融合理解、海量多维安全数据关联分析、社会安全风险预测预警等关键技术开展研究工作,并与反恐、网安、技侦、刑侦、情报等业务应用紧密、结合实现学、研、产、用的协同创新发展。实验室由刘云淮研究员牵头,代表性项目包括新疆反恐大数据平台、江西省公安厅大数据平台等。

数据管理实验室

  实验室面向大数据环境下数据管理的问题,致力于大数据管理系统的基础理论研究、开源系统构建和应用。实验室围绕着知识图谱数据,图数据流等开展了大量的基础研究工作并构建了相关开源图数据库系统gStore,其科研项目“海量图结构数据存储和查询优化理论研究”获得中国计算机学会自然科学二等奖。实验室近3年主持和承担了包括国家重点研发计划课题,国家自然科学基金委优秀青年基金、重点基金等10余项国家课题;已发表数据库领域国际顶级期刊和会议论文20余篇。

智能交互实验室

  智能交互实验室秉承“以人为本”的创新理念,面向主流大众用户, 重点开展基于多通道的自然人机交互理论与应用研究, 推动从人适应机器向机器适应人的技术跨越。主要研究方向包括: 连续情感表示与识别、多通道交互、实时智能交互、探索式可视化分析以及物联网应用。

  实验室坚持理论与实践结合,创新与继承并重,应用需求驱动,在开展智能人机交互创新性基础理论与技术研究和开发,实现科研成果的应用与推广的同时,注重合作研究与交流,广泛开展国内国际合作,与国内外多家研究机构建立了长期的合作交流关系,多次应邀到美国、英国和日本等地进行学术报告和交流。

  实验室现有中、高级研究人员16人,其中博士学位以上人员占60%以上,在国内外主流会议(ACM SIGGRAPH, ACM SIGCHI,IEEE RTSS等)和期刊(IEEE transaction on Multimedia, ACM Transaction on Graphics等)上发表高水平学术论文100余篇,对推动人机交互的创新研究与发展产生了重要影响。