北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH
研究中心与实验室
金融大数据研究中心

  目前金融行业在业务开展过程中积累了包括客户身份信息、资金流水信息、金融履约信息等大量高价值密度的 数据,在运用专业技术挖掘和分析之后,将产生巨大的商业价值。为了更好地促进金融大数据的研究和利用工作,北京大数据研究院设立了金融大数据研究中心。

  金融大数据研究中心围绕信贷数据、证券市场数据和保险数据三大金融数据类别,设立大数据征信研究室、互联网金融研究室、证券市场大数据监管研究室、量化投资实验室和互联网保险研究室。对中国金融领域数据开展全面研究。

时空大数据协同创新中心

  为推动时空大数据的新理论、新技术前瞻性研究和产业化发展,2016年北京大学和北京旋极信息技术股份有限公司联合成立了“北京大学时空大数据协同创新中心”,第一期启动经费1亿元人民币。中心现有教授、副教授、高工等研究人员30余人,成立了以鄂维南院士、陈江涛董事长为理事长的理事会,程承旗教授任主任。由20多位院士和国内外优秀学者组成学术委员会,并聘请了以李德仁院士为学术委员会主任,对科学研究进行指导。

健康医疗大数据研究中心

  在国家大力推动健康医疗大数据研究与应用的大形势下、历经北京大学及北京大学医学部相关领导的长期酝酿、由北京大学医学部和北京大数据研究院共同筹备建立北京大学健康医疗大数据研究中心。北京大学健康医疗大数据研究中心的宗旨是集成多源健康医疗大数据、采用国际前沿的数据处理和分析技术,为国家健康医疗战略、医学实践和全人群健康管理提供大数据驱动的决策支持,同时培养行业领军人才,促进产业转化,打造国际一流、国内领先、产学研一体的健康医疗大数据平台。北京大学健康医疗大数据研究中心由李全政担任中心主任,张路霞担任常务副主任,王海波、胡永华、周晓华、谢冰和詹思延担任副主任;另设指导委员会、顾问委员会和专家委员会。

交通大数据研究中心

  交通大数据研究中心是北京大数据研究院先期启动建设的实体化运营分支机构,交通研究中心立足于北京交通信息资源和人才,辐射全国,试点示范建立交通大数据协同研究、转化、产业三线并行的管理机制。依托北京大数据研究院成立的股份制的技术成果转化中心和纯市场化的大数据创业企业孵化机制和载体,培育服务北京交通大数据领域的技术创新型企业。面向交通运输产业和市场需求,立足大数据科技成果转化,推动中国智能交通科学研究、技术攻关和产品应用,促进智能交通产业科学和健康发展,努力成为国内领先、国际一流的集协同研究、成果转化、产业发展三线于一身的专业化组织。

能源与环境大数据研究中心

能源与环境大数据研究中心,专家团队由北京大学教授、北京大数据研究院学术委员会主任张平文院士领衔,并整合了来自北京大学、清华大学、中国人民大学、南京大学等高校的教授、博士后、研究生资源以及专业的项目管理团队。中心将面向国家能源与环境领域的重大需求与关键科学问题展开研究,包括能源与环境大数据处理与应用、混合建模与预测、大数据分析和数值预报算法研究、能源环境政策分析等,并依托研究院在大数据人才培养、科研创新和产业化的优势,打造政产学研用一体化的专业平台,为生态文明建设提供高质量的智库服务。目前已在空气质量预报与雾霾治理模型、风电功率预测模型、赤潮预报模型、近海养殖区水文水质预测模型的研究上取得了重大进展。

中医大数据研究中心

  北京大数据研究院中医大数据中心,是国内首个整合了政府、大学和市场三方面资源的中医大数据中心。中心集合北京大学、政府、各中医药大学、各大型中医院、行业企业等的优质资源,借助北京大学在人才、技术、教学等上的优势地位,聚集国际一流的专家顾问团队,将与国内外同行一道,开展中医大数据人才教学与培训,培养中医大数据行业领军人才,打造国际一流的中医大数据平台,并与企业共同开展中医大数据分析和成果转化,引领中医大数据产业发展,并通过大数据促进中医行业发展。

  中心着力研发大数据采集与处理、数据挖掘分析、人工智能等中医大数据关键核心技术,建立国内领先的第三方中医大数据库和应用平台,基于大数据面向全社会提供中医智能引擎,中西药的临床全流程数据服务,以及为中西药研究者提供一站式研究型服务工作。中心下设中医人工智能平台、中西药临床服务平台、中西药临床科研一体化大数据库及分析平台。

  中医人工智能平台将基于中医大数据聚焦中医病历的自然语义处理、中医智能辨证论治、中医四诊智能诊断、中医名家经验挖掘等方面,搭建核心人才队伍,研发核心引擎,并与行业企业一道实现成果产业化;中西药临床服务平台提供医药产品各期临床试验技术外包服务,包括中药、化药、生物制品、保健食品、医疗器械、诊断试剂的新产品临床试验及上市后再评价临床研究、人体药代动力学及生物等效(仿制药一致性评价)等相关的技术外包服务。中西药临床科研一体化大数据库及分析平台主要负责中西药数据库的建立和维护,提供临床科研一体化服务,同时负责系统性收集、整理、质控、构建和整合中药RCT、上市后再评价、安全性数据库、科研项目的各来源数据及分析工作。


公共安全大数据研究中心

北京大数据研究院公共安全大数据研究中心,由北京大数据研究院与北京市公安局合作共建。中心以强化应对和处理重大突发公共安全事件的数据支持,提高公共安全保障能力,维护国家安全和社会安定为目标,以社会公共安全极端案件、社会突发群体性事件、涉网突发安全事件、涉恐暴恐活动袭击的预测预警为手段,依托生物特征识别、监控视频分析、大数据情报、社交媒体数据分析等基础技术,围绕社会治安防控大数据感知探测、社会公共安全信息融合理解、海量多维安全数据关联分析、社会安全风险预测预警等关键技术开展研究工作,并与反恐、网安、技侦、刑侦、情报等业务应用紧密结合实现学、研、产、用的协同创新发展。中心由刘云淮研究员牵头,代表性项目包括新疆反恐大数据平台、江西省公安厅大数据平台等。

保险大数据研究中心

  保险大数据研究中心基于保险行业,跨界整合航空、旅游、银行、健康医疗等行业相关的大数据、采用国际前沿的数据处理和分析技术,为国家保险创新战略、传统保险行业转型和保险客户终生价值管理提供大数据驱动的决策支持。同时,培养行业领军人才,加强学科建设,促进产业转化,打造国际一流、国内领先、产学研一体的保险大数据平台。保险大数据研究中心将设立专家委员会和顾问委员会。工作团队组织架构将由一位主任和数位副主任构成。

  成立初期,保险大数据研究中心将设以下研究部门:

  保险新技术应用研究室:将致力于将新兴科学技术例如区块链技术、人工智能技术、深度学习技术等应用于保险行业的创新研究。

  保险商业模式创新研究室:将致力于传统保险行业的转型与商业模式创新。包括营销模式创新、服务模式创新、渠道创新、产品创新等。  

  保险精算研究室:将基于保险大数据的基础,开展产品开发和评估精算技术的应用研究。包括车险价格系统的动态调整技术、基于不同数据源的死亡率模型等。

  机动车辆保险研究室:将基于机动车辆大数据在保险产品设计以及定价模型创新等方面进行深入研究。

  健康医疗保险大数据研究室:将基于健康医疗大数据、利用人工智能技术,结合对于健康医疗领域的深刻认知,就健康医疗领域保险的新型产品设计、风险控制、健康和疾病管理和相关产品推广等方向开展研究和应用探索。


大数据分析与应用技术国家工程实验室

  大数据分析与应用技术国家工程实验室是由北京大学牵头,联合中国科学院数学与系统科学研究院、北京奇虎科技有限公司、北京嘀嘀无限科技发展有限公司、中山大学、中国信息安全研究院等单位共同建设,并于2017年获国家发改委正式批复同意。 实验室以北京大数据研究院为支撑平台,计划建设大数据预处理技术平台、大数据共性模型与算法平台、数据挖掘技术平台、可视分析平台、智能知识管理与决策支持平台等五个研发平台。各研发平台主要依托北京大学进行建设,根据重点行业应用和产业发展的需要,联合开展研究开发、人才培养、成果应用和产业化。实验室核心团队包括院士4人,千人计划3人,长江学者3人以及“杰青”6人,“优青”8人,青年千人5人等一大批活跃在大数据领域的年轻学者、业界专家。

深度学习实验室

  北京大学深度学习实验室是北京大学数据科学研究中心(北京大数据研究院)最重要的基础研究机构。它集结了北京大学在计算机科学、应用和计算数学、统计学等领域的最活跃的学者。实验室主任由机器学习领域国际上最活跃的学者之一张志华教授担任。希望用三到五年的时间建成世界一流的研究机构,成为中国深度学习和人工智能学科的最主要的基础研究中心。

  实验室的使命是研究机器学习的机理,包括但不限于深度学习和强化学习,并且运用机理去解决现实问题。发展机器学习理论,研究新的机器学习模型和原型,设计高效的算法以及实现大规模的算法软件库/平台。目前研究方向主要集中在但不限于以下几个方面:

1.  发展理解深度学习机制的理论;

2.  发展高效的优化多层神经网络的算法;

3.  针对不同类型问题的网络结构设计;

4.  贝叶斯模型和产生式博弈模型;

5.  强化学习及其应用;

6.  自然语言处理、计算机视觉、量化经济等领域的应用。

  实验室将在数据科学专业招收直博生和硕士生,并单独培养;同时依靠北京大学数学学院和北京国际数学中心招收博士后研究员。

人工智能及机器学习实验室

  人工智能及机器学习实验室成立于2016年,是大数据研究院基础研究的重要实验室。研究团队由北京大学数学学院张志华教授领衔,主要成员包括邰骋研究员(普林斯顿大学应用数学博士)、朱占星研究员(爱丁堡大学机器学习博士)、国家青年千人计划穆亚东副教授等。实验室旨在进行世界一流的人工智能、机器学习以及深度学习领域的研究创新,为大数据研究院其他核心项目与研究中心提供相关的技术支持,以及在北京大学和大数据研究院进行相关教学科研,来培养一流的人工智能方面的人才。

  实验室的主要研究内容包括:深度学习、强化学习、贝叶斯方法、大规模优化算法、机器学习建模理论等,也涵盖机器学习在各个领域的应用,如计算机视觉、自然语言、智能交通以及医学影像等。

  实验室的开设课程:《深度学习》、《统计机器学习》、《数据科学导论》等。

自然语言处理与认知智能实验室

  自然语言处理与认知智能实验室,是北京大数据研究院的重要的基础实验室之一。研究团队由赵东岩教授、万小军教授、穗志方教授、王厚峰教授、严睿博士、徐剑波、孙薇薇、冯岩松、张翔等人组成,研究方向主要包括深度语义分析与知识萃取、大规模高精度语义知识库构建、知识问答与智能文本对话;拟研制面向互联网的文本语义分析引擎、大规模汉语语言和中文语义知识库、文本知识问答系统、自动写作机器人与人机对话平台;目前已有多项研究成果,包括包含130万以上实体、超过1300万知识条目的中文RDF语义知识库 PKUBase;支持十亿规模的知识图谱,查询响应时间平均400毫秒的语义查询引擎 gStore;在网宣、新闻出版、安全、教育等多个领域得到广泛应用的智思舆情监测系列产品等。

大数据安全实验室

  大数据安全实验室科研队伍主要来自于2009年成立的网络与软件安全保障教育部重点实验室。实验室面向国家大数据战略和网络空间安全战略需求,致力于大数据安全基础理论研究、关键技术与系统研发。团队由吴中海教授牵头,主要研究人员由教授、副教授、讲师、博士生、硕士生梯队组成。其中教授3人,副教授2人,讲师2人,博士生5人,硕士生15人。研究队伍平均年龄37岁,均获博士学位,并长期从事大数据与云安全、网络与系统安全等领域的研究工作,积累了丰富的理论研究基础和实践经验。大数据安全实验室研究方向为大数据安全理论、大数据平台安全、隐私保护技术、云存储安全、安全态势感知等。实验室的总体目标是为大数据安全保障体系建设提供理论指导和科学依据;对前沿性和前瞻性大数据安全领域的关键问题进行探索与创新研究,以促进和推动数据科学和网络空间安全学科的融合发展;研发具有自主知识产权的大数据安全关键技术和可信服务,以满足国家和行业企业的需求,为国家培养高水平的大数据安全专业人才。实验室研究团队承担了国家重大科技专项、国家重点研发计划专项、国家自然科学基金、863计划、科技支撑计划、国防科技计划等国家与省部级重要项目30余项,与IBM、英特尔、微软、AWS、华为、腾讯、奇虎360、台达电子等企业合作研究项目50余项,发表论文200余篇,获得国际、国内发明专利30余个,登记软件著作权10余项。

生物医学影像分析实验室

  生物医学影像分析实验室成立于2016 年,是北京大数据研究院的跨学科研究的重要组成部分。实验室旨在采用智能影像处理技术,对医学影像分析与处理、临床疾病的预测、计算机辅助诊疗等相关领域做出突出贡献。内容包括医学影像技术基础理论的研究、核心技术的研发,先进技术成果的推广应用和专业高级人才的培养。目前,实验室主任由美国麻省总医院Gordon 医学影像中心人工智能研究室主任李全政教授担任。

  实验室的主要研究方向为医学影像分析与处理的理论研究和算法设计,兼顾专科医学影像的图像处理技术,包括肿瘤病理图像人工智能分析,心血管胸主动脉CT、MRI 图像的三维分割和定量分析,冠状动脉血管内超声和OCT 图像的管壁重建以及斑块分析,大脑皮层以及不同分区的MRI 图像分割技术,肺部热结节X射线、CT 图像的定位检测与定量分析,肾脏病理图像的识别技术以及眼底照片、OCT 图像分割技术等多专科多模态多方向的医学影像处理技术。

  医学影像分析实验室力争成为生物医学工程、计算机技术与临床科学等交叉领域国际领先的科研单位。同时,希望与国内外相关学术机构、产业界开展广泛深入的合作,搭建医学影像分析学科的国际创新网络。

公共安全大数据重点实验室

  北京公共安全大数据重点实验室,由北京大数据研究院与北京市公安局合作共建。实验室以强化应对和处理重大突发公共安全事件的数据支持,提高公共安全保障能力,维护国家安全和社会安定为目标,以社会公共安全极端案件、社会突发群体性事件、涉网突发安全事件、涉恐暴恐活动袭击的预测预警为手段,依托生物特征识别、监控视频分析、大数据情报、社交媒体数据分析等基础技术,围绕社会治安防控大数据感知探测、社会公共安全信息融合理解、海量多维安全数据关联分析、社会安全风险预测预警等关键技术开展研究工作,并与反恐、网安、技侦、刑侦、情报等业务应用紧密、结合实现学、研、产、用的协同创新发展。实验室由刘云淮研究员牵头,代表性项目包括新疆反恐大数据平台、江西省公安厅大数据平台等。

数据管理实验室

  实验室面向大数据环境下数据管理的问题,致力于大数据管理系统的基础理论研究、开源系统构建和应用。实验室围绕着知识图谱数据,图数据流等开展了大量的基础研究工作并构建了相关开源图数据库系统gStore,其科研项目“海量图结构数据存储和查询优化理论研究”获得中国计算机学会自然科学二等奖。实验室近3年主持和承担了包括国家重点研发计划课题,国家自然科学基金委优秀青年基金、重点基金等10余项国家课题;已发表数据库领域国际顶级期刊和会议论文20余篇。

智能交互实验室

  智能交互实验室秉承“以人为本”的创新理念,面向主流大众用户, 重点开展基于多通道的自然人机交互理论与应用研究, 推动从人适应机器向机器适应人的技术跨越。主要研究方向包括: 连续情感表示与识别、多通道交互、实时智能交互、探索式可视化分析以及物联网应用。

  实验室坚持理论与实践结合,创新与继承并重,应用需求驱动,在开展智能人机交互创新性基础理论与技术研究和开发,实现科研成果的应用与推广的同时,注重合作研究与交流,广泛开展国内国际合作,与国内外多家研究机构建立了长期的合作交流关系,多次应邀到美国、英国和日本等地进行学术报告和交流。

  实验室现有中、高级研究人员16人,其中博士学位以上人员占60%以上,在国内外主流会议(ACM SIGGRAPH, ACM SIGCHI,IEEE RTSS等)和期刊(IEEE transaction on Multimedia, ACM Transaction on Graphics等)上发表高水平学术论文100余篇,对推动人机交互的创新研究与发展产生了重要影响。