北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH
大数据分析与应用技术国家工程实验室

  大数据分析与应用技术国家工程实验室是由北京大学牵头,联合中国科学院数学与系统科学研究院、北京奇虎科技有限公司、北京嘀嘀无限科技发展有限公司、中山大学、中国信息安全研究院等单位共同建设,并于2017年获国家发改委正式批复同意。 实验室以北京大数据研究院为支撑平台,计划建设大数据预处理技术平台、大数据共性模型与算法平台、数据挖掘技术平台、可视分析平台、智能知识管理与决策支持平台等五个研发平台。各研发平台主要依托北京大学进行建设,根据重点行业应用和产业发展的需要,联合开展研究开发、人才培养、成果应用和产业化。实验室核心团队包括院士4人,千人计划3人,长江学者3人以及“杰青”6人,“优青”8人,青年千人5人等一大批活跃在大数据领域的年轻学者、业界专家。

深度学习实验室

  北京大学深度学习实验室是北京大学数据科学研究中心(北京大数据研究院)最重要的基础研究机构。它集结了北京大学在计算机科学、应用和计算数学、统计学等领域的最活跃的学者。实验室主任由机器学习领域国际上最活跃的学者之一张志华教授担任。希望用三到五年的时间建成世界一流的研究机构,成为中国深度学习和人工智能学科的最主要的基础研究中心。

  实验室的使命是研究机器学习的机理,包括但不限于深度学习和强化学习,并且运用机理去解决现实问题。发展机器学习理论,研究新的机器学习模型和原型,设计高效的算法以及实现大规模的算法软件库/平台。目前研究方向主要集中在但不限于以下几个方面:

1.  发展理解深度学习机制的理论;

2.  发展高效的优化多层神经网络的算法;

3.  针对不同类型问题的网络结构设计;

4.  贝叶斯模型和产生式博弈模型;

5.  强化学习及其应用;

6.  自然语言处理、计算机视觉、量化经济等领域的应用。

  实验室将在数据科学专业招收直博生和硕士生,并单独培养;同时依靠北京大学数学学院和北京国际数学中心招收博士后研究员。

人工智能及机器学习实验室

  人工智能及机器学习实验室成立于2016年,是大数据研究院基础研究的重要实验室。研究团队由北京大学数学学院张志华教授领衔,主要成员包括邰骋研究员(普林斯顿大学应用数学博士)、朱占星研究员(爱丁堡大学机器学习博士)、国家青年千人计划穆亚东副教授等。实验室旨在进行世界一流的人工智能、机器学习以及深度学习领域的研究创新,为大数据研究院其他核心项目与研究中心提供相关的技术支持,以及在北京大学和大数据研究院进行相关教学科研,来培养一流的人工智能方面的人才。

  实验室的主要研究内容包括:深度学习、强化学习、贝叶斯方法、大规模优化算法、机器学习建模理论等,也涵盖机器学习在各个领域的应用,如计算机视觉、自然语言、智能交通以及医学影像等。

  实验室的开设课程:《深度学习》、《统计机器学习》、《数据科学导论》等。

自然语言处理与认知智能实验室

  自然语言处理与认知智能实验室,是北京大数据研究院的重要的基础实验室之一。研究团队由赵东岩教授、万小军教授、穗志方教授、王厚峰教授、严睿博士、徐剑波、孙薇薇、冯岩松、张翔等人组成,研究方向主要包括深度语义分析与知识萃取、大规模高精度语义知识库构建、知识问答与智能文本对话;拟研制面向互联网的文本语义分析引擎、大规模汉语语言和中文语义知识库、文本知识问答系统、自动写作机器人与人机对话平台;目前已有多项研究成果,包括包含130万以上实体、超过1300万知识条目的中文RDF语义知识库 PKUBase;支持十亿规模的知识图谱,查询响应时间平均400毫秒的语义查询引擎 gStore;在网宣、新闻出版、安全、教育等多个领域得到广泛应用的智思舆情监测系列产品等。

数据管理实验室

  实验室面向大数据环境下数据管理的问题,致力于大数据管理系统的基础理论研究、开源系统构建和应用。实验室围绕着知识图谱数据,图数据流等开展了大量的基础研究工作并构建了相关开源图数据库系统gStore,其科研项目“海量图结构数据存储和查询优化理论研究”获得中国计算机学会自然科学二等奖。实验室近3年主持和承担了包括国家重点研发计划课题,国家自然科学基金委优秀青年基金、重点基金等10余项国家课题;已发表数据库领域国际顶级期刊和会议论文20余篇。

大数据安全实验室

  大数据安全实验室科研队伍主要来自于2009年成立的网络与软件安全保障教育部重点实验室。实验室面向国家大数据战略和网络空间安全战略需求,致力于大数据安全基础理论研究、关键技术与系统研发。团队由吴中海教授牵头,主要研究人员由教授、副教授、讲师、博士生、硕士生梯队组成。其中教授3人,副教授2人,讲师2人,博士生5人,硕士生15人。研究队伍平均年龄37岁,均获博士学位,并长期从事大数据与云安全、网络与系统安全等领域的研究工作,积累了丰富的理论研究基础和实践经验。大数据安全实验室研究方向为大数据安全理论、大数据平台安全、隐私保护技术、云存储安全、安全态势感知等。实验室的总体目标是为大数据安全保障体系建设提供理论指导和科学依据;对前沿性和前瞻性大数据安全领域的关键问题进行探索与创新研究,以促进和推动数据科学和网络空间安全学科的融合发展;研发具有自主知识产权的大数据安全关键技术和可信服务,以满足国家和行业企业的需求,为国家培养高水平的大数据安全专业人才。实验室研究团队承担了国家重大科技专项、国家重点研发计划专项、国家自然科学基金、863计划、科技支撑计划、国防科技计划等国家与省部级重要项目30余项,与IBM、英特尔、微软、AWS、华为、腾讯、奇虎360、台达电子等企业合作研究项目50余项,发表论文200余篇,获得国际、国内发明专利30余个,登记软件著作权10余项。

公共安全大数据重点实验室

  北京公共安全大数据重点实验室,由北京大数据研究院与北京市公安局合作共建。实验室以强化应对和处理重大突发公共安全事件的数据支持,提高公共安全保障能力,维护国家安全和社会安定为目标,以社会公共安全极端案件、社会突发群体性事件、涉网突发安全事件、涉恐暴恐活动袭击的预测预警为手段,依托生物特征识别、监控视频分析、大数据情报、社交媒体数据分析等基础技术,围绕社会治安防控大数据感知探测、社会公共安全信息融合理解、海量多维安全数据关联分析、社会安全风险预测预警等关键技术开展研究工作,并与反恐、网安、技侦、刑侦、情报等业务应用紧密、结合实现学、研、产、用的协同创新发展。实验室由刘云淮研究员牵头,代表性项目包括新疆反恐大数据平台、江西省公安厅大数据平台等。

生物医学影像分析实验室

  生物医学影像分析实验室成立于2016 年,是北京大数据研究院的跨学科研究的重要组成部分。实验室旨在采用智能影像处理技术,对医学影像分析与处理、临床疾病的预测、计算机辅助诊疗等相关领域做出突出贡献。内容包括医学影像技术基础理论的研究、核心技术的研发,先进技术成果的推广应用和专业高级人才的培养。目前,实验室主任由美国麻省总医院Gordon 医学影像中心人工智能研究室主任李全政教授担任。

  实验室的主要研究方向为医学影像分析与处理的理论研究和算法设计,兼顾专科医学影像的图像处理技术,包括肿瘤病理图像人工智能分析,心血管胸主动脉CT、MRI 图像的三维分割和定量分析,冠状动脉血管内超声和OCT 图像的管壁重建以及斑块分析,大脑皮层以及不同分区的MRI 图像分割技术,肺部热结节X射线、CT 图像的定位检测与定量分析,肾脏病理图像的识别技术以及眼底照片、OCT 图像分割技术等多专科多模态多方向的医学影像处理技术。

  医学影像分析实验室力争成为生物医学工程、计算机技术与临床科学等交叉领域国际领先的科研单位。同时,希望与国内外相关学术机构、产业界开展广泛深入的合作,搭建医学影像分析学科的国际创新网络。

智慧城市大数据实验室

北京大数据研究院智慧城市大数据实验室,由科大讯飞股份有限公司独家资助北京大数据研究院建设,围绕智慧城市大数据领域,以智能交通、城市规划仿真决策、城市人群主体画像、环境监控、能源消耗优化等研究问题为目标,充分运用社交媒体、电信运营商、交通流量、气象信息、地理信息等,汇聚融合交通领域如出租车、专车、公交、地铁、共享单车,电信领域如运营商手机信令数据、金融领域如移动支付数据、刷卡购物数据等,重点开展“多源城市数据融合分析”、“城市级实时模拟仿真”、“基于人工智能的城市管理决策辅助”等前瞻性前沿核心技术的研究与突破,研发“全时空高维交通出行感知系统”、“城市就业与居住仿真决策支持系统”、“交通出行与城市规划仿真决策支持系统”、“交通控制与分流预案决策系统”、“城市居民标签画像系统”等示范应用系统,探索相关技术成果的产业化机会,将智慧城市大数据实验室建成国内外具有影响力的智慧城市大数据前瞻研究和成果转化基地。

金融大数据应用联合实验室

  金融大数据应用联合实验室由北京大数据研究院与北京先进数通信息技术股份公司共建,围绕银行精准营销、风险控制、决策支持、智能运维等领域,运用大数据、人工智能以及世界先进的科学技术,以市场为导向确立研究课题,形成适应金融行业应用的产品及解决方案。同时依托大学优势,在课题研究的进程中,培养为金融行业系统建设的专业人才。

阿斯利康健康医疗大数据实验室

  为推动健康医疗大数据行业的产学研用协调发展,在北京大数据研究院与阿斯利康共同努力下,共建“北京大数据研究院-阿斯利康健康医疗大数据实验室”。本实验室宗旨利用医疗大数据及大数据分析为患者、医生、政府提供科学证据的创新模式,共同探索研究机构与企业双方合作。

税银大数据联合实验室

税银大数据联合实验室由北京大数据研究院与深圳微众税银信息服务有限公司联合成立,双方结合各自资源开展合作建模,推动普惠金融发展。双方联合开发了基于纳税数据的小微企业信用风险模型以及基于纳税数据的企业贷后预警模型。同时,在基于企业税务数据分析行业发展景气指数,供应链金融数据应用以及大数据技术在税务风险稽查领域运用方面开展研究合作。

海洋环境大数据实验室

海洋环境大数据实验室由北京大数据研究院、山东深海海洋科技有限公司、中环国投环境信息工程研究院联合成立。实验室主要围绕海水浴场、海洋保护区、入海污染源、工厂化养殖、海洋重点功能区、海洋石油工程、海洋牧场、垂钓基地等方向,开展大数据采集、挖掘、分析等方面的技术研究与产业应用,并进行相关成果的产业转化。

智能交互实验室

  智能交互实验室秉承“以人为本”的创新理念,面向主流大众用户, 重点开展基于多通道的自然人机交互理论与应用研究, 推动从人适应机器向机器适应人的技术跨越。主要研究方向包括: 连续情感表示与识别、多通道交互、实时智能交互、探索式可视化分析以及物联网应用。

  实验室坚持理论与实践结合,创新与继承并重,应用需求驱动,在开展智能人机交互创新性基础理论与技术研究和开发,实现科研成果的应用与推广的同时,注重合作研究与交流,广泛开展国内国际合作,与国内外多家研究机构建立了长期的合作交流关系,多次应邀到美国、英国和日本等地进行学术报告和交流。

  实验室现有中、高级研究人员16人,其中博士学位以上人员占60%以上,在国内外主流会议(ACM SIGGRAPH, ACM SIGCHI,IEEE RTSS等)和期刊(IEEE transaction on Multimedia, ACM Transaction on Graphics等)上发表高水平学术论文100余篇,对推动人机交互的创新研究与发展产生了重要影响。

医养大数据实验室

医养大数据实验室于2017年4月17日在北京大学揭牌成立,由北京大数据研究院、中国老年学和老年医学学会、轩慧科技股份有限公司等联合成立,研发养老大数据与智能化服务技术,促进智慧居家养老服务平台建设。实验室重点打造数字三河与智慧医养平台试点,通过大数据赋能中小企业转型,实现资产数字化、数字资产化。实验室由傅毅明博士负责。

体育大数据与区块链实验室

体育大数据与区块链实验室是北京大数据研究院、中视亮中、信达融创共同建立,其尊旨是推动大数据与区块链等信息技术与体育产业的深度结合,利用大数据与区块链技术促进体育事业转型升级,更好地为社会民众及体育界人士提供服务。

“体育大数据与区块链实验室”将围绕体育领域相关的赛事、训练、培训、产业、媒体传播及大健康等整个产业链,采集、存储、清洗、整理、挖掘、分析其中有价值的数据,为体育行业及大健康产业赋能、增效、提速,引导和促进体育消费,打造体育行业和大数据学术部门横向研究和交流平台。

金融大数据研究中心

  目前金融行业在业务开展过程中积累了包括客户身份信息、资金流水信息、金融履约信息等大量高价值密度的 数据,在运用专业技术挖掘和分析之后,将产生巨大的商业价值。为了更好地促进金融大数据的研究和利用工作,北京大数据研究院设立了金融大数据研究中心。

  金融大数据研究中心围绕信贷数据、证券市场数据和保险数据三大金融数据类别,设立大数据征信研究室、互联网金融研究室、证券市场大数据监管研究室、量化投资实验室和互联网保险研究室。对中国金融领域数据开展全面研究。

时空大数据协同创新中心

  为推动时空大数据的新理论、新技术前瞻性研究和产业化发展,2016年北京大学和北京旋极信息技术股份有限公司联合成立了“北京大学时空大数据协同创新中心”,第一期启动经费1亿元人民币。中心现有教授、副教授、高工等研究人员30余人,成立了以鄂维南院士、陈江涛董事长为理事长的理事会,程承旗教授任主任。由20多位院士和国内外优秀学者组成学术委员会,并聘请了以李德仁院士为学术委员会主任,对科学研究进行指导。

健康医疗大数据研究中心

  在国家大力推动健康医疗大数据研究与应用的大形势下、历经北京大学及北京大学医学部相关领导的长期酝酿、由北京大学医学部和北京大数据研究院共同筹备建立北京大学健康医疗大数据研究中心。北京大学健康医疗大数据研究中心的宗旨是集成多源健康医疗大数据、采用国际前沿的数据处理和分析技术,为国家健康医疗战略、医学实践和全人群健康管理提供大数据驱动的决策支持,同时培养行业领军人才,促进产业转化,打造国际一流、国内领先、产学研一体的健康医疗大数据平台。北京大学健康医疗大数据研究中心由李全政担任中心主任,张路霞担任常务副主任,王海波、胡永华、周晓华、谢冰和詹思延担任副主任;另设指导委员会、顾问委员会和专家委员会。

交通大数据研究中心

  交通大数据研究中心是北京大数据研究院先期启动建设的实体化运营分支机构,交通研究中心立足于北京交通信息资源和人才,辐射全国,试点示范建立交通大数据协同研究、转化、产业三线并行的管理机制。依托北京大数据研究院成立的股份制的技术成果转化中心和纯市场化的大数据创业企业孵化机制和载体,培育服务北京交通大数据领域的技术创新型企业。面向交通运输产业和市场需求,立足大数据科技成果转化,推动中国智能交通科学研究、技术攻关和产品应用,促进智能交通产业科学和健康发展,努力成为国内领先、国际一流的集协同研究、成果转化、产业发展三线于一身的专业化组织。

能源与环境大数据研究中心

能源与环境大数据研究中心,专家团队由北京大学教授、北京大数据研究院学术委员会主任张平文院士领衔,并整合了来自北京大学、清华大学、中国人民大学、南京大学等高校的教授、博士后、研究生资源以及专业的项目管理团队。中心将面向国家能源与环境领域的重大需求与关键科学问题展开研究,包括能源与环境大数据处理与应用、混合建模与预测、大数据分析和数值预报算法研究、能源环境政策分析等,并依托研究院在大数据人才培养、科研创新和产业化的优势,打造政产学研用一体化的专业平台,为生态文明建设提供高质量的智库服务。目前已在空气质量预报与雾霾治理模型、风电功率预测模型、赤潮预报模型、近海养殖区水文水质预测模型的研究上取得了重大进展。

详见链接:http://www.bibdr-env.org/

中医大数据研究中心

  北京大数据研究院中医大数据中心,是国内首个整合了政府、大学和市场三方面资源的中医大数据中心。中心集合北京大学、政府、各中医药大学、各大型中医院、行业企业等的优质资源,借助北京大学在人才、技术、教学等上的优势地位,聚集国际一流的专家顾问团队,将与国内外同行一道,开展中医大数据人才教学与培训,培养中医大数据行业领军人才,打造国际一流的中医大数据平台,并与企业共同开展中医大数据分析和成果转化,引领中医大数据产业发展,并通过大数据促进中医行业发展。

  中心着力研发大数据采集与处理、数据挖掘分析、人工智能等中医大数据关键核心技术,建立国内领先的第三方中医大数据库和应用平台,基于大数据面向全社会提供中医智能引擎,中西药的临床全流程数据服务,以及为中西药研究者提供一站式研究型服务工作。中心下设中医人工智能平台、中西药临床服务平台、中西药临床科研一体化大数据库及分析平台。

  中医人工智能平台将基于中医大数据聚焦中医病历的自然语义处理、中医智能辨证论治、中医四诊智能诊断、中医名家经验挖掘等方面,搭建核心人才队伍,研发核心引擎,并与行业企业一道实现成果产业化;中西药临床服务平台提供医药产品各期临床试验技术外包服务,包括中药、化药、生物制品、保健食品、医疗器械、诊断试剂的新产品临床试验及上市后再评价临床研究、人体药代动力学及生物等效(仿制药一致性评价)等相关的技术外包服务。中西药临床科研一体化大数据库及分析平台主要负责中西药数据库的建立和维护,提供临床科研一体化服务,同时负责系统性收集、整理、质控、构建和整合中药RCT、上市后再评价、安全性数据库、科研项目的各来源数据及分析工作。


保险大数据研究中心

  保险大数据研究中心基于保险行业,跨界整合航空、旅游、银行、健康医疗等行业相关的大数据、采用国际前沿的数据处理和分析技术,为国家保险创新战略、传统保险行业转型和保险客户终生价值管理提供大数据驱动的决策支持。同时,培养行业领军人才,加强学科建设,促进产业转化,打造国际一流、国内领先、产学研一体的保险大数据平台。保险大数据研究中心将设立专家委员会和顾问委员会。工作团队组织架构将由一位主任和数位副主任构成。

  成立初期,保险大数据研究中心将设以下研究部门:

  保险新技术应用研究室:将致力于将新兴科学技术例如区块链技术、人工智能技术、深度学习技术等应用于保险行业的创新研究。

  保险商业模式创新研究室:将致力于传统保险行业的转型与商业模式创新。包括营销模式创新、服务模式创新、渠道创新、产品创新等。  

  保险精算研究室:将基于保险大数据的基础,开展产品开发和评估精算技术的应用研究。包括车险价格系统的动态调整技术、基于不同数据源的死亡率模型等。

  机动车辆保险研究室:将基于机动车辆大数据在保险产品设计以及定价模型创新等方面进行深入研究。

  健康医疗保险大数据研究室:将基于健康医疗大数据、利用人工智能技术,结合对于健康医疗领域的深刻认知,就健康医疗领域保险的新型产品设计、风险控制、健康和疾病管理和相关产品推广等方向开展研究和应用探索。

大数据分析技术创新中心

大数据分析技术创新中心是大数据分析与应用技术国家工程实验室和北京大数据研究院产业化合作与服务的重要载体与平台,面向企业与政府机构提供咨询与创新资源服务。典型项目如海淀区大数据发展规划、方正信产集团大数据平台规划等。中心理事单位有旋极伏羲大数据、河北沃享科技等。中心由傅毅明博士负责。

京津冀大数据协同创新中心

京津冀大数据协同创新中心,于2016年12月12日在中关村大数据日上宣告成立,为京津冀大数据综合试验区建设提供智库与创新平台支撑,由北京大数据研究院发起,联合三地高校、联盟、行业协会、投资基金、企业代表等参与共建共享。中心组织编制发布京津冀大数据产业地图,监测服务上千家大数据企业。

数据资源开发与应用研究中心

数据资源开发与应用研究中心由北京大数据研究院与北京数据堂科技股份有限公司联合成立,双方在数据资源尤其是非结构化数据上进行深度合作,目标是建设成世界领先水平的非结构化数据数据库,打造国内非结构化数据处理、分析和挖掘的学术高地和价值孵化母体,探索非结构化数据在政府管理、民生建设、智能交通、金融保险、互联网等领域的应用实践。

农业大数据研究中心

  农业大数据研究中心,重点对农产品生产、加工、仓储、物流、交易、结算等全产业链数据与商业模式进行深度研究,通过创新的新型农产品流通模式应用推进农业经济的优化和智慧农业的建设进程,为各级政府实现可持续的产业发展和区域产业结构优化提供决策依据和实施样板。