北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH

鄂维南院长于热带海洋学院的学术报告

【导读】

早在国家大数据战略发布之前三年,中科院院士、北京大学教授、普林斯顿大学教授、北京大数据研究院院长鄂维南院士到访海南热带海洋学院,在学术报告厅就做了以“数据科学与信息服务产业”为主题的学术报告。学院200余名师生聆听了报告。

鄂维南院士首先从Google和Net flix例子出发,主要介绍了两个企业的创新模式和创业模式,引入“数据科学和信息服务产业”这个主题,然后简单介绍了数据社会,鄂维南院士指出人类社会已经进入了数据时代,作为一种资源,数据已经被看作是人力和物质以外的第三大资源。作为一种产业,以数据为中心的服务产业已经成为发达国家经济转型的主要方向。作为一门科学,数据科学也为研究和创新提供了无穷的空间。数据科学的基础是数学和计算机科学。



2012年12月15日下午,中科院院士、北京大学教授、普林斯顿大学教授、北京大数据研究院院长鄂维南院士到海南热带海洋学院进行访问,在学术报告厅做了以“数据科学与信息服务产业”为主题的学术报告。

学术报告前,海南热带海洋学院党委韦勇书记、武耀廷校长会见了鄂维南院士,并就有关问题进行了深入的交流和探讨。

学术报告由过建春副校长主持,海南热带海洋学院理工学院200余名师生聆听了报告。

鄂维南院士首先从Google和Net flix例子出发,主要介绍了两个企业的创新模式和创业模式,引入“数据科学和信息服务产业”这个主题,然后简单介绍了数据社会,鄂维南院士指出人类社会已经进入了数据时代,作为一种资源,数据已经被看作是人力和物质以外的第三大资源。作为一种产业,以数据为中心的服务产业已经成为发达国家经济转型的主要方向。作为一门科学,数据科学也为研究和创新提供了无穷的空间。数据科学的基础是数学和计算机科学。


数据是资源

“Data is everywhere.当今,我们正处于一个信息时代,也是数据的时代。”鄂维南院士如是说。

对于何为数据,鄂维南院士提出了自己独到的见解——

数据不再简单的是传统的数字、符号,它的触角已经延伸到了我们生活中的方方面面。我们每天看到的信息都可以说是数据的一种形式,静态的数据形式包括文字、图形,色彩、符号等,动态的数据形式则有动画、声音、视频等,这些都是我们每天接触的数据。

数据影响我们的生活方式,每天都会通过上网了解信息;它还影响了我们的商业模式、决策模式等,它已经作为一种丰富的资源为人类所用,为我们的生活带来巨大的便宜。


数据是产业

鄂维南院士以Google的成功说明了数据可以成为一种产业。他说,Google在1998年成立,历经短短的6年时间就成为上市公司,市值达到200亿美元,这是商界罕见的奇迹。而它在2012年市值更是翻了10倍达到2200亿美元。而同样做搜索引擎的雅虎则没有那么幸运,同样,百度也是。相比之下,谷歌的创新之处在于在海量信息的筛选排序上。

鄂维南院士以搜索“琼州学院”为例,谷歌的搜索结果中则会排出合理的顺序,使重要信息得到凸显,用户得以方便快捷地找到自己想要的结果。

“众所周知,网民搜索查找资源是免费的,那么谷歌如何实现自己的盈利呢?这正好开启了计算广告学的大门。“广告已成为一种科学”,鄂维南说。传统的广告多是无用的,效率低下,而如果在网络上根据网民的爱好有针对性地打出广告,效果则是很明显的,这也正是谷歌盈利所在之处。


数据是科学

鄂维南院士指出,数据是科学,他从两方面加以说明。一是用科学方法研究数学,他以牛顿模式和开普勒模式以及SNP数据反映人类进化为例,说明了科学可以研究数学;二是用数学研究科学,传统的数学模型如线性规划、参数估计等在面对现代以“规模大、高维、复杂、噪音大”为特点的数据时有一定的局限性和困难性。因此他向大家介绍了三种数据结构即“函数逼近的观点”、“拓扑和几何的观点”和“代数的观点”来研究分析数据。

对于他自己所研究的领域“复杂网络的地貌”,最重要的就是研究两个或多个“圈子”之间的“鞍点”即连接点,鄂维南院士以《悲惨世界》里的人物关系网为例,给大家生动地展现了“鞍点”的内涵。在这个数据时代,它给数学带来了机遇,也带来了挑战。

鄂维南院士指出,信息服务产业的科学基础是数据科学。简单说来,它由两个部分组成:即用数据的方法来研究科学和用科学的方法来研究数据。

科学研究有两个最基本的模式:开普勒模式和牛顿模式。开普勒关于行星运动的三大定律完全是从前人所观察到的数据中所总结出来的。而牛顿则更进了一步,他寻求的是基本原理。他对行星运动规律的认识是建立在基本原理的基础之上的。牛顿不仅知其然,而且知其所以然。牛顿的认识无疑比开普勒要深刻得多。所以牛顿模式成了科学研究的首选模式。几百年来的科学研究都是沿着一条以寻求基本原理为目标,而从根本上认识世界,认识自然这样一条道路走过来的。

时至今日,科学家们在对基本原理的寻求方面取得了长足的进步。随着量子力学的建立,人们已经基本了解了在生命科学、化学、能源、环境等与日常生活息息相关的领域所需要的基本原理。现实的困难在于这些系统的复杂性——从基本原理出发去理解这些系统在目前和不太遥远的未来基本上都是一件不可能的事情。牛顿模式因此而面临着难以逾越的困难。而另一方面,由于人们获取数据和分析数据能力的提高,从数据中直接总结出客观规律的开普勒模式的优势就体现了出来。生物信息学的成功就是一个很好的例子,

鄂维南院士还以数据科学中最受瞩目的成就之一——小波理论为例,指出系统的小波理论出现之前,人们对在信号处理中引进局部基函数和对信号按尺度作分解都有过很多的尝试。但这些工作都是经验性的,缺乏系统性,小波理论从根本上解决了这一问题。它使这些尝试性的工作由经验变成了科学,这样的转变是本质性的。

报告中,鄂维南院士还解答了师生提出的有关云计算等方面知识的问题。

报告结束时,海南热带海洋学院过建春副校长指出,鄂维南院士深入浅出,通过案例呈现等方式,指出生活的每个领域都离不开数据,让人豁然开朗。过建春副校长表示,希望同学们能汲取鄂维南院士报告的精髓,加强学习,挖掘、积累经济社会发展中的各种“数据”,成就自己的未来,服务社会经济发展建设。

校党委韦勇书记表示,学校将充分利用区位优势,在冬季邀请到三亚度假的专家、学者、业界精英到我校讲学,将他们的学术思想、学术成果、学术方法、前沿的知识,先进教育教学理念、教学方法以及高尚的为人处世之道传授给师生,让师生直接与大家、大师对接,形成名师论道、名家谈治学、名人谈做人的“三名学堂”。