北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH

吃惊吗?原来这才是大数据的大问题!

作者:中国大数据来源:中国大数据

许多公司已经在积极使用大数据,只是它们没有称之为大数据罢了。虽然“大数据”一词有诸多争议,可是这项技术还是变得对公司业务来说必不可少。

据Dresner咨询服务公司的一项新调查显示,结果发现,没有人知道大数据到底是啥东西;大概同样数量的公司实际上在用大数据处理有意义的任务。


是不是觉得很吃惊?

你应该不会吃惊。毕竟,尽管多年前就有人预言大数据,可是大多数公司仍在努力将小数据充分利用起来。

这倒不是说大数据并不是很重要,也不是说如今许多公司没有从数据中获得重大价值。大数据很重要,许多公司也在从数据切实获得好处。但是,想从大数据获得价值,许多公司首先要变得务实。


谁需要大数据?

正如Datamation杂志的詹姆斯·马奎尔(James Maguire)所写,Dresner咨询服务公司并没有看到大数据大范围采用的现象。

只有17%的公司承认如今在使用大数据,另有47%推迟到未来使用,但何时使用还不确定。如此看来,难怪报告的作者得出结论:“尽管经过了长期的造声势和炒作,可是眼下,大数据分析技术的实际部署还是无法广泛适用于大多数企业组织。”

大数据,啥也不是?

答案是否定的。毕竟,报告的调查对象中59%又声称,大数据“至关重要”,尽管明显没有用大数据来处理任何任务。显然这里有某个因素在作祟……

我认为,这“某个因素”完全是确定性的。

你不断使用那个词……

早在2012年,NewVantage Partners就颠覆了公众对于大数据中的“大”的实际含义的认识。尽管媒体大肆报道PB级数据问题,幕后推手基本上是Hadoop及其生态系统的厂商,但事实上,大多数公司并不存在所谓的PB级数据问题。

正如这项调查所发现的那样,大多数公司面临的主要问题还是数据的种类和速度。

市场终于开始心领神会,将越来越多的资金投入到可以更轻松地管理不同类型数据的技术(比如MongoDB等NoSQL数据库和DataStax版本的Cassandra),以及处理流数据的技术(比如Apache Spark)。

与此同时,企业继续求助于更传统的数据基础设施,比如甲骨文数据基础设施。正如DB-Engines在2015年年底盘点中发现的那样,就总的人气而言,甲骨文是去年提升幅度最大的厂商(从发布岗位、技术论坛提及率和谷歌搜索等方面来衡量)。

超过风头甚劲的NoSQL,超过云优先的亚马逊,超过其他任何厂商或技术。

当然,甲骨文的这种人气抬升一方面与大数据毫无关系,而是缘于管理整齐的行列数据。但是从NewVantage Partners的调查数据来看,这种比较“小”的数据仍是大多数大数据分析技术的处理对象。

另外抛开这种结构化数据,我怀疑许多公司仍没有认为多种多样、高速度的数据是“大数据”。这可能是很少有公司声称在用大数据处理许多任务的一个原因。正如MySQL数据库工程师贾斯汀·斯旺哈特(Justin Swanhart)所说:“大数据毫无意义。你还不如问别人他们想要什么颜色的数据库。”

简而言之,大数据活蹦乱跳,但是许多公司未必认为它是“大数据”。

那又如何?

对于正在想自己是不是被大数据甩在后头的企业来说,现在别再瞎担心了。正如Gartner的分析师尼克·霍德克(Nick Heudecker)所说,“大数据”已迁移到更熟悉的类别:

先进分析和数据科学

商业智能和分析

企业信息管理

内存中计算技术

信息基础设施

大多数企业已经在搞充分利用大数据的项目,它们只是根本没有称之为大数据。即使如此,还是有大量工作要做。正如麻省理工学院斯隆学院数字商业中心的研究员迈克尔·施拉格(Michael Schrage)所说:

“预测分析最深远的影响不是来自从数量上改进预测的质量,而是来自从根本上改变企业组织考虑问题和机会的角度。”

换句话说,许多公司可能已经拥有将大数据充分利用起来的必要技术。它们缺少的是,渴望从根本上改变将那些数据充分利用起来的方式。有一群分析员解读数据是一回事,利用那些分析结果、促动公司业务的实时变化是另一回事。

这不是你从某家厂商所能买到的那种东西。它一定需要在企业的DNA内部发生变化。既要更准确地了解大数据,又要用大数据切实处理一些任务,企业确实面临艰巨的任务。


原文标题:Big data's big problem?Most companies don't realize they're already using it

转载自:中国大数据