文 | 吴政兴
一、大数据定义及特点
1、大数据的定义:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
2、大数据的特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),即IBM提出的5V特点。
大数据被美国政府认为是“未来的新石油”,被视为等同于人力资源和物质资源的国家重要战略资源。著名的未来学家阿尔文·托夫勒在《第三次浪潮》中语言,社会经济的发展将由农业经济、工业经济进入信息经济和生物经济时代。
提到大数据,必然要提到云计算,大数据与云计算的关系就像一枚硬币的正反面一样密不可分,大数据依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。
大数据的基础是数据大,有海量数据可以进行挖掘,那么对于生物医药B2B尤其是制造业来说,对海量数据的挖掘会带来怎样的改变?那一定是按需进行点对点的精准匹配。
在互联网诞生之前,无论是企业还是个人,最痛苦的是手头掌握的信息太少、信息来源缺乏、信息处理时间缓慢;在商业决策、人才政策等各方面与产业链的互联缺乏数据及时支撑,信息不对称严重制约产业和企业自身发展。
互联网犹如一股春风,瞬间让我们进入了数据大爆炸的时代,短短十几年,数据已经达到无可想象,毫不夸张地说,我们的世界将在 2025 年被数据淹没,这丝毫不令人惊讶,2025年全球大数据量级将达到 163 ZB,比 2016 年创造出的数据量增加10倍,全球数据量产生的第一大主体将由消费者转移到企业,届时企业产生的数据量将占到全球数据总量的 60%。
注意!注重数据价值的时代已经来临,并逐渐取代了从模拟数据向数字化转变的时期;产生、使用和管理对生活产生重要影响的数据信息,对于消费者、政府和企业的正常生活和运转必不可少。消费者和企业将持续在不同设备和云之间产生、分享和访问数据,增长速度也将超出此前的预期。
你是否有这个困惑:当你想买一种设备、或者检索某种知识盲点,去百度搜索的时候,随便输入一个关键字,弹出来几十万上百万的结果,你会不会陷入选择困难?在这么多信息中,如何找到你最匹配的商品或服务?这真实大海捞针,比没数据时代更烦恼了。
二、大数据的来源
大数据时代,人人都是数据源,每时每刻都在产生数据。比如:早上起来刷个朋友圈、出门吃早饭用移动支付、打开导航开车出门避堵、使用App刷刷时政新闻等等。任何个人和企业的被记录行为,都被主动或被动记录在大数据这个池子里。当你走在路上没有使用任何看似与产生数据有关的行为,但是你的行为有可能被路面的摄像头、行车记录仪等实时记录,你就成了这里面大数据的一份子。
|