01 远古时代的数据
「数据」本身是存在的,就像空气,只有出现雾霾使它显式地呈现在我们脑海里。在百万年前,推及上亿年前,在人类没有出现在这个蓝色星球之时,数据这个事物一直在那里,它等待着的是人类那灵光乍现的智慧赋予它正真的含义。
在没有计算这个高端的家伙之前,人们为了让「数据」更加具象,便于统计,进行了至今数万的探索。在身边坚硬的物体如石器、骨片以及树干为载体,刻下纹理来代表对现实事物的表达,似乎成为了一个理所当然的开始。
1960年在非洲乌干达与扎伊尔交界处的伊尚戈渔村发掘的一根记数刻骨“Ishango Bone”(伊尚戈骨头),这是距今一万前伊尚戈人新石器时代早期的作品,是最早的刻符记数实物。远古部落人民使用这些凹痕记录日常的交易活动、物资储备和大事小情,并用他们来进行基本的算术计算。
伊尚戈骨头
02 现代化的数据
在今日计算机普及的社会里,数据更是显得非常有存在感,身处于大数据时代的我们已然意识到数据的重要性。那么什么是数据呢?看起来简单的问题,往往是最复杂的。
当下对数据更普遍的定义往往是从计算机原住民的视角。我们对客观事物进行观察、度量、猜测,按照统一或者不统一的尺度标准将结果予以记录,这些记录或多或少,都是数据。这些数据期望是未经加工的,它们能非常良好地代表原始事物本来的面貌和形态。
国际数据管理协会(DAMA)也认为,数据是以文本、数字、图形、图像、声音和视频等格式对事实进行表现。也就是说,数据要表现事实,受限于数据的采集技术以及数据解读能力,这或许这是一种理想。
数据表征存在,存在是不以人的意志为转移,包括物质的和精神的。物质方面有大自然中的风、雨、雷、电、人和动物等实体,这些是有明确感知的,非常方便数据化。在精神方面,人的欢乐、哀怨等情绪可以被大量多次主观度量,最终也可以形成数据。
数据似乎往往应用于实体,实体是大多数据刻画的对象。在刻画实体时往往需要系统数据,单一的数据似乎不那么受欢迎。在拥有了大量的对一个实体的刻画数据后,经常会从量变发生质变。
集结数据成为「信息」,加工信息成为「知识」,运用知识产生「智慧」,数据成为低层的驱动者;它们之间环环相扣、循序渐进,构成了「DIKW 金字塔」。
数据-信息-知识转化模型
我们再来看看东方智慧。中文词语「数据」暂且不论其词源,容我们从字面窥探一二。
「数」有两层含义,一个是数据往往用数字来记录事实,如一个人的年龄,一座山的高度;另个一个层面是它用数学的方法来进行统计最终得到记录结果,如一群人的平均年龄和群峰的平均高度,都应用了数学中的平均数概念。
再看「据」,我将据理解为日常生活中的票据,票据是证明,证明发生过此事,是人类大脑缺点的补充,是对时间的凝固,因此「据」是事实。所谓数据就是事实的数字化凭据。
03 展望未来
正如开头所讲的一样,对于数字时代的我们,数据或许真的和空气一样,已经不需要我们再去思考其概念。
当我们每天生活有数字化加持的小区里,工作在繁华的智能办公商业区,享受着数字生活的便利时,这一切显得是那么自然,而这也正是物联网时代下新的数据生态。
物联网时代下的数据
更多的思考,是为了更好地出发。在对数据概念的理解上我们还需要继续探索,欢迎各位数据人在评论区留言,谈一谈你认为的数据是什么。