序
数据是自然和生命的一种表现形式,且由来已久,从结绳计数开始,数据就客观地记录了人类的成长和社会的发展,包括日常生活、生产创造和国家历史。
数据一般由数字组成,数字本身只是一种符号,人类最早可能是通过掰弄手指来计数的,但是加上脚指头也只能表示20以内的数字,所以当数字很大时,人们开始结绳计数、勒石记事(刻在石头上)。中国古代是用木、竹或骨头制成的小棍来计数的,称为算筹。古印度人发明了现在最通用的阿拉伯数字。这些计数方法和计数符号慢慢转变成最早的数字符号。这些符号所代表的数值,就是数据。《现代汉语词典》将数据解释为“进行各种统计、计算、科学研究或技术设计等所依据的数值”。数据具有客观性,是事物本身的一种属性描述;数据具有公正性,会呈现真实、展现规律、预见未来。从数据出发的量化思维,用数据衡量和比较,可以直达事物的本质。
信息化时代,人们更是将现实世界中的事物和现象以数据的形式存储到信息空间中,极大提升了数据生产的速度。据测算,到2025年,全球数据总量将达到175.8ZB,我们称为数据爆炸。数字经济时代,更是要充分发挥海量数据的优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业、新业态、新模式。对今天的读者来说,加深对数据的理解和培养数据思维变得尤为重要。
理工科出身的人,似乎对数据更加敏感,喜欢看到数据所透露出的真实世界。笔者一直对数据充满敏感与好奇心,加之长期从事数据科学领域的教学科研工作,逐渐形成了对数据内涵与应用的个人理解。同时,出于对历史、天文、军事的兴趣爱好,也刻意观察隐藏在事件背后的数据,这些促成了写作本书的初衷,也形成了本书穿越数据的前世今生,从量化看世界到数据元宇宙的叙事架构。
笔者在本书撰写中,参考了诸多来自文献的有趣见解,但仍难免有所遗漏。在此,向所有对本书提供过帮助的诸位专家学者和未曾谋面的同行,一并致谢。同时,也感谢机械工业出版社为本书的出版给予的大力支持,并对郑志宁编辑在本书选题、策划和出版过程中所付出的耐心和辛勤的工作,表示真挚的谢意。
刘士军
2022年9月