《大数据知识论研究》,苏玉娟著,科学出版社2021年8月第一版,128.00元
近年来,特别是新冠疫情爆发以来,一个词汇在高频度地、广泛地使用和流行,这就是“大数据”。在应对疫情方面,它不仅成为政府决策的重要依据,更切实地进入普通人的日常生活,成为大家经常谈论的话题。但诚如俗语所言,“百姓日用而不知”“熟知并非真知”,对于“大数据”,实际上很多人是不甚了解的,更缺少上升到理论层次的透彻分析。新近出版的《大数据知识论研究》是部严谨而专深的学术专著,不仅梳理“大数据知识”基础条件、发展脉络和当代发展状况,而且通过多维视角和多种方法廓清了迷雾、理出了清晰的线索,更在此基础上从“知识论”范式出发对“大数据知识”的一系列问题进行了详细的分析,并对大数据知识对人类未来的影响进行了预测。
一、“大数据”时代及其特征
究竟什么是大数据(big da⁃ta)? 学界对此并没有确切的定义。传统和通常的理解以为数据大就是大数据,但作者指出,“大数据不仅数据量多,而且结构复杂,处理速度快,价值密度低”。为此,该书详细地考证了这一概念在国内外文献中出现的情况。1998年,美国《科学》杂志刊登了一篇介绍计算机软件HiQ的文章《大数据的处理程序》(A Handler for Big Data),第一次使用了大数据(big data)一词。2008年9月4日,英国《自然》杂志推出了“big data”专刊,从互联网经济、超级计算、生物医药等多方面探讨了大数据方法带来的变革、挑战以及未来的发展方向。这之后大数据逐渐成为学术界、产业界和政府各界甚至民众的热门概念。美国、法国、德国等国家开始重视大数据并实施大数据发展战略。我国也积极迎应大数据时代的到来。党的十九大报告指出:“推进国家治理体系和治理能力现代化,秉持共商共建共享的全球治理观,推动互联网、大数据、人工智能和实体经济深度融合。”习近平总书记在中央政治局第二次集体学习时进一步强调“用好大数据 布局新时代”。2015年,国务院出台《促进大数据发展行动纲要》,强调指出,促进我国大数据发展,加快建设数据强国。
目前大数据已经被广泛应用于政府治理、社会治理和企业治理中。大数据是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的数据资产,具有体量大(Vol⁃ume)、速度快(Velocity)、种类多样(Variety)、真实性(Veracity)、价值密度低(Value)、可变性(Variability)和复杂性(Complexity)等特征。从来源看,大数据主要来自科学仪器、传感器、互联网、社交网络平台等,呈现为结构性大数据和非结构性大数据。大数据技术通过对大数据存储、分析、挖掘和可视化等,将大数据中包含的知识表征出来。
作者以上的梳理和概括准确而清晰地描摹了“大数据时代”的状况和特点,这是大数据知识产生和发展的重要基础。
二、思考“大数据”的多维视角
作者特别注意到,大数据知识作为当代知识发展的重要形态,其发展受当代哲学和大数据技术的直接作用。为此本书始终围绕“大数据知识论”这一范畴来展开论述,指出这是当代知识论新的研究领域,正越来越受到学界的关注。
知识论属于哲学的分支,哲学作为研究自然、社会和思维规律性、普遍性的知识和方法,追求事物发展的普遍规律。按照传统知识论关于知识的形而上层面和形而下层面的二分法,大数据知识论就应该研究关于大数据知识的本体论、认识论层面,对于大数据知识的实践应用就应该是管理学、情报学等学科关注的领域。目前,哲学、管理学、图书情报学等都在研究大数据知识,只是不同学科侧重点不同。从哲学层面看,对大数据知识本体论、认识论进行研究,是必要的。
对于大数据知识的实践问题,哲学层面是否需要研究? 显然是需要研究的,原因在于大数据知识的实践问题与本体论、认识论和方法论等紧密联系在一起,大数据知识的实践问题与其他方面存在必然联系。原因在于:人为分割大数据知识发现与实践不符合客观现实。大数据知识本身来源于实践需要,大数据知识发展过程是大数据知识发现与实践的统一体,如果我们认为对大数据知识本体论、认识论的研究属于哲学层面,而实践研究不属于哲学层面,这样,人为地将大数据知识研究分割开来,不符合大数据知识发展的客观现实。因此,作者认为,我们需要从本体论、认识论、确证论、真理论、方法论、实践论等方面系统研究大数据知识共性基础上的哲学问题。这种分析视野开阔,见地中肯。
三、“大数据”知识论的元问题
该书在清理以往研究的基础上,博采众家之长,试图从知识论视角研究大数据知识的本体论、认识论、实践论、方法论和实践论等。
作者指出,科学技术是知识论不断超越的重要因素,大数据技术成为当代知识论超越的重要因素,大数据知识论也就成为当代知识论研究的重要领域。从这一理解出发,全书渐次就大数据知识的特质、结构、确证、目标、方式和应用等问题一一展开详细的讨论。
作者的主要看法是:其一,大数据时代,通过对大数据的存储、分析、挖掘等可以发现隐含在大数据中的知识。大数据知识是大数据被证实为真并具有善和效的命题或信念,大数据知识是真、善、效的统一。其二,大数据知识是在历史、技术、伦理、认知、语言、实践和社会等语境相互关联中实现的,不同语境的内在关联构成大数据知识的实现结构。其三,我们应赋予历史、伦理、技术、认知、语言、实践等语境不同的权重,加权后形成确证的总阈值,阈值越大,大数据知识确证的程度越高;阈值越小,大数据知识确证的程度越低。其四,大数据知识作为对经验世界和网络世界运行规律的客观反映,发现真理是大数据知识的重要目标。通过提高大数据知识的确证程度,可以更接近真理。其五,大数据知识的实现方法包括大数据知识的发现方法、确证方法和实践方法,具体包括大数据归纳方法、基于关联的因果分析方法、递归分析方法、语境分析方法。其六,大数据知识被广泛应用于政府治理、社会治理和企业治理中,大数据知识的真与效在实践中得到彰显。大数据知识对数据治理变革具有引领功能,大数据知识在政府治理、社会治理和企业治理中正在引领一场数据治理变革。
通过对以上问题的清理,该书初步勾勒了“大数据知识论”的框架体系。
四、大数据知识对人类未来的影响
作者是理学博士,从专业出发将大数据与科技革命联系起来看待其未来命运。每一次科技革命都为人类开启一个新时代。农业科技革命引领人类进入农耕时代,蒸汽机革命引领人类进入机械化时代,电力革命引领人类进入电器时代,计算机革命引领人类进入信息时代,大数据技术革命将引领人类进入智能时代,在此过程中逐步使人类从繁重的体力劳动和脑力劳动中解放出来,有更多的时间实现自我价值,人类对客观世界的认识越来越明朗,越来越走向自由王国。
据此,作者就大数据知识对人类的影响作出如下预测:
首先,促进人类进入智能时代。自20世纪60年代以来,人类渴望人工智能技术的出现,当时的人工智能最多是低级的机器人,它主要模仿人的动作并进行重复性劳动。大数据时代,机器可以根据大数据知识采取行动,可以模仿人的智力,可以与人进行情感沟通,帮助人解决情感问题,或者实现智能化的家务劳动,等等。
其次,进一步解放人类脑力劳动。正是由于大数据技术革命,人类大大扩展了对客观世界的认知和改造,大数据技术的智能化计算大大解放了人类的脑力劳动,这是人类发展史上的重要解放。“大数据的发展应以人为中心,维护人的权利和尊严,促进人的全面发展,满足人们对美好生活的向往,而不是走向相反的方向”。
再次,依托大数据服务于人类需要。人类发明大数据技术就是要实现对日益增长的大数据进行治理,为人类提供更智能、更精准的服务。大数据毕竟是人类社会建构的结果,虽然来源于客观世界,大数据毕竟不等同于事实本身,所以,对于基于大数据产生的知识我们需要结合客观世界及其产生的小数据综合提炼形成大数据知识,而不能盲目相信大数据。
最后,引领人类走向自由王国。大数据技术大大提高了人类对客观世界的认知能力,人类对客观世界认识越多,其对客观世界的可控制能力越强,人类自身的自由度就越大。利用大数据技术,人类不仅可以认识经验的宏观世界,还可以认识渺观世界和宇观世界。所以,正是由于大数据技术的应用,人类的自由度越来越大。
总之,我阅读此书的感受是,它不仅仅是系统理清“大数据知识”体系的读本,更是上升到哲学层面的理论透视,是一项值得关注的研究成果。(作者系北京大学哲学系教授、北京大学马克思主义文献研究中心主任、中国马克思主义哲学史学会副会长兼秘书长)