当前位置:首页 >>水极客 >>查看详情

大数据时代社会科学研究的范式变革与应对策略

2024-08-17 22:23:28 作者 : 围观 :43次

大数据时代,数字技术与人类社会高度融合,重塑全球经济结构,改变人类生产生活方式, 促使人类社会发生质的变迁,与此同时,人类活动痕迹正在以“数据”的形态被记录下来,形成 了海量的能够反映人类行为和社会规律的多源异构数据 [1]。然而,这些规模庞大、模态多样的数 据已超出传统社会科学研究方法的处理范畴,需要借助大数据、人工智能等新一代数字技术进行 处理,这引发了社会科学研究范式变革,推动社会科学研究进入新的发展阶段。

一、大数据时代人类社会呈现的新特征

随着数字技术不断发展和广泛应用,人们的生活方式和工作模式、社会结构和形态、人类行为方式与社会运行状态都在发生深刻变革,人类社会发展呈现出全域数字化、结构复杂化、万物智能化等新特征。

(一)数字化

数字技术渗透到人们生活、工作、学习、娱乐等 各个方面,贯穿于生产生活的全过程,人类社会数字化 程度和速度已达到一个前所未有的水平。从数字技术应 用规模来看,人类社会已进入数字化阶段。大数据、人 工智能、互联网等数字技术凭借强大的信息处理和传递 能力,嵌入到几乎所有人类的活动及与其相关的场景[2], 这使得人们的日常生产生活更加便捷和高效,支撑着人 类社会发展。换言之,数字技术成为支撑着现代经济社 会发展的基石。人们通过数字设备和软件平台与外界交 流互动,参与经济社会活动。例如,移动支付在我国得 到了广泛普及、在线购物成为人们日常消费习惯、办公 软件和数字设备变为人们工作的必备工具、手机和社交 网络成为人类社会沟通的桥梁等等,可以说,数字技术 对人类社会带来的影响是深刻的、全面的。从应用趋势 来看,数字技术对人类社会的影响不断扩大。随着数字 技术不断发展,新的数字技术和产品层出不穷,应用领 域和应用场景不断拓展,数字技术对人类社会的影响持 续加深。例如,软件的升级迭代、传统产业的数字化等。

(二)复杂化

社会结构是指影响个体行为的外部整体环境 [3], 而数字技术使人类社会结构更加复杂。一是人类社会虚 实相互交织。数字技术为人类社会活动构建了数字化桥 梁,改变了人与人之间连接和交流的方式 [4],破除了 物理空间限制,使得人类活动虚实交织在一起,推动人 类社会系统演变成由人类社会空间、信息系统和客观物 理环境耦合在一起的复杂系统,形成了自然、人类和人 造系统交织的社会形态 [5],延伸了社会连接的边界, 使得人类社会结构更为复杂。二是数字技术增加人类行 为的影响因素。基于数字技术的思维模式、信息获取方 式、处理办法等,数字技术成为影响人类决策和行为的 重要因素,也就是说,在分析和解释事务时,不仅要考 虑经济、政策等这些传统影响因素,也要考虑来自互联 网、社交网络等数字技术影响因素。三是数据技术促进 跨文化交流。人们可以通过互联网和社交媒体平台与世界各地的人进行跨文化交流和互动,推动不同文化迅速 地在全球范围内传播和共享,这使得不同文化之间相互 影响、相互借鉴的趋势更加突出,进而使社会结构更加 多元化和复杂化。

(三)智能化

大数据驱动的人工智能能够高效准确处理信息、 给出解决方案,目前已被广泛用于在线客服、工业制造、 社会治理等多个领域,由此出现了智能制造、智慧农 业、智慧交通、智慧医疗、智能家居、智慧教育等新业 态,特别是以美国 OpenAI 公司开发的大型语言模型系 统 ChatGPT 为代表的生成式人工智能产品的陆续推出, 正在加速推进人类社会迈向智能化。这体现在以下几个 方面。一是智能机器人融入人类社会。智能机器人通过 高维机器学习与深度学习训练,模拟人类智能行为,实 现了系统的自我学习和决策能力,具有一定的主观能动 性,能够模拟人类思维和劳动技能。二是人工智能算法 重构人类社会关系网络。满足用户个性化需求的人工智 能算法决定数字信息的传播路径,参与分配真实社会中 的机会与权利 [6]。例如,人们在线网购、社交关系建 立等都由人工智能算法推荐,这样算法就影响了个人决 策和选择行为,从而影响人类社会关系网络构建。三是 人机物三元融合。以智能物联网为连接核心的人机物三 元融合,其本质是社会空间、信息空间和物理空间的有 机融合,人机物融合是人类社会发展的必然趋势,将会 推动新一代群智感知计算的兴起。

二、大数据驱动社会科学研究范式变革

“范式”的概念最早由托马斯·S.库恩(Thomas S. Kuhn)提出,“范式”被描述为“某些科学实践的公认 范例,为特定的连贯的科学研究的传统提供模型”,是 指某一领域的研究者接受并遵循的基本规范和方式[7]。 换言之 , 我们可以将“范式”理解为在某一个历史阶段 和某一领域大多数研究人员研究和解释某领域的模式、 标准、规范等 [8]。而大数据能够从海量数据中挖掘数 据关系,发现内部规律和新的知识,从研究材料、研究 视角、研究维度、研究路径、研究方法等方面推动社会科学研究范式变革。

(一)由“小样本”升级到“全样本”

传统社会科学研究主要依赖于问卷调查、访谈、 观察等方式收集研究材料,受限于数据采集、信息传递 以及非结构化数据处理的技术性因素,无论是抽样量, 还是数据量,都属于小样本,往往难以对社会现象的全 貌进行系统性分析和描述;而利用大数据等新一代数字 技术,研究者就能够对研究对象的组成、结构、影响因 素等进行综合分析,最大范围内收集来自社交媒体、网 络、传感器、管理系统等平台的数据,使线上数据与线 下数据融合、内部数据与外部数据融合、传感数据与社 会数据融合、历史数据与实时数据融合,尽可能让研究 对象的“样本=总体”,进而对社会现象进行全方位的 研究,揭示社会现象的本质和规律,推动社会科学研究 从“小样本”验证逻辑到“全样本”发现逻辑的转型 [9]。 这样一来,大数据不仅解决了因随机采样造成的样本选 择偏差、因数据缺失和数据非结构化导致的变量遗漏问 题,减少了人为因素,还扩展了数据来源和数据量,提 高了社会科学研究的科学性和客观性 [10]。

(二)由“宏微分离”变换到“宏微结合”

传统社会科学研究方法早期注重从宏观视角研究 制度、文化、人口等因素的相互作用及其对社会变迁 的影响机理,后来从微观角度解释社会现象的具体机 制和过程的研究方法逐渐兴起,但是长期以来,宏观 和微观之间的“裂痕”没有就此弥合。而大数据能够 从微观与宏观相结合的视角帮助人们全面地观察人类 行为与社会现象,自由地汇聚和分解这些现象。一方面, 大数据运用计算机仿真、模拟实验等技术对微观能动 者进行分析,自下而上地推演社会宏观规则 [11],即透 过微观行为了解宏观现象。例如,大数据通过分析社 交网络中的个体互动和关联,来研究社会结构、社会 动态和社会变迁等问题。另一方面,大数据也可以在 研究宏观的群体行为基础时切换到对某一个体行为的 分析,自上而下地分析群体行为对个人决策的影响。 例如,利用大数据研究某中学关于上学交通工具的群 体行为与个体选择等。

(三)由“单一学科”转变为“多科融合”

以往的社会科学研究主要依靠研究者的学科知识 背景,而由于研究者精力有限,一般来说只擅长某一领 域,往往造成研究领域的分立和割裂。与此形成鲜明对 比的是,大数据不仅为社会科学交叉研究提供了涵盖多 个领域的数据资源,也提供了技术支持,助力淡化甚至 消除学科边界 , 具体表现在以下几个方面。一是大数据 促进跨学科的理论创新。大数据通过分析比较各学科方 法和理论优势,挖掘不同学科不同理论的契合点和创新 点,推动社会科学领域跨学科理论创新和发展。二是大 数据促进多学科知识融合。大数据能根据研究对象涉及 的学科,有针对性地构建多学科知识图谱,将局部性的 专业性社会认知和建构升级为全域的社会整体系统认知 和建构 [12],多角度全方位阐述社会现象或者提供解决 方案。三是大数据促进不同学科之间的交流和合作。大 数据为来自不同学科的社会科学研究者的交流和合作搭 建平台,通过分析研究者的研究方向、知识结构等相关 信息,精准组建研究团队,通过协同合作、无缝对接促 进社会科学交叉研究。

(四)由“模型驱动”过渡到“数据驱动”

传统社会科学量化研究方法是参照自然科学的条 件假设、抽象建模、分析推理,先在单一、恒定的理想 化假设下,通过建立分析模型,对收集的行为数据进行 分析,推理出结论和对行为现象的解释,研究的关键和 基础是模型的构建,强调理论的先验性和预测性,可以 说,它主要是由模型驱动的。而大数据主要依赖海量数 据、算法和算力,揭示社会现象的本质和规律,能够更 准确地反映社会现实的复杂性和多样性,是由数据驱动 的研究方法,减少了对精确模型与假设的依赖。值得一 提的是,在利用大数据研究社会科学时,研究者们发现 必须得依靠相关理论的指导,因此,大数据在社会科学 领域的应用也正在从最初的数据驱动向理论与数据双驱 动转变,即在收集大量的原始数据基础上,利用大数据 分析技术和理论挖掘提取信息和知识,从而发现和揭示 人类社会的规律,进而形成以现实问题为导向、与社会 科学相关领域的理论知识经验相结合的研究框架 [13]。

(五)由“因果分析”转向为“相关分析”

无论是实地研究、个案研究、扎根理论的人文主 义方法论,还是实验研究、调查研究、文献分析的实证 主义方法论,其焦点都是分析某一行为或社会现象背后 的因果关系和影响机制,并以此发现和预测人类社会发 展规律 [14],这些方法都是建立在因果分析基础之上, 换而言之,传统社会科学研究方法强调因果分析。基于 大数据的社会科学研究虽然没有摒弃因果分析,但更加 专注于数据之间以及各影响因素的相关性 [15],并通过 相关分析推断出因果关系 [12]。众所周知,任何一种社 会现象都是由多个因素共同影响形成的,因此,不但要 分析各因素对事物的影响,也要注重各因素之间的相互 作用、相互影响,这样才能准确且全面地研究社会现象 和发展趋势。总之,大数据通过发现传统研究方法所不 能分析的数据集之间的相关关系、研究各因素之间的影 响,对社会科学的认知体系产生了结构性的改变,提高 了社会科学研究结论的科学性和客观性 [16]。

三、适应大数据时代社会科学研究的应对策略

应对大数据时代的社会科学研究范式新变化新要 求,需要提高研究者的数据处理能力,大力发展计算社 会科学和大模型,推动数据要素汇集和开放合作,完善 大数据应用环境,进而更好地认识与理解数字社会,为 其建设提供理论指导。

(一)提升社科研究者的数据处理能力

大规模数据量化分析是社会科学研究的重要方向 和学术制高点,也是构建现代哲学社会科学学科体系、 学术体系、话语体系的重要组成部分。为此,社会科 学研究者需要进一步提升大规模数据处理能力,以适 应复杂的数字社会研究。一是加强数据处理技能培训。 组织开展各类技能培训班和讲座,让社会科学研究者 熟练掌握 SPSS、SAS 等大规模数据统计分析软件,学 习 Python、R 等大规模数据编程语言,了解 Hadoop、 Spark 等大数据处理软件使用方法,学会使用部分社会 科学领域大模型。二是加强社会科学研究与数据处理技 术人员合作。推动社会科学各领域研究者与计算机、数据科学等专业技术人员合作与交流,在合作过程中,相 互学习和借鉴对方的数据处理技术和方法,提高社会科 学研究的数据处理能力。三是积极参加社会科学量化研 究领域学术研讨会和论坛。通过研讨会等平台,与同行 交流经验、分享心得,了解社会科学与大数据融合的现 状与趋势,不断提高数据处理意识和能力。

(二)加快推动计算社会科学发展

计算社会科学作为一门基于大数据分析的交叉学 科,将大数据、人工智能等新一代数字技术引入到虚实 交织的复杂社会研究之中,能够将结构化、非结构化、 半结构化的海量人类行为数据汇聚并进行“计算”,从 而客观准确地分析、评判和预测人类社会的复杂行为、 现象及演变过程,为社会科学研究提供了全新的思路和 方法。我国很多高校和科研院所设立了计算社会科学实 验室和研究中心,这推动了计算社会科学发展,但计算 社会科学实验室的建设仍需要进一步加强。一方面,设 置计算社会科学专业。借鉴美国的乔治梅森大学、加利 福尼亚大学伯克利分校、哥伦比亚大学等国外高校在硕 士研究生阶段设置计算社会科学专业的做法;计算社会 科学是使用计算方法和统计分析来解释社会现象,需要 多学科的知识背景,因此,支持具备条件的高校申请在 研究生阶段增设计算社会科学专业,并开设相关专业课 程。另一方面,推动计算社会科学研究组织机构发展。 计算社会科学的发展和研究离不开协会和专门研究机构 的助推。欧美国家主导成立了国际计算社会科学协会、 美国计算社会科学学会等学术组织,斯坦福大学、芝加 哥大学等高校纷纷设立了计算社会科学专门研究机构, 我国也建设了诸如清华大学计算社会科学与国家治理实 验室、北京大学计算社会科学研究中心等研究机构,但 仍需要通过增加资金投入、加强人才引进等途径推动计 算社会科学研究机构建设,并支持组建计算社会科学学 会或专业委员会,推动学术交流,加强伦理道德建设。

(三)推进社科大模型的研发与应用

大模型凭借在自然语言处理、机器翻译、对话系 统等方面的造诣,能够准确理解用户意图,并根据上下 文实现人机交互并不断迭代,快速生成复杂的文本、代码、图片、语音、视频等,而且逻辑清晰、层次感强, 在智能程度、底层数据、应用广度和深度等方面均实现 了标志性的突破,具备了丰富的语言知识和理解能力, 为社会科学研究带来重要机遇。因此,要把握好生成式 人工智能热潮,加快推动大模型在社会科学领域的应用。 一是鼓励科研机构、企业等研发和推出社会科学领域大 模型产品。通过奖补、设立重大科技项目等方式,推动 各级财政资金、各类科研基金项目加强对社会科学大模 型研发的支持力度,研发一批具有自主知识产权的社会 科学领域大模型。二是夯实社会科学大模型算法算力支 撑底座。依托国家超级计算中心和大数据中心,加快推 进超算互联网建设和超算算力的一体化运营,创建为研 究机构提供算力支撑的国家公共算力平台,降低社会科 学大模型算力费用。三是协同创新社会科学大模型。推 动社会科学研究机构与生成式人工智能企业合作,在模 型工程化调优、实时数据抓取、商业化模式优化、改善 用户体验等方面进行协同创新。

(四)促进多源异构数据要素流通汇聚

大数据强调一切皆可“量化”[17],而这种量化分析 的基础和关键性要素是数据。因此,关于数据的几项工 作不可或缺。一是推动建设各类社会科学大数据平台。 社会科学大数据平台具有的大型数据管理库,是收集和 存储社会科学相关数据的“数据池”,可持续采集和汇 集调研调查、传感器、拍摄设备、网络爬虫、管理信息 系统等多源数据。为此,各级主管部门要在资金投入、 项目立项、配套设施等方面给予倾斜,推动社会科学大 数据平台建设。二是推动公共数据共享开放。社会科学 领域较为权威的数据主要来源于政务部门和行业部门。 因此,应完善公共数据开放共享目录,健全数据开放共 享规则,研究制定收益分配制度,明确公共数据开放标 准和范围,构建分行业、分场景的可控数据有序开放机 制,以接口调用、数据脱敏交易等方式,推动散落在各 个政府机关、企事业单位、行业部门的数据汇总开放, 实现省市县跨层级、跨部门、跨系统的数据共享。三是 加快推进数据交易流通。依托各类数据交易平台和机构, 明晰数据要素产权归属权,构建数据汇聚—开放—登记—交易全链条,促进社会科学相关领域数据良性交易。

(五)加强社科研究领域交流与合作

交流与合作是提升社会科学研究水平的重要途径, 尤其是在我国数字人才储备不足、关键理论和技术有待 突破、“缺芯少核”的情况下,更要注重社会科学领域 的开放合作。一是加强国内外社会科学研究机构间的合 作。通过建立合作关系,国内外机构可以共同申报和开 展社会科学量化研究项目,分享研究资源和技术,发表 高质量的期刊论文和报告。二是加强人才培养与交流。 通过学者互访、讲学、合作研究等活动,加强国内外高 校和研究机构在社会科学量化研究领域人才培养方面的 合作,提高研究人员的专业素养和数据处理能力。三是 鼓励我国的科研院所、专家学者、社会组织、企业积极 参与社会科学领域数据、安全、技术等标准框架研制, 构建合作共赢的社会科学数据共享规则。四是支持举办 或参与各类社会科学量化研究领域学术会议和论坛,为 学者提供交流思想和分享研究成果的平台,促进大数据 在社会科学研究领域的融合创新与应用。

(六)完善社科大数据应用制度保障

探索政府部门、行业组织和企业的联动治理模式, 健全大数据在社会科学领域应用的制度保障,筑牢可 信可控的安全屏障。一是加快制定大数据与社会科学 融合发展战略规划,为法律法规的完善、工作开展和 数据治理提供指引。二是充分发挥行业协会作用,出 台关于大数据在社会科学领域应用的规章制度,尤其 是建立社会科学大模型注册及审查制度,加强对算法 模型合规性审查和生命周期保护。三是支持成立关注 大数据在社会科学领域应用的伦理委员会,研究大数 据技术给社会科学带来的伦理问题,确保大数据与社 会科学融合不违背社会伦理和价值观。四是在《网络 安全法》《数据安全法》《个人信息保护法》等法律 法规基础上,推动由政府部门主导、研究机构和企业 参与研究出台、针对大数据在社会科学应用的法律法 规,确立大数据应用边界合规合法,明晰大数据应用 在数据安全、网络安全、国家安全、隐私保护、知识 产权保护、监管治理等方面的规则,明确各种违法侵权行为的法律责任归属。

四、结语

大数据时代,数字技术改变了人们生产生活的行 为方式,重塑了社会结构,再造了社会运行机制,促使 人类社会发生前所未有的变迁并呈现出数字化、复杂化、 智能化特征,既为社会科学的量化研究提供了海量人类 行为数据,也为复杂数字社会系统提供了技术支持。在 这一背景下,社会科学研究方法在理论建构和方法实践 上面临着重要的拐点。社会科学研究者应当敏锐捕捉这 一历史性机遇,利用好大数据认识与理解数字社会变迁 过程 [4]。大数据使社会科学研究材料从抽样调查转变为收集研究对象的相关总体数据,使社会科学研究角度 从宏观或微观的视角转变为宏观和微观相结合的视域, 使社会科学研究知识结构从单一学科变为多学科融合, 使社会科学研究从依靠模型驱动转变为由数据和理论共 同驱动,使社会科学研究方法从偏重因果分析变为更偏 重于相关分析,进而使社会科学研究范式发生根本性变 革。为了适应新的社会科学研究范式与方法,本文提出 了提升研究者的数据处理能力、发展计算社会科学、推 进社科大模型研发、促进多源异构数据流通汇聚、推进 交流与合作、完善大数据在社会科学应用的制度保障等 有效措施,以期推动社会科学研究在大数据时代的高质 量发展。

参考文献:

[1] 黄欣卓.数据驱动的社会科学研究转型:“大数据与社会科学转型高端学术研讨会”专家观点[J].社会科学文摘,2019(2):118-120.

[2] 舍恩伯格,库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:123-126.

[3] 李晓楠.网络社会结构变迁视域下元宇宙的法律治理[J].法治研究,2022(2):25-35.

[4] 王天夫.数字时代的社会变迁与社会研究[J].中国社会科学,2021(12):73-88.

[5] 王红卫,李珏,刘建国,等.人机融合复杂社会系统研究[J].中国管理科学,2023,31(7):1-21.[6] LAZER D.The rise of the social algorithm[J].Science,2015,348(6239):1090-1091.

[7] 库恩.科学革命的结构[M].张卜天,译.北京:北京大学出版社,2012:8.

[8] 杜宝贵.论比较科技政策的“研究范式”[J].华中科技大学学报(社会科学版),2011,25(2):58-62.

[9] 黄欣卓.数据驱动社会科学研究转型的方向、路径与方法:关于“大数据与社会科学研究转型”主题的笔谈[J].公共管理学报,2019,16(2):159-167.

[10] 唐世平.计算社会科学与科学决策的未来[J].国际政治科学,2023,8(3):1-27.

[11] 袁继红.计算社会科学的生成解释问题[J].自然辩证法研究,2020,36(4):103-107.

[12] 米加宁,章昌平,李大宇,等.第四研究范式:大数据驱动的社会科学研究转型[J].学海,2018(2):11-27.

[13] 罗俊,李凤翔.计算社会科学视角下的数据观[J].吉首大学学报(社会科学版),2018,39(2):17-25.

[14] 刘忆鲁.大数据背景下社会科学共同体及其规范重建[D].哈尔滨:哈尔滨工业大学,2020.

[15] 顾燕峰.大数据与实证社会科学研究范式的延续与变革[J].东南学术,2021(1):113-126,247.

[16] SHAW J. Why “Big Data” is a big deal:information science promises to change the world[J]. Harvard magazine,No.2,2014(March-April):30-35,74-75.

[17] 章长城,方晖玥.计算社会科学在社会研究中的应用与启示[J/OL].中南民族大学学报(人文社会科学版):1-8[2024-06-12].https://doi.org/10.19898/j.cnki.42-1704/C.20231221.02.

基金项目:国家社科基金青年项目“大数据背景下计算社会科学的理论体系、应用及评价研究”(19CSH003)。

作者简介:许安明 , 男,1987 年生,博士研究生,湖南省社会科学院(湖南省人民政府发展研究中心),助理研究员,研究方向为大数据、计算社会科学、数字经济。杨顺顺,男,1981 年生,博士,湖南省社会科学院(湖南省人民政府发展研究中心),研究员,研究方向为大数据、低碳经济与绿色发展。许鑫,女,1980 年生, 湖南工程职业技术学院,讲师,研究方向为大数据、英语翻译。

标签: