李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)...

本文主要是介绍李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

76ceb1f1dea888ea33c0eef5915d7059.png

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

作为一名文科生,我在学习统计和编程语言的路上一直以来都磕磕绊绊,十分艰难。我以文科生的身份考入武汉大学新闻与传播学院,大二时的“媒介调查与统计”一门课的分数只有82分;直到本科毕业时,我仍然对基本的统计方法一无所知,更不要说在我看来是天方夜谭的R与Python语言编程,所以在作本科毕业论文时,虽然我想实施一些更有意思的选题,却因方法受限而不得不作罢,最后只选取最为基础的手工编码方法完成了一个不同媒体之间叙事比较的案例研究。2020年考入清华大学新闻与传播学院读硕士研究生后,我只知道自己朦朦胧胧对社交媒体和环境议题感兴趣:在社交媒体和气候变化问题都十分重要的当下,人们的环境认知和实践无疑受到社交媒体上的信息和周边社会网络的影响。具体而言,缺少传播资源与能力的非政府组织如何利用社交媒体的特性达成自己的环境倡导目标、触及更大范围的受众并使公众态度和行为向环境友好方向转变?在社交媒体越来越重要的今天,是谁在这一平台上占据主导、影响人们对气候变化的感知和理解?媒体或者结构化的社会网络如何影响人们的环境认知?

这些问题激发着我想要从事社会科学研究的兴趣。因此,我在硕士的第一学期完成了一项关于环保非政府组织在社交媒体上如何进行环境倡导的研究。当时,我使用深度访谈的方法采访了大概十位环境公益组织的负责人。研究做得很辛苦,整理录音和访谈资料花费的时间也很长,但在访谈过程中了解到的各种细节、接触到不同组织负责人却让我非常兴奋。但当我最后把文章拿给我的导师审阅时,她给了很多批评和建议,告诉我质化研究有时候甚至比量化研究更难做,并且委婉地让我多上一些研究方法类课程,争取做出一个扎实规范的研究。对于想走上学术道路的初学者而言,最好的方法是学习并复制一个可操作性强的量化论文,使用规范的量表和现成的统计工具。但我研究和自学了很久,始终觉得自己对心理模型和量表难以提起兴趣。此外,我并不想放弃质化研究中那些有趣的、丰富和翔实的细节,同时又对如何提升自己的归纳和推断能力非常困惑:如果既想要使用量化方法来做出规范的好上手的研究,又想要保留研究的诸多细节,怎么做才是最好的做法?如果想要做出严谨的、具有信度和效度的归纳和推断,我们应该采用什么样的统计学手段去说服自己、说服审稿人、说服读者?

偶然之间,我从身边同学的推荐之下了解到大数据能力提升项目,在某种程度上,大数据能力提升项目让我看到了在量化和质化研究中找到中间道路的可能性——或者说,计算方法是一种另类的量化手段。其实,在进入研究生学习的第一年,我就通过读文献了解到“计算社会科学”这一领域的存在。当时,我内心虽然觉得那些采用大数据和计算方法的社交媒体研究非常吸引人,却觉得如果自己想要上手计算方法,几乎是不可能完成的事情。而大数据能力提升项目恰好给了我这个尝试的机会,我也真正是在项目的一系列课程中,逐渐感受到计算方法的魅力,以及找到嫁接自身领域和计算方法的可能性。在孟天广老师开设的政务大数据应用与分析课程上,我初步接触了因果推论、实验方法、机器学习等前沿研究方法。因为这门课还配套有相应的工作坊指导,我几乎每节工作坊都没有缺席,在课后按照助教分享的代码和范例一步步复制。课余时间,我还报名参加了Coursera上提供的一系列Python编程入门、社会网络分析和机器学习等入门课程。这些都为我后来将这些方法逐步应用到自己的研究之中打下了坚实的基础。

对于孟天广老师在课程上介绍过的两个观点,我一直记忆犹新,这也间接塑造了我对计算社会科学方法的认识和学习方法:第一,大数据方法可能会成为量化和质化研究的桥梁。这是因为大数据方法采用的文本和图片数据,在过去几十年的研究中可能更多被归类于定性素材,而机器学习实质上是采用计算机辅助的定量化分析,研究者在解读结果的过程中,可以采取定性或定量的多元路径。另外,传统的定量研究由于采取问卷的形式,所得到的研究数据通常是结构化的,抛弃了大量文本和图片等非结构化数据中的丰富内容,而计算方法恰好能够帮我们分析出大数据中隐藏的特征和模式。虽然大数据存在改变数据驱动、缺少问题和理论导向的缺陷,也需要在信度、效度和因果推断上给出进一步的解释和改进,但总体而言,大数据方法仍然极大地拓宽了传统量化研究的选题宽度,给包括传播学在内的许多学科都注入了新的实践和理论活力。

第二,学习计算工具的方法无他,最重要的是“learning by doing”(做中学)。如果一个人能够清晰地把自己所学的内容和知识传授给其他人,那这个人一定就深入掌握了这一方法。

受这两个观点的启发,我开始在自己主导的一项社交媒体与气候变化讨论的研究中采取语义网络和情绪分析的计算方法,探讨气候变化相关视频的内容框架和用户气候变化感知之间的关联。最后,论文获得了由国际传播学会(International Communication Association)环境传播分会颁发的最佳学生论文奖。这些经历真正让我感受到采用大数据方法从事社会科学研究的潜力,也坚定了我想要成为环境传播和计算社会科学这一交叉领域的出色学者的决心。

09d0d7680dc381ad2e31b4267d6130d8.png

5e42ae2816be986e0c63d2e982995ea3.png 2022年国际传播学会环境传播分会最佳学生论文奖奖状

在2022年春季学期,受学院学生会的邀请,我在学院的“量化学习小组”里分享了使用有监督机器学习和社会网络分析做研究的经验和代码。在有监督机器学习的讲座里,我介绍了机器学习分类算法,逻辑斯蒂回归模型、朴素贝叶斯模型原理,并带领大家完成数据处理、模型训练与应用等任务;在社会网络分析的讲座里,介绍社会网络分析的基础概念、方法应用、相关理论,并带领大家完成处理数据、建立网络、分析网络等任务,前后一共有五十余位同学到场参加讲座。在这两次的分享中,我也逐步加深了对计算方法的原理及应用的认识。

2022年暑假,不满足于已经学完的大数据能力提升项目课程和Coursera上能够获取到的免费资源,我想要进一步提升自己的大数据编程能力。于是,我报名参加了由密歇根大学每年定期举办的“校际政治学和社会学研究联盟”暑校(Inter-university Consortium for Political and Social Research Summer Program, 简称ICPSR)。我一共参加了“网络分析:前沿话题”、“社会科学中的因果推断”和“面板数据和序列分析”等三门为期四周的方法论课程,并获得了由EITM研究所颁发的成绩证书。

835f57d81bf28e0b4c2f9a0d4e6b539c.png 

1f916df9a5bc3af8f18ccc26c5c8eb79.png

EITM(Empirical Implications of Theoretical Methods)研究所颁发的证书

我很感谢大数据能力提升项目,也十分感谢在这个项目中遇到的孟天广老师,他在我学做研究的路上、以及后续申请密歇根大学ICPSR暑校和申请国外博士项目的过程中都给予了我非常大的启发和帮助;我也想感谢我在上课过程中结识到的合作者和朋友,与优秀之人同行,使我有了更多进步的动力。可以说,是大数据能力提升项目让我的研究能力不断成长,使我的职业目标和学术方向更加清晰,而我也立志于在未来成为一名优秀的计算社会科学研究者,在未来的博士研究期间做出更多结合理论与实证的优秀作品,为计算方法的推广和应用贡献自己的力量。

编辑:于腾凯

校对:林亦霖

e4f3918524cc20c1ee0924c0a27e92bf.png

这篇关于李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/418787

相关文章

Android开发中gradle下载缓慢的问题级解决方法

《Android开发中gradle下载缓慢的问题级解决方法》本文介绍了解决Android开发中Gradle下载缓慢问题的几种方法,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、网络环境优化二、Gradle版本与配置优化三、其他优化措施针对android开发中Gradle下载缓慢的问

python 3.8 的anaconda下载方法

《python3.8的anaconda下载方法》本文详细介绍了如何下载和安装带有Python3.8的Anaconda发行版,包括Anaconda简介、下载步骤、安装指南以及验证安装结果,此外,还介... 目录python3.8 版本的 Anaconda 下载与安装指南一、Anaconda 简介二、下载 An

Java中将异步调用转为同步的五种实现方法

《Java中将异步调用转为同步的五种实现方法》本文介绍了将异步调用转为同步阻塞模式的五种方法:wait/notify、ReentrantLock+Condition、Future、CountDownL... 目录异步与同步的核心区别方法一:使用wait/notify + synchronized代码示例关键

Rust中的BoxT之堆上的数据与递归类型详解

《Rust中的BoxT之堆上的数据与递归类型详解》本文介绍了Rust中的BoxT类型,包括其在堆与栈之间的内存分配,性能优势,以及如何利用BoxT来实现递归类型和处理大小未知类型,通过BoxT,Rus... 目录1. Box<T> 的基础知识1.1 堆与栈的分工1.2 性能优势2.1 递归类型的问题2.2

Python使用Pandas对比两列数据取最大值的五种方法

《Python使用Pandas对比两列数据取最大值的五种方法》本文主要介绍使用Pandas对比两列数据取最大值的五种方法,包括使用max方法、apply方法结合lambda函数、函数、clip方法、w... 目录引言一、使用max方法二、使用apply方法结合lambda函数三、使用np.maximum函数

Qt 中集成mqtt协议的使用方法

《Qt中集成mqtt协议的使用方法》文章介绍了如何在工程中引入qmqtt库,并通过声明一个单例类来暴露订阅到的主题数据,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录一,引入qmqtt 库二,使用一,引入qmqtt 库我是将整个头文件/源文件都添加到了工程中进行编译,这样 跨平台

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

Java判断多个时间段是否重合的方法小结

《Java判断多个时间段是否重合的方法小结》这篇文章主要为大家详细介绍了Java中判断多个时间段是否重合的方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录判断多个时间段是否有间隔判断时间段集合是否与某时间段重合判断多个时间段是否有间隔实体类内容public class D

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui