独家 | 大数据下的自杀风险感知与疏导(附视频PPT下载)

2023-10-14 19:10

本文主要是介绍独家 | 大数据下的自杀风险感知与疏导(附视频PPT下载),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

自杀是困扰全世界的一个社会性问题,鉴于自杀给个人、家庭和社会带来的巨大情感创伤和经济损失,及时有效地感知和预防这种极端行为极为必要。心理学研究成果表明长期慢性压力是导致自杀发生的主要原因之一。


本期我们邀请到清华-青岛数据科学研究院计算心理健康研究中心主任、清华大学计算机科学与技术系教授、博士生导师冯铃。本场讲座探讨了如何根据多数据源感知、预警与辅助疏导青少年的心理压力,如何通过网络社交媒体大数据从慢性压力的角度进行自杀危险感知,以及从压力源头进行疏导排解,避免问题的扩大化与蔓延化。更多大数据在预测预防自杀方向的应用,可见:独家 | 预防自杀,大数据也在致力于挽救生命


后台回复关键词“1222”,下载完整PPT。


以下是演讲视频:(后附图文版实录)


class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" scrolling="no" data-src="http://v.qq.com/iframe/player.html?vid=e0520764aqd&width=670&height=376.875&auto=0" style="display: block; width: 670px !important; height: 376.875px !important;" width="670" height="376.875" data-vh="376.875" data-vw="670" src="http://v.qq.com/iframe/player.html?vid=e0520764aqd&width=670&height=376.875&auto=0"/>



清华-青岛数据科学研究院计算心理健康研究中心主任冯铃

 

冯铃:自杀是困扰着全世界的一个重要问题,据世界卫生组织报告,全世界每年约80万人死于自杀,仅中国就有28.7万人,其中青少年约有10万名。换句话说,在中国平均每分钟就有两人自杀,还有八人自杀未遂。自杀不仅造成巨大的经济损失,还给个人、家庭和社会带来永久的情感创伤。



心理学研究指出,自杀起因于人们长期的心理压力。当不良情绪无法对外释放时,矛头便被转到自己身上。在快节奏、高竞争的现代经济社会中,心理压力伴随着学业、家庭、情感、生活等问题愈发严重。与过去讲求温饱不同,现代人更重视精神需求,比如自我价值、存在感、意义感。



负面情绪被不断累积会造成什么呢?据2016年中国官方统计显示,现有1.73亿中国人患有不同程度的精神障碍。换句话说,几乎占全部人口15%的中国人有各种各样的心理困扰。



如何应对各种心理困扰造成的自杀现象?在个体自杀前发现问题,并提供针对性地疏导,以排解压力,从而避免问题的蔓延。而针对自杀的预测存在以下问题:一是早期发现困难,尤其是内向患者,不愿意去分享;二是面对面的心理咨询需预约,并且人力成本非常贵;三是及时的、个性化的服务很难被实施,且能进行有效疏导的途径不多。



我们主要聚焦前期对自杀风险的感知方面,即通过及时的数据分析,捕捉个体的异常行为,如其在微博上的异常表现,以做出及时的风险预测。透过网络社交媒体,我们可以得知人们表露出来的一些想法,这为如何疏导现代人的心理压力提供了新的思路。



传统心理学研究者在进行感知疏导时,往往借助心理学量表、可穿戴设备、脑电图等工具量化心理指标,然后对患者的各种情况、精神障碍等进行评估和鉴别,最后提供一个有针对性的治疗方案。然而这种形式人力成本非常高,诊疗室进行得较多,很难惠及大众。



社交网络具有平等、自由、碎片化、个性化等突出特点,可以展现出人们的认知、情感和行为水平,基于此我们目前主要通过微博进行分析,这涉及众多计算机的传统领域,如文本分析、情感分析、数据挖掘、意见挖掘等。


情绪、慢性心理压力被列为重要的衡量指标,另外考虑导致自杀的其他因素,如人们自杀的一些表达、自我关注的话语、在社交媒体上的活跃程度,我们采用机器学习等方法建立了一个六维微博特征空间模型,如图所示。



首先我们做了心理压力区间的检测,考虑了八大压力类型和六个压力级别,如图所示。



怎么通过社交媒体发现个体在这段时间的压力很大,是因为学业,还是情感或是家庭?我们有一个基本假设:压力源事件会造成个体产生相应的压力表现。在压力状态下,个体带有负面情绪的微博增多,通过自然语言处理捕捉到压力源事件对压力微博发表的关联关系,可以建立对应的数学模型。基于这个模型,通过机器学习就可以检测相似的用户群体的问题。



如何建立数学模型呢?我们找到一个重点中学,学生们压力非常大。选择该学校的原因是它把所有的模拟考试、月考、高考报名、高考等全部信息发在网上,这些构成了与学业相关的压力源事件。数据结果显示,在有压力源事件的一段时间里面,用户发有负面情绪微博的频率普遍高于在正常时间段里发负面情绪微博的频率。



基于这个初步发现,我们分别用两个独立、同构的泊松过程来描述用户在压力源事件区间与非压力源事件区间发负面情绪微博的行为。如果在一段时间里,用户发布负面情绪的微博频率高于其在非压力源事件区间发布负面情绪的微博频率,且这个概率大于一个阈值,我们就认为这是一段压力区间。心理压力区间及其波动特点将被作为预测自杀的第一个特征。



这是部分推导过程。假设N1是在压力事件区间用户发的负面情绪微博总数,λ1是其发负面情绪微博的频率。N0是在非压力事件区间用户发的负面情绪微博总数,λ0是其发负面情绪微博的频率。针对一个时间段,当λ1 >λ0的概率大于一个阈值,我们就认为该区间为一个压力区间。



但很多压力区间是由同一件事造成的,对人产生的影响具有连续性。如何评判同一压力源呢?比如有两个都满足压力区间条件的概率分布,用户在微博上发的话题或者是压力的类型、分布是否类似?如果描述的话题类似,并且满足模型的参数要求,它们就属于同一件压力源事件引起的压力区间。


这时,我们就需要合并一些连续的压力区间。另外,从这个压力区间也可以感知到压力源事件,透过文字表达可以得知用户不开心的缘由。当然有时候人们说的话可能跟实际情况不一样,这种困难需要我们从研究过程里求解。从下图同学发的微博得知,他在这段时间里经历了三段压力区间,每段区间里面他的压力波动情况,我们用6个特征值来刻画。



心理压力区间和压力波动的剧烈情况均对自杀风险起着预测性作用。这些压力的特征值包括压力区间总数、平均压力强度、压力程度均方根偏差、压力峰值、压力区间跨度、不同压力类型数量。



为评估自杀者的心理压力特征值,我们从新浪微博里查询并分析了65位已经实行自杀的人员,以及65位没有自杀倾向的正常人。结果显示,自杀人员的六项指标都高于正常用户。



预测自杀的第二个考量特征为自我关注。自杀者往往自我关注度高,并且在他们的遗书中,使用了更多的第一人称代词,如“我”、“我的”、“我们”、“自己”等。另外,自杀者倾向于在他们的微博中表达绝望的自杀感受,而不是压抑这些感受。



第三个特征为自杀的相关表达。其中涉及到自杀相关词典,尤其是个性化的词典,如一些比较极端的表达:“因为太悲伤了”、“无法控制自己”、“我心感觉好冷、好累”、“煎熬”、“难过”、“痛苦”。在遗言里面出现的这种表达,说明个体的承受力已经到了极限。


中科院心理研究所提出了中国社交媒体自杀词典的部分示例,该词典分成三个等级,词的等级越高,权重越大。我们基于这样一个词典,给自杀的相关表达特征向量赋值。



关于自杀的相关表达,出现自杀相关词汇的微博在全部微博中所占的比例也是一个重要的衡量指标。我们通过平均每条包含自杀相关词汇微博里的自杀词汇数量及占比来做分析感知。



第四个重要特征是遗言,自杀者在实施自杀行为之前通常会留下一些话,传递自己内心的复杂感受,如悔恨、内疚、对家人或朋友的寄语,甚至如何安排自己的后事等。如在新浪微博里面的一些表达:“对不起”、“嘲讽”、“有生之年”等。



第五个特征为社交媒体的互动。在心理学研究中,社交孤立是用于自杀意念判定的一个非常重要且可靠的观察变量。绝望的人所拥有的社交网络往往很薄弱,从而得到的社会支持也很少。在这种情况下,我们衡量用户在社交媒体上的活跃程度。



第六个特征为情绪。这一方面的工作借助喜悦、爱、期望、焦虑、悲伤、愤怒、憎恨、惊喜等八种情绪分类,评估用户的情绪累积程度、不同情绪之间的关联度以及不同情绪之间的转移模式。



当微博空间各特征被量化后,我们运用模糊认知图模型进行机器学习,选择它的原因如下:一是它表达了节点之间的因果关系,而非简单的关联关系;二是它凭借量化推理与动态反馈机制,适用于处理数据量少且类别不确定的分类问题;三是通过类别节点状态函数不断迭代从混沌状态达到各分类的动态平衡。



模糊认知图做分类模型的关键是构建权重矩阵,也就是边和边之间要选到一个最佳的权值,恰当表述两个节点之间的因果关系。在模糊认知图里,每个概念节点有一个状态值,这个状态值刻画了该概念节点的一些属性,节点的状态值可以不断发生改变。我们用一个状态函数S表示某一节点的状态值,比如说i分类节点的状态,在T+1时刻,其S状态值与其T时刻的状态值,以及因果权重矩阵W是紧密关联的,这里的f函数的功能是把状态值映射到[0,1]之间,权值矩阵可通过各种优化算法来迭代求解,不断降低分类误差。



我们的Performance Study,也是非常初步的Performance Study,我们从65位自杀用户中任意选出60%的用户,用来学习模糊认知图的因果关系矩阵,然后用余下40%的用户做测试,这还是传统地停留于论文发表上的实验方法。我们比较了不同的FCM、Decision Tree、 Nave Bayesian、Random Forest、 SVM,结果表示FCM在分类的效果上面能够达到80%,超过其它几种分类模型。

   


简而言之,我们从压力的角度入手来感知自杀风险,但我们的工作还存在以下问题,有待进一步提高:一是我们只考虑到负面的情绪在微博里的表现,未考虑人为正向干预对自杀风险检测的影响;二是在真正评估一位尚未实行自杀的个体风险时,结果的正确率难以评判;三是研究的应用性尚且不足。



在做自杀风险感知的研究同时,我们也一直在思考、探索如何通过信息技术、大数据,从压力源头辅助疏导排解心理压力,避免问题蔓延化、扩大化。通过这项工作,我们希望可以提供更多的社会支持,帮助到需要帮助的人。令人欣喜地是我们的学生成立了“清华帮”,一个互帮互助的平台。


用户可以在平台上发布带有文字、图片的信息和问题,系统会根据后台待实现的推荐算法把问题推荐给有能力解决的若干名候选用户,一旦某位候选用户接受问题,其他候选用户的问题分配栏中将看不到该问题。为保护问题请求者隐私,只有候选用户接受问题后才会看得到问题提出者的线下联系方式,最终通过线上联系线下解决的方法,达到互帮互助的目的。



这是我们的同学做得很棒的一个APP。背后的核心就是推荐合适的用户来解答问题。在推荐时考虑到很多的因素,一是用户擅长解决哪类问题;二是提问用户和解答用户间的互补;三是用户曾经解决过的问题与新问题之间的相似性。



在该过程中的具体操作:第一,建立用户-问题类型评分矩阵,描述用户解决不同类型的问题的能力,通过用户-问题类型矩阵分解推荐算法,滤出来针对用户问题需求的Top-N位解答用户候选集。



第二,除用户解决问题的类型信息,需考虑问题请求用户与解答用户之间的信息关联(如年龄、专业、性别等),以及用户的清闲度,对Top-N位候选解答用户做进一步地筛选。



第三,通过协同过滤方式,考虑用户曾经解决过的问题与新问题之间的相似性。将问题推荐给最后筛选出的候选用户,待其回答。



虽然数据不能解读人性的复杂,但它弥补了心理学在预测问题上的劣势。传统的心理健康教育和数据管理与服务的有效结合,将为疏导人们日益增长的心理问题另辟蹊径。


更多大数据在预测预防自杀方向的应用,可见:独家 | 预防自杀,大数据也在致力于挽救生命


后台回复关键词“1222”,下载完整PPT。


分享朋友圈 也是另一种赞赏

The more we share, The more we have

 

欢迎加入数据君高效数据分析社区


加我私人微信进入大数据干货群:tongyuannow 







目前100000+人已关注加入我们

       

       






这篇关于独家 | 大数据下的自杀风险感知与疏导(附视频PPT下载)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212542

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi