论文笔记Opportunities and challenges in the use of personal health data for health research

本文主要是介绍论文笔记Opportunities and challenges in the use of personal health data for health research,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Opportunities and challenges in the use of personal health data for health research 论文笔记

snapshot以下是我阅读过程中的一些笔记,希望能帮助大家理解文章。

文章目录

  • *Opportunities and challenges in the use of personal health data for health research* 论文笔记
  • 将个人健康数据用于健康研究的的机遇和挑战
    • 介绍
    • 研究中新的机遇和挑战
    • 当前项目
    • 方法
      • 1. 调查
      • 2. 目标样本
      • 3. 访谈
      • 4. 数据和统计分析
    • 结果
      • 1. 个人
        • a. 样本特征
        • b. 调查结果
      • 2. 研究者
      • 3. 公司和主要线人
    • 讨论
      • 1. 数据所有者
      • 2. 数据访问的研究
      • 3. 隐私
      • 4. 知情同意与伦理
      • 5. 研究方法和数据质量
      • 6. 不断进化的动态系统
    • 总结


将个人健康数据用于健康研究的的机遇和挑战

  • 目标:从三个利益相关者群体的角度了解在研究中使用个人健康数据的障碍:跟踪其健康数据的早期采用者个人、可能将个人健康数据作为其研究一部分的研究人员,以及销售自我跟踪设备、应用程序或服务并汇总和管理生成的数据的公司。
  • 材料和方法:一个由465名个体和134名研究人员组成的有针对性的便利样本完成了一项广泛的在线调查。对11名个人和9名研究人员以及15名公司/关键线人进行了35个小时的半结构化定性访谈。
  • 结果:在六个方面确定了利用个人健康数据进行研究的挑战:数据所有权;研究数据访问;隐私;知情同意和道德;研究方法和数据质量;以及快速发展的设备、应用和其他服务生态系统的不可预测性,这些生态系统会留下“数字足迹”个人表示愿意匿名分享个人健康数据,如果它将被用来推进研究,造福公众。研究人员热衷于使用PHD进行研究,但注意到与知识产权、许可以及与公司签订法律协议的必要性有关的障碍。公司对研究感兴趣,但强调他们的首要任务是保持客户关系。
  • 结论:尽管在利用个人健康数据进行研究方面存在挑战,但利益相关者参与的机会很多,并且已经在进行这些数据的实验。这些早期的例子预示着一系列更大的活动,有可能积极地改变健康研究的方式。

关键词:移动健康(mHealth),可穿戴传感器,物联网(IoT),大数据,个人数据,数据共享

介绍

旨在收集、存储和分析这些个人健康数据(PHD)的应用程序已经激增,并越来越多地被广泛的个人用于自我跟踪。2013年初,皮尤研究中心的健康跟踪研究发现,69%的美国人跟踪某种形式的健康相关信息,21%的人使用数字设备来跟踪。除了自我跟踪的PHD,越来越多的关于个人的数据被被动地捕获,因为人们在网上冲浪,在社交网络上相互交流,进行金融交易,或者进行其他留下“数字足迹”的活动。
几乎所有收集和存储PHD的电子设备、应用程序和服务都在传统医疗保健或公共卫生研究的主流之外。

其所要表达的意思就是:现在人们越来越愿意分享和关注自己的个人健康数据(PHD),甚至想要去看别人对其有什么样的见解;PHD有主动获取的和被动获取的,且搜集这些PHD的设备和企业都在传统医疗保健或公共卫生研究的主流之外。

研究中新的机遇和挑战

PHD数量的增长提供了一个机会,可以超越简单描述性流行病学对人群水平数据的使用,将其用于因果推断。与如何确定因果关系有关的流行病学的基本原则是在与健康相关的测量很少收集并且在时间、材料和参与者负担方面很昂贵的时候发展起来的。这些障碍现在通常由于PHD的日益普及而大大减少。我们在各种健康决定因素方面的数据越来越多,因此我们可能处于建立因果关系的新形式的尖端,类似于大气科学或经济学等领域的研究人员如何根据他们在不断变化的实时数据集上开发的模型对未来事件进行预测。


这些获取数据和进行研究的新方法带来了新的挑战,但也带来了熟悉的问题,包括数据访问、隐私和同意。隐私规范和期望正变得越来越多样化,被相反的趋势推向相反的方向。一方面,在一个在线交流和社交网站如Facebook、Twitter和Pinterest的时代,分享是很常见的。另一方面,由于不利的媒体事件,如围绕国家安全局数据收集工作的事件,人们可能越来越希望关注隐私。与隐私密切相关的是,需要知情同意,以维持公众对研究企业的信任。对于研究人员来说,当研究人员从第三方获取数据而不是直接收集数据时,数据访问变得复杂。科学方法基于数据生成、操作和分析的完全透明。在保护其知识产权方面拥有既得利益的实体可能会拒绝打开其专有软件和算法的黑匣子,这使得解释数据、确定其有效性和复制研究变得困难(如果不是不可能的话)。虽然物理学和基因组学中的大数据技术主要是由学术界利用公共机构的资金开发的,但几乎所有与PHD相关的资源都是商业开发的,并受到各种知识产权和许可限制的制约。

以上内容的要点即:

  1. 与如何确定因果关系有关的流行病学基本原则是在与健康相关的测量很少收集并且在时间、材料和参与者负担方面很昂贵的时候发展起来的。这个障碍在PHD的日益普及的情况下日益减少。
  2. 隐私规范和期望正变得越来越多样化,被相反的趋势推向相反的方向。

    表现在:
  • 一方面,在一个在线交流和社交网站如Facebook、Twitter和Pinterest的时代,分享是很常见的。
  • 另一方面,由于不利的媒体事件,如围绕国家安全局数据收集工作的事件,人们可能越来越希望关注隐私。
  • 与隐私密切相关的是,需要知情同意,以维持公众对研究企业的信任。
  • 对于研究人员来说,当研究人员从第三方获取数据而不是直接收集数据时,数据访问变得复杂。
  • 几乎所有与PHD相关的资源都是商业开发的,并受到各种知识产权和许可限制的制约。

当前项目

2013年年中,罗伯特·伍德·约翰逊基金会资助了健康数据探索(HDE)项目,以深入了解各种利益相关者团体对PHD及其研究用途的看法。

  • 利益相关者组成:包括跟踪健康数据的个人;研究人员可能会将这些数据作为他们研究的一部分;以及销售自我跟踪设备、应用程序或服务来聚合和管理生成的数据的公司。
  • 对于个人来说,目的是了解健康跟踪的经验、被跟踪的数据类型以及对数据共享和隐私的态度。
  • 对于研究人员来说,目的是了解哪些类型的数据对搜索有用,对数据质量和可靠性的担忧,以及对他们使用PHD的障碍。
  • 对于公司来说,目标是了解收集了哪些数据;围绕这些数据的法律、政策和业务问题;以及向外部研究人员提供数据的总体意愿和能力。
  • 项目目的:证明使用新形式的PHD的研究不会取代目前理解健康的努力,而是这些新形式可以补充和增加现有的医疗和公共卫生努力的价值,以衡量构成健康和社会全貌的环境、社会、行为和医疗决定因素。

方法

1. 调查

调查旨在阐明个人和研究人员对自我跟踪数据的态度和体验。
这项工作分三个阶段进行:

  • 使用thinkaloud协议作为试点,参与者在纸上进行调查;
  • 部署在线调查的早期草稿,以探索可用性和可理解性;
  • 部署一个接近最终版本的调查,以测试所做的任何更改,并确认调查的长度合适。

在调查结束时,对后续访谈感兴趣的受访者可以选择以独立于调查的网络形式提供联系信息,以保护他们的匿名性。

2. 目标样本

已经使用过数字自我跟踪数据的个人和研究人员。但是这些人往往是隐藏人群,且还比较少。
出于这个原因,我们选择使用有针对性的便利抽样策略,通过在与自我跟踪相关的网页、相关新闻稿和包括博客和推特在内的热门社交媒体渠道上发布帖子来招募参与者。为了解决这种抽样策略可能产生的偏差,我们提出了人口统计学问题,以便与一般人群进行比较。此外,我们还询问了皮尤研究中心“健康追踪”研究中包含的问题,以便对照皮尤的国家样本来校准我们的样本。

3. 访谈

  • 对个人和搜索者的访谈旨在通过丰富调查结果和获取调查中难以收集的数据来补充调查。
  • 公司/关键信息提供者访谈包括PHD领域的专家,以及提供个人健康设备、应用或服务的一系列公司的代表。

目的是衡量公司参与与学术研究人员合作的意愿,并了解影响其决策的商业、技术和社会因素。因此,基于驱动初始调查设计的同一组高级别问题,以及对收集的调查数据的初步分析,开发了半结构化定性访谈协议。
(接下来阐明了一些规则,保密原则什么的)

潜在的个人和研究受访者是从那些完成调查并愿意被联系进行后续采访的人中挑选出来的。个体的分层随机抽样被选出,以确保男女人数相等和各种研究兴趣。潜在参与者通过电子邮件或电话被邀请参加。访谈通过电话或亲自进行,并进行录音和转录。根据他们的个人专长和在组织中作为决策者的作用,选择了PHD经济中的中央组织的代表和主要信息提供者进行访谈。公司面试时做了详细的记录,以避免与录音有关的保密问题。

4. 数据和统计分析

R语言,进行了百分比、双侧t检验、曼-惠特尼乌特斯或卡方检验(Percentages, two-sided t-tests, Mann–Whitney U-tests, or chi-square tests)用于描述和比较调查结果。对于多次测试,所有的P值都是未校正的。访谈数据通过使用Dedoose软件包的基础理论方法进行分析。

结果

1. 个人

a. 样本特征

共有465人完成了调查,其中11人接受了采访。表1提供了人口统计数据和描述该人群自我追踪的性质和程度的描述符。
数据的局限性:我们的结果是基于早期采用者的数据,这些早期采用者通常是健康的。
表1

b. 调查结果

图1
从该图看出,常见的跟踪数据类型是锻炼、饮食、体重、运动和睡眠。

  • 参与者报告说,跟踪一般健康状况的频率高于跟踪管理医疗状况或慢性病的频率。手机应用程序比网站更常用于追踪,两者都比纸张或“在你的大脑中”追踪更常用。
  • 使用手机应用程序进行自我跟踪与年龄有关,18-25岁的人中,100%的人报告说他们使用手机应用程序进行自我跟踪,而65岁以上的人中只有18%的人使用手机应用程序。
  • 不同收入群体使用手机应用追踪健康状况的情况没有显著差异。

参与者感知数据所有权的调查项目结果如表2:

  1. 超过一半的受访者认为他们拥有自己的所有数据,在数据共享方面,45%的受访者表示他们与他人在线或离线共享健康跟踪数据
  2. 虽然个人认为他们的自我跟踪数据有助于与医疗保健提供商共享,但他们认为提供商对此兴趣不大。受访者普遍表示愿意分享他们的数据用于研究,但倾向于分享给他们感兴趣的研究主题;
  3. 大多数人:有报酬更愿意分享、不喜欢将自己的数据用于商业或盈利目的、隐私得到保护时才会愿意、更信任大学而不是公司
  4. 并非所有数据都被视为同等敏感,至少有一名与会者指出,提供全球定位系统数据能力以确定所走路线和提供所采取步骤数量的数据之间存在根本差异。
    表2

2. 研究者

共有134名研究人员完成了调查,其中9名重新搜索者接受了采访。

  1. 研究人员认为最有用的一些数据类型(如生命体征、压力水平和情绪;如下图)不太可能被个人自我跟踪。这些数据的潜在用途在采访中得到了回应,许多研究人员详细介绍了这些数据填补更传统的临床数据收集空白的方法。
  2. 自我跟踪数据可以更好地衡量日常行为和生活方式。
  3. 从多个来源收集数据将是有益的,包括将PHD与临床数据联系起来。
  • 障碍:
  1. 知识产权问题、许可以及与公司合作时建立必要的法律协议;
  2. 获得的数据类型:包括缺乏标准化、专有算法的潜在问题,以及大多数消费者级医疗设备没有经过验证过程;
  3. 样本来源:早期采用者用户不一定具有普遍性(无法保证随机性、多样性)。
    图3

3. 公司和主要线人

  1. 对于公司来说,推进研究是一个有价值的目标,但不是首要关注的问题。
  2. 商业模式和目标才是重点。
  3. 比其他团队更强调隐私、知情同意和个人数据的复杂性。

显而易见的是,数据隐私、内部评级机构、知情同意、许可协议、网络和数据库安全、HIPAA和其他法律框架、用户界面设计、公司政策和客户关系之间存在着深刻的交织。

讨论

在研究过程中发现了使用PHD进行健康研究的六大领域的挑战:

  1. 数据所有权;
  2. 研究数据访问;
  3. 隐私;
  4. 知情同意和道德;
  5. 研究方法和数据质量;
  6. 与不断发展的设备、应用和其他服务生态系统相关的问题,这些生态系统会留下“数字足迹”

  • 以下为根据研究结果给出的一些建议:

1. 数据所有者

公众态度和企业做法之间更深的鸿沟,而这种鸿沟将受益于这一领域的未来决策。随着研究人员将PHD与电子健康记录等更传统形式的健康数据相结合,这些政策可能变得越来越重要。

2. 数据访问的研究

  1. 个人主要关心的是他们的PHD的商业用途,这是许多人所厌恶的。
  2. 第三方数据搜集的方法比较复杂难办
  3. 挑战:创建正确合适、让双方都满意的合同协议
  4. 需要新的技术和政策解决方案来简化公司和研究人员之间的数据移动,同时保护个人权利。其他策略包括促进和鼓励采用数据使用协议和服务条款的语言,以便公司在客户希望将数据用于研究时更容易做出回应。

3. 隐私

自我跟踪技术的用户经常不知道他们在点击“接受”使用条款时同意的数据访问细节。即使知道数据访问问题和权限,也很难预测对隐私的影响。

  1. 需要额外的研究来帮助解释和理解用户对PHD隐私的期望。这种理解有助于为旨在建立使用规范的对话提供信息。
  2. 需要开发适当的教育和外联材料,以帮助讨论数字匿名的现实和挑战。
  3. 需要开发工具,以加强用户对数据的控制、对共享的认识以及对在研究中使用PHD得出的发现的通知。这些控制是建立信任的必要条件,以确保数据捐赠不是一次性的。

4. 知情同意与伦理

  1. PHD提供了个人日常活动的高度细节。可以以相对较低的成本收集大量数据,并且许多传感器和数字轨迹是在参与者没有主动参与(甚至没有意识到)的情况下生成的。
  2. 产生PHD的相同设备和应用程序也是向用户传递信息的平台,提供了一个以以前不切实际(如果不是不可能的话)的样本量进行干预实验的机会。

建议:有必要进行高层次、跨学科的努力,重新审视基本的伦理原则,考虑它们如何应用于这些新的研究模式,并更新指导研究人员和内部评级机构的程序和建议。与此同时,有机会尝试新的知情同意、去识别和信任共享模式和技术,以平衡对个人的尊重和博士的科学潜力。

5. 研究方法和数据质量

  • 关键障碍:数据的有效性和可靠性,因为现在有各种各样的传感器和设备用于捕捉PHD。
    用于搜集数据的设备只需要经过市场测试(1.设备的可靠性。2.数据所有者的偏差性,可能无法代表整体真实水平,只是早期采用者)

如果PHD要与更传统形式的健康数据(如临床试验数据)相结合,然后用于改善健康干预,就需要更多地了解PHD设备和应用程序在多大程度上代表了它们旨在测量的潜在结构。(需要更专业)

6. 不断进化的动态系统

PHD收集和使用领域是一个不断变化的领域。

随着消费者健康设备、应用和服务市场的成熟,研究人员围绕数据有效性和缺乏标准化强调的一些问题将得到解决。我们还预计,随着政策的制定、法律的制定和标准实践的出现,一些关于数据所有权、隐私和道德的不确定性将会减少。

总结

必须找到创造性的解决方案,使个人权利得到尊重,同时提供高质量和相关的PHD研究机会,平衡开放科学与知识产权,并使私营部门和学院之间能够进行富有成效和互利的合作。
大量的实验正在朝着这些目标进行。该项目的研究结果表明,这些进步可以为公共利益服务,但也需要做一些工作来确保政策、法律和技术的发展增强从PHD中获取知识的潜力,并最终改善健康和福祉。


原文链接:

  1. 网页版:Opportunities and challenges in the use of personal health data for health research
  2. PDF版:Opportunities and challenges in the use of personal health data for health research

这篇关于论文笔记Opportunities and challenges in the use of personal health data for health research的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/170567

相关文章

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

忽略某些文件 —— Git 学习笔记 05

忽略某些文件 忽略某些文件 通过.gitignore文件其他规则源如何选择规则源参考资料 对于某些文件,我们不希望把它们纳入 Git 的管理,也不希望它们总出现在未跟踪文件列表。通常它们都是些自动生成的文件,比如日志文件、编译过程中创建的临时文件等。 通过.gitignore文件 假设我们要忽略 lib.a 文件,那我们可以在 lib.a 所在目录下创建一个名为 .gi