[数据概念]梅宏院士-数据要素化怎么办十问

2024-06-23 18:36

本文主要是介绍[数据概念]梅宏院士-数据要素化怎么办十问,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 提出问题,才能解决问题。

5月27日,2023中国国际大数据产业博览会“数据要素流通与价值化”论坛举行,中国科学院院士、中国计算机学会理事长梅宏发出数据要素化十问。

本文主要内容转自 数字化转型战略指南

图片

01   第一问:能否以及如何将数据列为资产?

——————————————————

资产,从广义上讲,指的是源于过去交易或者事件的一系列活动所形成的资源,这些资源可以是个人或实体实际拥有或控制的,并且预期能够为企业带来经济效益。在传统意义上,资产类别包括了无形资产。关于无形资产,其特征较为显著的是:具备实际存在性,潜在的经济收益性,以及可量化性。然而,在数据资产化的过程中,我们发现这些特征遇到了挑战:

  1. 现实性:数据资产的存在形式不同于传统的有形资产,其控制和权属的界定较为复杂。

  2. 经济性:数据具有潜在的经济价值,但是否以及如何产生经济效益是不确定的。

  3. 可计量性:数据的量化存在一定难度,如何准确计量数据资产的价值仍需探讨。

  4. 可辨识性:数据资产的辨识缺乏统一的标准和依据。

将数据视作资产,在国际上仍是一个相对新颖的概念,缺乏统一的上位法规定。尽管如此,随着数字经济的蓬勃发展,数据资产化的需求日益迫切,被视为一种自然的甚至是必然的趋势。这要求我们必须探索新的方法来认定和实现数据资产的价值。

当前,关于数据资产化的理论和实践尚处于探索阶段,没有统一的标准和模型。如何有效地实现数据资产的价值,如何在保护个人隐私和数据安全的前提下利用数据资产,都是需要深入研究和实践的问题。在中国,这一进程同样面临着从理论到实践的转变和挑战,亟需各界共同探讨和推动。

02   第二问:如何理解数据权属性质,如何确权?

——————————————————

在理解数据权属性质和进行数据确权时,我们需要考虑如何在法律上明确数据的产权,确认其收益权益归属于哪个主体。数据的特性,如非竞争性、非排他性、非稀缺性和非耗竭性,使得这一问题变得尤为复杂。数据的应用场景众多,观点也因此多元。

在数据权属的问题上,传统的法律原则,如所有权和使用权,可能不再完全适用。数据的非排他性特性意味着一旦数据被共享,就难以限制其他人使用这些数据。因此,数据权属的界定动力减弱,所有权的概念也可能变得模糊。

对于不同类型的数据权属问题,我们需要探讨如下几个方面:

  1. 个人数据与个人生物特征和财产特征紧密相关,是否可以将其与人格权等同对待?

  2. 公共数据的资源归属如何界定?在中国,公共数据被视为全民所有,但具体的企业数据权属和民事权力体系构建则是一个新的挑战。

  3. 数据产品可能涉及智力劳动,如何确认知识产权的成分?是否需要创造一种全新的权力概念来适应数据的特性?

在权力归属问题上,我们是否可以构建一个多元权力并存、共享的体系?目前,全球都在探索这一问题,并且尚未有统一的法律解决方案。各国现行的法律体系中,关于数据权属的立法仍然缺失,大多数情况下采用的是责任规则而非财产规则来处理数据侵权案件。

因此,我们需要构建一个适应数据要素本质的法律体系和确权机制。这是一个全球性的挑战,也是当前法律界和业界共同探索的课题。

03   第三问:如何度量评估数据价值?

——————————————————

在数据资产的评估和定价方面,我们面临着诸多挑战。不同行业对于同一份数据的需求差异巨大,有些主体愿意支付高昂的价格购买,而另一些则即使免费也不会接受。我们尝试运用各种评估方法,如成本法、收益法和市场法,但在数据资产的评估中,这些方法遇到了困难。

数据资产的成本构成复杂,且不易区分。市场法在这种情况下并不适用,因为数据资产的市场尚未成熟,缺乏足够的市场交易数据作为参考。数据资产作为新兴商品,具有独特的成本构成,包括高生产成本和低边际成本,需求多样化,估值难度大。此外,数据的实时性难以验证,隐私权的界定模糊,数据的复制和应用也无法有效防范。

在数据资产的交易中,我们需要考虑商品售卖的形式,防止套利行为,保护隐私信息,以及验证数据的真实性等问题。数据资产的定价是在供需双方的博弈活动中形成的,但传统的资产评估方法难以直接应用于数据资产的评估。

目前,会计核算方法尚未能够有效地对数据资产进行估值和定价,缺乏为数据估值定价提供依据的标准和方法。即使我们希望将数据资产纳入会计账目,现有的会计核算方法也不足以支持这一需求。因此,我们需要探索新的评估和定价机制,以适应数据资产的特殊性和市场需求。

04   第四问:什么是数据要素的基本度量单位?

——————————————————

在数据作为生产要素进行交易时,其基本度量单位的问题显得尤为重要。传统的生产要素,如土地、劳动力、货币等,都有统一的度量单位,如平方米、小时、货币单位等。技术和企业家能力虽然难以量化,但它们作为生产效益的提升者,通常不直接按这些单位来度量。

然而,数据资产的度量单位却不是一个简单的问题。我们不能单纯地按照数据的规模,如GB(千兆字节)或TB(太字节)来衡量其价值,因为更大的尺寸并不一定意味着更高的价值。同样,按照文件的形式或操作系统的文件来度量也是不合适的,因为这些是两个完全不同的维度。

我曾在论坛上提出数联网的概念,并探讨了使用DOA(数字对象体系)来数字化现实世界的数据并将其转化为数字对象的可能性。如果能够实现这一点,我们或许可以找到一种新的度量方式。DOA将现实数据和资源建模为数字对象,并通过联网形成数联网,这样或许能够解决度量单位的问题。

此外,我们也可以考虑数据所表征的物理世界对象的价值。物理世界的数据延伸是有价值的,但如果没有这种基础数据,延伸的价值也不存在。因此,是否可以将DOA中的数字对象或数字孪生作为新的度量单元,这需要我们进一步研究和探讨。

在民间的黑市交易中,数据的价值有时是按照数据条数来计算的,如个人信息、手机数据、家庭数据等。这些交易通常是非法的,但也提供了一种思考数据价值的方法。

总之,我们需要找到一种能够合理度量数据价值的方法。我希望能够找到一些合作伙伴,一起研究这个问题,并探索开展相关的研究工作。

05   第五问:如何构建高效数据流通交易体系?

——————————————————

在讨论数据交易时,我们通常指的是数据产品和数据交易活动的交易行为,这个概念可以广义地包括数据价值的深度挖掘等与数据交易产业链相关的交易和技术服务。这种广义的交易定义是值得认可的。

目前全球的数据交易模式普遍采用平台化的方式。这些平台充当了数据供方和需求方之间的交易中介,包括三方、四方等多种交易模式。此外,还存在直接交易的情况,如需求方和供方之间的交易,以及黑市交易。还有一种是通过数据包进行交易,双方协商好后进行数据交换。

API也成为了数据交易中一个非常活跃的部分,许多平台企业围绕API经济进行了大量的数据交易活动。国际上已经建立了许多数据交易平台,但这些平台大多是由企业运营的,类型多样,并提供相应服务。

在中国,自2014年起建立了50多家数据交易所,大多数是由政府主导的。然而,使用“交易所”这一概念来命名这些平台引发了一些讨论。交易所是工业社会的产物,其定义涉及交易某种信息或物品的信息平台或场所,具有交易物权清晰、抽佣中介性质、准入制和市场化结合等特点。

数据交易与信息服务需要区分。数据交易是指不同主体之间针对数据的有偿或无偿交换行为,交换对象可以是原始数据或加工后的数据产品。而信息服务是基于现有信息数据进行分析后形成的服务产品,服务方需要对提供的信息承担责任。如果信息服务提供错误,这是交易所无法解决的。

现行交易所面临的挑战包括权属不清晰和规则完善问题。交易所是否应该交易使用权,以及是否应该提供数据信息服务,这些问题都需要明确。如果交易所提供数据信息服务,它可能需要承担相应的责任,这可能会使交易所转变为数据信息服务提供商。

在中国,政府已经明确要控制数据交易所的数量。然而,地方政府的指令可能会导致本地企业必须在本地交易,这可能会成为全国市场建设的障碍。数据交易全球化、跨境交易的需求与地方政府的限制之间存在矛盾。

此外,政府主导的交易所是否应该允许场外交易,以及如何规范和兼容市场化的交易方式,这些问题都需要多元的交易体制来解决。有效的交易体制不仅需要规范,还需要高效,这是当前需要积极探索的课题。

06   第六问:如何合理分配数据收益?

——————————————————

在数据经济的利益分配中,保障数据基本权利与实现各方收益最大化是一个平衡的挑战。市场机制在初期似乎无法完全解决问题,尤其是在监管缺失的情况下,市场的收益分配可能存在不合理性。个体的数据贡献虽然未直接带来个人收益,但却换取了服务和便利。

随着G20和联合国世界经合组织(OECD)在2021年10月就数字经济税收挑战达成共识,数据税成为了一个重要的讨论方向。然而,具体开始收税的举措尚未明确。在此背景下,提出了数据费的概念,即个人数据贡献者应该能够获得某种形式的收益。技术发展趋势中的数据3.0概念强调了数据的主权,即个人应该对自己的数据空间拥有控制权,并从中获得收益。

在国际上,已经有人开始探索将个人数据汇聚起来,形成信托机制,以实现数据的合理利用和收益分配。这种做法值得关注,并可能在未来的数字世界中得到更广泛的应用。

在中国,公共数据的全民所有特性提出了如何参与利益分配的问题。公共数据的代表性问题、公平性和公正性的体现,以及如何调节政府对要素收益的影响,都是当前面临的重大挑战。

因此,我们需要探索多元化的数据要素分配机制,建立基于贡献的市场评价体系,并考虑政府对收益的调节作用。这些问题的解决需要时间和实践的探索,哪怕是通过试错的方式,也应该是我们的努力方向。

07   第七问:如何实现公共数据的真正开放?

——————————————————

数据开放是指数据提供方无偿地向公众提供数据,这种提供通常是单向的,不涉及其他介入。在中国,数据开放取得了显著进展。截至2023,已有208个省级和城市地方政府上线了开放平台,330个地级行政区建成了公共数据开放平台,覆盖了全国约58%的地级行政区。

国际上,数据开放也得到了推动。美国在2009年推出了全球首个开放政府数据门户网站DATA.GOV,提供了包括农业、制造、天气、教育、能源等多个领域的数据集。到2023年5月,DATA.GOV已经聚集了超过25万多个数据集,并且以其开放API和统一数据格式等特点而受到赞誉。

中国也在推进公共数据的开放,但目前公共数据的质量和数量仍有待提高。虽然《数据二十条》提出了数据可用不可见的授权开放原则,但真正的数据开放应该是原始数据的开放。公共数据来源于民众,应该服务于民众,通过剔除敏感数据后,开放数据以便于更多的创新运用。

民间需求往往是激发数据应用创新的重要因素。许多民间创新运用数据的例子表明,数据开放还有很长的路要走。政府主导的数据开放平台已经迈出了重要的一步,但原始数据的开放将是未来发展的关键。通过开放原始数据,可以促进更多的数据应用创新,服务于社会和经济发展。

08   第八问:如何平衡发展与安全?

——————————————————

近年来,随着数据泄漏事件、网络诈骗行为、数据滥用和误用等问题日益严重,数据安全和隐私保护问题越来越受到关注。针对这些问题,我国政府一直在加强对数据安全法律法规的建设,包括数据安全、隐私保护、法律、行政法规和部门规章等方面。

据网信会议上的讲话指出,安全是发展的前提,发展是安全的保障,发展也是最大的安全。因此,在数据应用方面,我们必须强化安全意识和底线意识。但是,我们不应该设置过低的安全底线,因为没有绝对的安全。所以,如果你的安全底线设置过低,那就不要做,不作为可能是最好的安全措施。因此,我一直认为应该先发展,再跟进安全,用发展保障安全。

当前,信息化是我们中华民族千载难逢的机遇,我们必须抓住这个机遇,同时也要加强对数据安全和隐私保护的监管,确保信息化发展不会带来负面影响。

09   第九问:如何为数据要素化提供技术支撑?

——————————————————

数字经济的发展依赖于一系列的关键因素,其中包括坚实的数字基础设施和物理基础设施的数字化转型,以及信息技术的广泛应用。特别是在处理大数据方面,技术支撑是至关重要的,涵盖了数据从产生到消亡的整个过程。我将大数据技术划分为四个主要领域:数据管理、数据处理、数据分析以及数据治理。

面对大数据,我们面临诸多挑战,其中包括如何构建以数据为核心的高效计算体系,如何实现数据与应用程序的完全解耦,以便于跨越式的数据管理,以及如何对多源异构的大数据进行多模态融合分析和解释性分析。特别是数据治理框架和体系的构建,这是我们当前研究的重点,涵盖了从理论基础到实际框架的整个过程,还包括了贵州省在大数据实践方面的经验。

我们关注的问题包括如何支持数据的集中整合和融合,如何通过技术确保数据质量,如何保护数据隐私和安全,如何推动数据的开放和流通,以及如何制定相应的技术标准和构建健康的大数据生态。这些都是技术层面需要解决的问题。

数据要素化是一个复杂的系统工程,制度建设是其中的关键。同时,这项工作也具有高度的技术性,需要高效且有效的技术支持。因此,数据治理相关技术的研发将成为大数据技术发展的重要方向之一。我们的目标是为整个数据要素化过程提供有效的技术支持。

10   第十问:数据要素如何加入生产函数?

——————————————————

在传统工业经济中,我们关注的是生产函数,它揭示了在特定技术水平下,生产要素(如土地、资本、劳动力)的投入与产品产出之间的关系。生产函数体现了企业将投入转换为产出的能力,其中土地、资本和劳动力通常是直接影响产出的变量。然而,企业家的才能和技术也扮演着重要角色,它们作为提高效率的工具,可以显著改变相同投入产生的结果。因此,技术和管理被视为提升效率的关键因素。

我研究了短期和长期生产函数的各种理论,但值得注意的是,随着数字技术的发展,我们见证了一个重要的现象:许多技术的边际成本趋于零。特别是当技术将边际成本转化为固定成本时,它可能会引发产业的重大转折点。在传统的生产函数中,劳动、资本和土地被视为有形且可量化的自变量,而技术和企业家精神并未被包括在内。数据似乎兼具两边特性,它可以直接作为物理世界的投入,同时当它包含技术含量时,也能提升产出。

因此,我很好奇哪些经济学家能够在其生产函数模型中为数据定位。我期待看到他们能够基于实际案例来阐明数据在生产函数中的角色。

11   小结

——————————————————

梅宏院士在2023中国国际大数据产业博览会上提出了关于数据要素化的十问,这些问题涉及数据资产化、权属性质、数据价值评估、交易体系、收益分配、公共数据开放、发展与安全平衡、技术支撑以及数据在生产函数中的角色等关键议题。

首先,梅宏探讨了数据如何被视作资产以及如何实现资产化,指出传统资产的属性与数据不完全吻合,数据的权属、经济性和可计量性存在不确定性。他提出,尽管数据具有经济价值,但其是否及如何带来经济利益是不确定的。

其次,他询问了数据权属的性质和如何确权,指出数据权属问题的复杂性,包括个人数据与人格权的关联、公共数据的资源归属以及企业数据的权益问题。

接着,梅宏讨论了如何度量评估数据价值,指出传统资产评估方法不适用于数据资产,因为数据的价值评估存在很大的不确定性。

第四问涉及数据要素的基本度量单位,梅宏提出数据作为生产要素交易的基本度量单位是什么,指出数据的大小(如G、T)并不直接决定其价值。

第五问关于如何构建高效的数据流通交易体系,梅宏注意到数据交易模式的多样性,并强调需要兼容市场化的交易方式。

第六问关注如何合理分配数据收益,讨论了市场机制在数据收益分配中的作用,并提出了政府介入的可能性。

第七问探讨了如何实现公共数据的真正开放,强调原始数据的开放的重要性。

第八问平衡发展与安全的关系,提出在推进数据应用的同时,强化安全意识和底线意识。

第九问关于如何为数据要素化提供技术支撑,梅宏指出数据治理相关技术的研发是关键。

最后,第十问询问数据要素如何加入生产函数,如何描述数据在生产函数中的位置。

梅宏的这些问题和讨论反映了对数据要素化进程中关键问题的深刻思考,旨在推动数据经济的健康发展,并确保数据的安全和隐私得到保护。

数据资产化,鼹鼠哥与你一起。

图片

任何问题,欢迎大家公众号后台留言沟通。

这篇关于[数据概念]梅宏院士-数据要素化怎么办十问的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087954

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者