研究|浅析数据要素基本概念与数据流通的模式

科学家论坛上海站 2024-08-29 10:31:46

1. 概述

数据产品流通是跨多元数据主体的动态过程,指数据产品在提供方和需求方之间的交换或转移,通过共享、开放或交易等流通模式,推动数据产品在组织内外部实现价值释放。数据产品流通通常伴随着价值传递和安全信任的传递,主要包括四种方式:数据交换、数据开放、数据交易和数据共享。其中,数据交换是指数据在系统内部流通,如行业、企业或政府内部,主要涉及数据安全保护需求;数据开放是指数据以无偿方式开放给需求方,主要提供数据浏览、下载等功能;数据交易是将数据产品作为商品进行买卖,涉及数据所有权、管理权、使用权、收益权等权益的转移;数据共享是在不改变数据所有权和管理权的前提下,提供数据访问、使用等服务,涉及使用权和安全访问控制问题。数据产品流通的本质是数据使用许可,一般涵盖一对一许可、一对众许可和相互许可等方式,这几种许可全面构筑了数据社会化利用的模式。

2. 实施价值

数据产品流通是数据资产化中不可或缺的一环,增强信息的透明度和可接近性,促进资源的最优配置。通过有效的数据流通,可以激发创新,优化生产和服务流程,提高经济效率。包括:(1)企业数据价值释放。通过数据产品流通打通“数据孤岛”,形成全要素、全产业链、全价值链的连接,显著提升数据要素的经济和社会价值,增强数据资源流通活力,发挥数据的乘数效应。(2)激发创新赋能。数据产品流通可以激发新的创意,推动科技进步和应用模式的革新,赋能传统产业的数字化转型,实现产业升级和结构优化,进而增强企业的竞争力。(3)推动数据要素市场化配置。数据产品流通是数据要素市场化配置的关键环节,有助于进一步丰富数据产品数量,提升产品质量,推动社会资源的优化配置,提升经济社会效率。(4)实现个人数据价值释放。在充分保护个人数据权益的情况下,经个人同意,可以在保护数据“可用不可见”的情况下实现个人数据流通,推动个人数据的有效利用。

3. 实施路径

数据产品流通以公共数据的对外开放以及社会数据流通交易为例,分别讨论其实施路径。主要参考的文件有:

公共数据流通一般通过政务外网或者场内交易的方式进行共享流通,实施路径参考如下:

(1)公共管理和服务机构登录相关的公共数据平台目录系统,确定本单位公共数据目录的数据名称、数据开放主体、数据开放属性、数据格式和类型、数据的更新频率等内容,并根据实际业务情况及时更新目录。

(2)公共数据开放主体通过公共数据平台,管理、审核本单位的无条件开放数据,在公共数据开放网站统一开放。

(3)对于受限开放类公共数据,公共数据开放主体应通过公共数据平台开放域系统,采用公民、法人授权和沙箱模式等方式开放受限开放类数据。申请受限开放数据的公民、法人和其他组织,应当具备安全保护、信用、数据存储处理等方面的资质和能力。申请受限开放类公共数据的流程为:①需求申请,提交公共数据开放申请表、公共数据开放需求清单、安全等级保护证书、信用报告、公共数据安全承诺书等;②规范性审查,公共数据主管部门对申请主体的申请材料进行规范性审查;③公共数据开放主体审核公共数据开放需求申请;④公共数据主管部门复核公共数据开放需求申请;⑤审核通过后,公共数据开放主体和公共数据利用主体应确认、签订公共数据开放利用协议,明确数据使用的条件和具体要求,并按照协议约定通过公共数据平台开放和获取数据。

社会数据的流通交易分为场内交易和场外交易两种模式,场内交易是数据供应方和需求方依托数据交易机构进行交易,场外交易则是数据供需双方在交易场所外进行交易。一般而言,数据产品场内交易流程包括:

(1)准备阶段。①数据提供方、数据需求方、数据经纪人、第三方专业服务机构等入驻数据交易所,完成用户注册、实名认证、资质审核、信息完善;②对数据交易标的进行信息登记,并对数据产品合规性、质量等进行评估审核,审核通过后数据产品在数据交易所挂牌上架;

(2)实施阶段。

①交易双方进行交易的磋商,对交易标的的交易用途、交易金额、交付方式等内容进行协商,需方也可以申请数据产品或样本数据测试,或者根据实际需求要求数据供方对数据进行加工;②供需双方签订数据交易合同;③按照数据交易合同协议约定交付数据产品;④按照合同协议约定和交易账单支付交易费用,对交易参与方的费用进行结算。

(3)售后阶段。

①在数据交易完成后,对交易相关的信息进行记录、存证、审计,并根据实际情况提供相应的售后服务;②建立数据交易投诉举报和争议解决机制,对数据交易的投诉、举报、争议、纠纷进行处理。

社会数据的场外交易只涉及到场内交易的部分流程,通常包括交易中的实施阶段和交易后的售后阶段。

为严格保护商业秘密和个人隐私,企业应建立安全高效、分类分级的数据流通安全机制。相关技术与机制保障包括:

(1)隐私计算

隐私计算是在保护数据本身不对外泄露的前提下,实现数据分析计算的一类技术集合。该技术集合在处理文字、数值、视频、音频、图像等信息时,对所涉及的隐私信息进行描述、度量等操作,形成一套符号化、公式化且具有量化评价标准的计算理论和算法。技术体系支持对数据进行安全分析计算,实现数据的“可用不可见”。目前,隐私计算计算主要包括安全多方计算、联邦学习、同态加密、可信执行环境等技术,在明文数据不出域情况下,实现密文数据下的隐私计算。支持数据输入、共享、计算、结果输出的全流程过程加密,实时监控数据使用量情况,数据使用有迹可循。

①安全多方计算通过加密技术或秘密分享方法,使各参与方可以在不泄露数据的前提下,共同完成复杂的计算任务,适用于多源多表安全联合统计分析的场景。这种技术的价值在于能够在确保数据安全的同时,促进跨域、跨机构的数据合作,解锁更多数据联合应用的可能。

②联邦学习通过在本地训练模型更新,再将更新结合发送到服务器进行聚合,从而实现模型的共同训练,而不需要交换原始数据,适用与多方联合机器学习建模场景。联邦学习能够提高数据利用效率,同时强化数据隐私和安全,支持多方共同构建强大的机器学习模型。

③同态加密是一种特殊的加密形式,允许人们对密文进行特定形式的代数运算得到仍然是加密的结果,将其解密所得到的结果与对明文进行同样的运算结果一样。同态加密支持在加密的数据中进行诸如检索、比较、计算等操作,得出正确的结果,而且在整个处理过程中无需对数据进行解密。

④可信执行环境是指通过软硬件方法,在中央处理器中构建的安全区域,可以保证其中的程式和资料在机密性和完整性上得到保护。可信执行环境是一种隔离的执行环境,通过硬件的可信来保证计算执行的机密性和正确性。

(2)数据脱敏

数据脱敏分为静态脱敏和动态脱敏。静态脱敏技术配置常用的敏感数据发现算法,也可以通过自定义方式进行扩展,能够在对系统不够了解的情况下对源库进行扫描,自动进行敏感数据匹配,通常基于内置脱敏算法实施静态脱敏。

动态脱敏技术支持在分类分级的基础上,根据数据实体字段的安全级别,在数据共享环境下对敏感数据进行针对性防护实时脱敏和数据监控,提高整体数据安全防护体系质量和稳定性。支持不同用户、不同角色、不同岗位、不同职责的人员在申请数据访问时授予不同的数据访问权限,在用户申请或访问数据时,系统能自动根据访问权限与实体数据字段的安全等级关联起来,根据安全级别的高低采用对应的脱敏算法对数据进行脱敏操作。

(3)数据加密

数据要素流通场景下的数据加密方式主要包括三种使用场景。一是面向访问控制的加密技术,它通过用户的属性来控制加密数据的访问权限。这种加密方式是基于用户的属性,如角色、组织属地、职位等来控制数据加解密的策略。相关技术包括条件代理重加密、基于身份的加密、基于属性的加密等。

二是数据传输加密,确保数据在网络传输过程中保持机密性与完整性。主要的加密技术包括SM2、SM3、SM4、SM9等国密算法,用于保护数据在从源点到目的地传递时不被未授权的第三方截取、阅读或篡改。传输加密是网络安全和数据保护的一个关键组成部分,特别是在互联网和企业网络环境中。实际使用的传输加密方法应支持国密算法的对称密钥加解密、支持组合加密算法的签名和验签等,为数据的传输加密提供细粒度的流通共享策略。

三是数据存储加密,对数据库中存储的敏感数据进行加密保护,采用国产密码算法实现数据的透明加解密,在数据写入据库前自动加密,在读取数据时根据访问权限自动解密,确保感数据在数据库中处于密态,防止敏感数据的外泄。

摘自白皮书---《数据资产化实践指南(2024)》

0 阅读:4