日国家数据局发布《国家数据基础设施建设指引》,提出“力争在当前情况下,说清楚数据基础设施的概念、发展愿景和建设目标”。《指引》发布以来,存在以下话题引起广泛讨论:
公共数据、企业数据、个人数据的开发利用分别适用于哪种数据基础设施?本文将一一回答上述问题。
根据《工业和信息化部等十一部门关于推动新型信息基础设施协调发展有关事项的通知》(工信部联通信〔2024〕165号),新型信息基础设施主要包括5G网络、光纤宽带网络、骨干网络、国际通信网络、卫星互联网等网络基础设施,数据中心、通用算力中心、智能计算中心、超算中心等算力基础设施,人工智能、区块链、量子计算等新技术设施。可见,新型信息基础设施包括网络基础设施、算力基础设施、新技术设施。其中,数据基础设施中的区块链属于新型信息基础设施中的新技术设施。
《国家数据基础设施建设指引》在概念内涵章节指出,“数字经济时代,网络设施、算力设施、应用设施等构建了数字基础设施”“网络设施、算力设施与国家数据基础设施紧密相关”。可见,国家数据基础设施与数字基础设施密切相关但又分属于不同的概念。
《指引》指出,“当前,数据成为关键生产要素,催生新的技术—经济范式,重塑产业发展方式,推动数字基础设施向数据基础设施延伸和拓展”。可见,数据基础设施是数据成为生产要素的时代背景下,为了支撑数据基础制度落地、促进数据要素价值释放而提出的新兴概念。
构建全国一体化数据市场需要基础设施的支撑。然而以互联网为核心的信息基础设施,在支撑数据要素市场建设方面的能力不足,导致数据共享流通成本高,限制了数据价值的释放和数字经济发展。这是因为互联网最初是为了使计算机协同工作、支撑应用运行而设计的。传统计算机应用按业务需求设计信息系统、按系统功能组织数据,数据与应用紧密耦合,互联网仅提供应用内部不同计算机间的数据传输通道。在此架构下,数据不是互联网上可直接管理的独立资源,增加了数据流通共享的成本。
此外,数据流通共享需要在满足隐私合规要求的前提下进行。据国际调研机构Gartner测算,2025年将有一半的大型企业机构,在不受信任的环境和多方数据分析用例中,需要使用隐私计算处理数据,大数据生态的普惠性协作将达到前所未有的水平。
然而,目前通过隐私计算和区块链技术进行流通的数据还是沧海一粟。国家发改委数据显示,我国数据生产总量在“十四五”期间实现翻番,目前数据生产总量已相当于1500多万个国家图书馆的数据总量。全国联盟链总节点数已达50000个,通过区块链技术进行流通的数据已达200PB。隐私计算节点数已达6000个,通过隐私计算技术进行流通的数据已达5PB,应用场景集中在医疗、金融等高敏感个人数据领域。可见,目前基于“区块链+隐私计算”的数据可信流通量不足数据生产总量的十万分之一。
因此,需要从最大限度释放数据价值目标导向出发,构建以数据的高效共享、可信流通目标的数据基础设施,为新兴数据技术集成使用提供统一载体,在满足合规要求的前提下为数字经济提供源头活水。
长期以来,数据流通利用面临着既要满足《个人信息保护法》《数据安全法》等法律监管要求,又要释放数据价值的二元矛盾。从技术方案来看,仅仅凭借单一技术难以构建高效、高流动性的可信数据流通体系。例如在提取数据价值层面,隐私计算技术能够解决加密状态下数据的计算和分析,但数源主体的身份是否真实、错误的数据结果是哪个数据流转环节导致的、数源主体是否有主观作恶风险、如何激励互不信任的多个数源主体高效有序的输出优质数据,以上难题均需要区块链及数字身份技术协同隐私计算技术来解决。
结合目前业界的实践来看,结合数字身份的“区块链+隐私计算”是确保数据可信流通行之有效的技术路径。其中,区块链技术扮演“分布式志愿联盟组织”的角色,数字身份技术扮演“身份审核哨兵”的角色,二者均为多个互不信任的数源主体开展隐私计算提供技术保障。
数字身份实现物理世界的数源主体映射到数字世界,解决“是谁将数据上链”的问题,正在重构数字经济时代的信任锚点。虽然区块链可以解决链上数据的防篡改、可追溯等,但如何保证数据存入区块链之前的真实性和可靠性,需要数字身份技术解决。随着用户数据主权理念的普及,分布式数字身份(DID)通过建立以用户为中心的自主身份管理系统(如微软、IBM的去中心化方案),与区块链形成良好的技术契合。
各机构业务发展水平不同、数据质量参差不齐、特征分布不尽相同、成果贡献缺乏合理的评估和利益分配机制。拥有高质量数据样本的数据源对共同成果的贡献更大,如果没有合理的贡献度价值衡量机制,就难以激励数据所有者与其他数据源进行合作,不利于数据共享。
区块链具有多中心、可溯源、防篡改、智能合约自动执行等技术特点,通过共识机制在各个数源主体之间建立信任基础,通过对数据共享中关键环节的存证来搭建溯源机制,通过在智能合约写入激励机制来促进各数源主体贡献高质量的数据。
最后,需要隐私计算实现密态数据的计算,解决满足隐私合规前提下数据价值释放的问题。隐私计算实现对数据处于加密状态或非透明状态下的计算和分析,在保证各方原始数据安全隐私性的同时,完成对多方数据的融合计算,实现多方数据的“可用不可见”,从而达到提取数据要素价值的目标。
《国家数据基础设施建设指引》中,区块链、隐私计算、可信数据空间均属于数据基础设施。公共数据适用于通过公共数据授权运营的路径来开发利用。非公共数据适用于数据经纪人、数据交易所、数据信托等市场化的路径来开发利用。至于公共数据、企业数据、个人数据分别适用于哪些数据基础设施,应首先对公共数据与非公共数据进行切分。
虽然国家层面尚未对公共数据进行定义,但《上海市数据条例》第二条第四款“公共数据,是指本市国家机关、事业单位,经依法授权具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等提供公共服务的组织(以下统称公共管理和服务机构),在履行公共管理和服务职责过程中收集和产生的数据。”《上海市数据条例》通过界定主体与过程2大要点定义了公共数据的范围。即公共数据的主体须为公共管理与服务机构,公共数据的生产过程须为履行公共管理与服务职责的过程。
关于开发利用公共数据所适用的数据基础设施,《公共数据资源授权运营实施规范(试行)》进行了明确的表述:“实施机构应建立健全安全可控的开发利用环境,充分利用现有信息系统资源,鼓励集约化建设,支持隐私计算等安全可信流通技术应用,确保数据资源开发利用过程可管、可控、可追溯”。可见,公共数据的开发利用,对安全可控的开发利用环境有较高的要求,并明确指出实施机构应支持隐私计算等技术的应用。
企业数据与个人数据作为公共数据以外的范畴,集中管理的难度较大。同时,不同企业信息化基础、数据治理能力参差不齐,且企业数据的开发利用需要兼顾企业的数据基础设施采购成本和数据安全合规要求,适合通过企业数据空间进行开发利用。国家数据局在《可信数据空间发展行动计划(2024—2028年)》指出“支持国有企业和龙头企业建设企业可信数据空间”。可见,企业可信数据空间作为弹性,
个人数据空间可以为个人提供一个安全、可控的环境来管理和开发自己的数据,确保个人数据在合法合规的前提下得到合理利用。然而,考虑到现阶段我国公民隐私保护意识薄弱、有效保护个人信息的技术手段不足、面临侵权后举证维权困难等现实情况,笔者认为个人数据空间、个人数字卡包等产品实现商业模式为时尚早,难以经受有效市场需求的验证。例如,谁有权利接受个人委托搜集个人数据并开发利用?在中国,谁来充当韩国MyData中的开发运营商?是通信运营商还是银行还是政府?企业跃跃欲试先行开发出了个人数字卡包产品,市场上谁来采购该产品?国家数据局在《可信数据空间发展行动计划(2024—2028年)》指出“稳慎探索个人可信数据空间”“研究制定个人数据开发利用政策文件”。可见,个人数据空间的实施推进尚待进一步完善顶层设计。
上表是基于“区块链+隐私计算”的数据基础设施,与可信数据空间的对比。二者在隐私功能、硬件与人才投入、开发周期上均存在较大差异。综上,经地方政府授权的公共数据授权运营机构适用基于“区块链+隐私计算”的数据基础设施,银行等金融机构由于IT人才与资金投入预算充足、持有的个人数据体量较大,同样适用基于“区块链+隐私计算”的数据基础设施。中大型企业根据隐私合规的要求与IT预算,可选择可信数据空间作为数据基础设施,构建多方互信的数据流通利用环境,协同上下游企业开放共享高质量数据资源。
上海赛博网络安全产业创新研究院(简称赛博研究院),是上海市级民办非企业机构,成立至今,赛博研究院秉持战略、管理和技术的综合服务模式、致力于成为面向数字经济时代的战略科技智库、服务数据要素市场的专业咨询机构和汇聚数智安全技术的协同创新平台。
赛博研究院立足上海服务全国,是包括上海市委网信办、上海市通管局、上海市经信委、上海市数据局等单位的专业支撑机构,同时承担上海人工智能产业安全专家委员会秘书长单位、上海“浦江护航”数据安全工作委员会秘书长单位、上海数据安全协同创新实验室发起单位等重要功能,并组织“浦江护航”数据安全上海论坛、世界人工智能大会安全高端对话等一系列重要专业会议。
6月7日上午,多名网友爆料成巴高速往成都方向云顶山一号特长隧道内有车辆起火。网友发布的多条视频中,隧道内烟雾弥漫,许多驾乘人员下车奔向隧道洞外。记者从四川高速公安交警热线获悉,该隧道内确有事故发生,路段暂未恢复通车。
与美国总统特朗普公开发生“口水战”之际,美国亿万富翁、前政府效率部牵头人埃隆·马斯克曾于当地时间5日抛下“重磅炸弹”爆料,特朗普出现在已故富商杰弗里·爱泼斯坦的文件档案中,因此有关档案才不能公开。
#三亚 女游客疑被#蛇咬身亡 救治体系旅游管理漏洞何时补?#东方快评#媒体精选计划
比亚迪掀起的价格战,这一轮“杀伤力”会有多大? #比亚迪 #价格战 #解读
工信部、中汽协紧急发声!汽车“价格战”该踩刹车了 #热点新闻事件 #汽车价格战
鼠标不动“自动答题” 起底驾考作弊链条 河北 “保过费”实为培训费 并不能确保通过
鼠标不动“自动答题”,起底驾考作弊链条·河北:“保过费”实为培训费,并不能确保通过。
黑龙江齐齐哈尔“魅力克山”6月6日发布《对王某某拒服兵役行为实施联合惩戒的情况通报》:应征青年王某某,男,2004年4月25日出生,中专学历,克山县河北乡人。
今天是全国高考首日,中央气象台五预警齐发,东北地区北部、黄淮、江南中部、西南地区东南部等地的部分地区将有8级以上雷暴大风或冰雹天气。
网友:再次谈判前夕,俄乌双方无人机互袭升级,各自有何考量?德国此时大幅加码援乌,又将对俄乌冲突造成哪些影响?戳视频,听专家杜文龙的解读。