个人数据“收”、公共数据“放” 一收一放之间寻找AI时代的节奏
俊驰 | 2025-10-30 18:47
【数据猿导读】 国对个人数据的保护网越织越密,因为那些骚扰电话能找到你,根源就在于个人数据的泄露。
“该松的松,该紧的紧。
最近你有没有感觉到,那些让人不厌其烦的放贷款、推销产品的骚扰电话少多了。曾经让人防不胜防的“大数据杀熟”也似乎有所收敛。这一变化并非偶然,也不是不法分子变得心善了。这一变化源于工信部2025年以来开展的违规呼叫中心专项整治行动。更根本的是,中国对个人数据的保护网越织越密,因为那些骚扰电话能找到你,根源就在于个人数据的泄露。
与此同时,另一场静默的革命也在进行中:曾经沉睡在各部门的公共数据,正加快向社会开放。
这一收一放之间,中国正在寻找数字时代的新节奏。
双轨并行:
数据治理的二元格局
今年9月21日,国家互联网信息办公室发布《大型网络平台设立个人信息保护监督委员会规定(征求意见稿)》。规定旨在对于大型平台的个人数据保护,进一步规范化。
差不多去年的同一时期,中共中央办公厅、国务院办公厅发布的《关于加快公共数据资源开发利用的意见》提出,到2025年公共数据资源开发利用制度规则初步建立,资源供给规模和质量明显提升。
两份政策,两种态度,勾勒出中国数据要素市场化改革的清晰路径:在强化个人数据防护的同时,通过公共数据开放激活要素价值。
个人数据保护,层层加固
曾几何时,在互联网上广大群众的数据是处于“裸奔”的状态。都不用说那些猖獗的有组织的非法组织,即使是一家正规互联网企业,或多或少对个人数据都存在过度使用的问题。作为一名用户,哪怕我们只是使用天气预报、计算器这样的APP,企业都要你对它开放地理位置和通讯录等信息。假如不同意,就直接用不了这个软件。
而且,你永远不知道自己的哪些数据被收集走了,中间转卖了多少次。唯一能确定的是,最终这些数据都会用在我们自己的头上——那些推销电话、诈骗电话、大数据杀熟就这么来的。

正如DADI公司首席品牌官奥利弗·汤普森表示:“我们生活在一个数据驱动一切的时代——从产品设计到公共政策皆如此。但产生这些数据的人,往往被排除在决策之外。”
好在,那种“数据一揽子授权”的时代正在远去。
近年来,围绕个人数据保护,相继颁布《个人信息保护法》(以下简称个保法)、《网络数据安全管理条例》等一系列法律法规。尤其是个保法,带来了诸多制度创新,有些甚至在全球都是首创。
个保法有几项重要意义:
·首次系统性地规定了个人在信息处理活动中的权利
法律明确赋予个人一系列权利,包括:知情权、决定权、限制或拒绝处理权、查阅复制权、更正补充权、删除权(被遗忘权)、要求解释权等。这意味着,我们真正成为自己数据的主人。
·确立了“告知-同意”为核心的处理规则体系
自愿同意:要求同意必须是个人在充分知情的前提下自愿、明确作出的。禁止“一揽子授权”和“默认同意”。也就是说,某些APP企图过度收集个人数据,或者用软件的使用权绑架客户的个人数据等行为,都是违规的。
单独同意:对于处理敏感个人信息、向他人提供个人信息、公开个人信息、在公共场所安装图像采集设备等高风险场景,必须取得个人的单独同意。这是一个非常重要的创新。在AI时代,个人数据的价值越发重要,在一些关键场景下,如果必须要使用个人数据,需要使用方取得个人的单独同意。这极大地增强了对个人关键信息的保护,同时也为个人数据的合法使用保留了灵活性。
·强化了对大型互联网平台的“守门人”义务
重要互联网平台服务必须建立健全个人信息保护合规制度体系,成立主要由外部成员组成的独立监督机构,定期发布个人信息保护社会责任报告,接受社会监督。这是借鉴了国际上的“守门人”制度,对巨头企业施加了更重的社会责任。今年9月21日,国家互联网信息办公室发布的《大型网络平台设立个人信息保护监督委员会规定(征求意见稿)》,这是对平台责任的进一步规范化。
我们有理由相信,随着个人数据保护的日益完善。大数据杀熟、过度授权、个人信息泄露的问题,将会得到大幅缓解。当某个应用软件请求获取你的位置信息时,你可以放心地选择“仅在使用期间允许”,而不用担心它会在后台持续追踪你的行踪。
公共数据开放 “推背感”十足
与个人数据不断收紧不同的是,公共数据正在加速对外开放,并且“推背感”十足。
公共数据是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的具有利用价值的数据集合。简单来说,就是政府部门、企事业单位在办事、服务时产生的海量数据,比如企业水电、税务,民政、医保、就业数据等。
2024年9月,中共中央办公厅、国务院办公厅印发《关于加快公共数据资源开发利用的意见》。意见中设定了明确目标:到2025年,公共数据资源开发利用制度规则初步建立;到2030年,公共数据资源开发利用制度规则更加成熟。
各地政府也因地制宜,进一步细化公共数据的开放措施,推行了一系列可落地的方案。
比如,湖南省明确表示要“推进公共数据资源登记”和“推进公共数据资源授权运营”。通过“积极稳妥推进公共数据资源整体授权、分领域授权或依场景授权”,加快构建全省一体化协同融合的公共数据资源授权运营体系。
在场景应用方面,湖南省提出“丰富公共数据应用场景”,深入实施“数据要素×”行动。加快推动数字政务、数字经济、数字文化、数字社会、数字生态文明等重点领域的公共平台建设和数据资源开发利用。
除了政府政策引导以为,地方数据集团的成立,是加大公共数据供给的另一重要举措。数据集团的定位是 “公共数据运营主体”,其主要任务之一是整合政府各部门以及公共领域的碎片化数据,解决长期存在的“数据孤岛”和“数据壁垒”问题,促进数据的跨区域、跨行业流通。

目前全国拥有100多家数据集团。9月11日,北京数据集团正式揭牌,让数据集团的规模再上一个台阶。
在一些先行区域,数据集团已经取得了诸多显著成果。长沙数字集团成立仅一年多,就汇聚全市66个委办局200余亿条公共数据,开发上架73个数据产品,推动金融、医疗、人才服务等23个场景产品价值变现;41个集约数字化项目预估总投资4.72亿元,累计节约财政资金1.48亿元。
在多项举措协同推进下,曾经沉睡在政府各部门的公共数据,比如政务数据、医疗数据、电力数据、税务数据等,正在变成有价值的社会资源。比如,交通数据可以帮助物流企业优化配送路线,气象数据可以为农业提供更精准的种植建议,税务、水电数据可以为小微企业融资提供支撑——这些曾经被分割保存在不同部门的“信息湖泊”,正在连接成一片“数据之河”,向四面八方奔涌而去。
AI时代:
个人数据与公共数据的角色再定位
面对日益收紧的个人数据监管和不断开放的公共数据,科技企业正在调整数据策略,转向更合规、更创新的发展方向——从单纯的数据使用者转变为数据价值的创造者。
这一变化在具身智能领域最为明显。如今很多具身智能企业,都开始组建自己的数据生产基地。这是因为具身智能有一个区别于其他赛道的特性,缺乏适配的训练数据。像AI大模型只需要利用互联网公开的数据进行预训练,就能开发产品。但是具身智能必须依赖机器与真实世界的交互数据——这是公开渠道所没有的。
因此,具身智能企业不得不独立“创造”数据。
例如,星海图团队开发的Galaxea Open-World Dataset包含超过10万条移动操作数据,覆盖住宅、厨房、等50个不同类型的真实环境,涉及150类任务类型、1600余种操作对象以及58项具身技能。机器人在这些动态、非结构化环境中的抓取、搬运和操作任务,任务复杂度接近现实应用需求,有助于训练的模型在现实环境中表现出更好的泛化能力。
不光是具身智能,随着人工智能时代的加速到来,像自动驾驶、低空无人机、医疗、金融等领域,企业越来越依赖被“创造”或者“制造”出来的数据,尤其是高质量的数据。那些被企业制造出来的数据,也开始进入到公共数据的范畴,在更多范围内被交易和流转。
也就是说,企业不单是公共数据的使用者,也开始成为了公共数据的创造者。
与此同时,在人工智能时代,个人数据的角色也需要重新定位。
个人数据对于很多AI应用来说,往往都是极具价值的高质量数据——比如我们的声音、医疗、征信以及衣食住行等数据,可以说浑身都是宝。AI对于个人数据是有着刚性需求的,如果站在产业发展的宏观视角,个人数据的监管是必要的,但又不能太“死”,不得不进行适当的开放。如何在保护个人隐私的前提下促进数据合理利用,成为制度设计的核心挑战。
个人数据直接开发或许比较困难,“曲线开发”路线应运而生——即把个人数据经过授权运营转化成公共数据,然后再进行开发利用。目前,主要通过以下几种授权模式来实现:
明示同意授权:在数据收集时获取用户明确的、具体的授权,直接收集个人信息用于特定公共服务或场景。比如《上海市公共数据资源授权运营管理办法》二十条指出,对重要数据和个人信息,在保护国家安全、公共利益和个人隐私的前提下,鼓励通过“原始数据不出域、数据可用不可见、数据可控可计量”等方式,依法依规实现数据价值开发。
这种模式主要适用于直接收集个人信息用于特定公共服务或场景。
匿名化处理授权:对个人信息进行匿名化处理,使其无法识别到特定个人且不可复原,随后进行开发利用。
这种模式主要适用于不涉及个人身份识别的数据分析、模型训练和趋势研究。
法定许可授权:在依法履职或提供公共服务的特定场景下,法律法规明确授权可使用相关数据,此时无需重复获取个人同意。
这种模式主要适用于政府依法进行的统计、监管、应急处理等公共管理活动。
平台/企业授权:平台企业在获得用户授权后,将其合法收集并加工形成的匿名化数据集或数据产品,提供给公共数据授权运营体系。
这种模式主要适用于,行业龙头企业或互联网平台与公共数据融合,赋能产业发展和中小微企业。

也就是说,个人数据与公共数据在制度和技术的安排下,可以实现二元治理的统一。在AI时代,个人数据是需要保护的权利基石,而公共数据则是待开发的价值源泉。数据要素市场化改革正进入深水区,个人数据保护与公共数据开放的协同推进将成为关键。
未来,随着数据分类分级制度的完善和数据基础设施的加强,我们或许会进入这样一个世界:你的个人数据像家中的财物一样安全,而公共数据则像公园里的空气一样可供所有人受益——这或许就是数字时代的理想图景。
来源:数据猿
刷新相关文章
我要评论
不容错过的资讯
大家都在搜













































