新冠肺炎疫情防控阻击战中,大数据在疫情监测分析、病毒溯源、防控救治、资源调配等方面提供了有力支撑。随着我国大数据战略的不断推进,各类生产生活行为都以数据的形式全景留痕,构建了一个与现实空间平行的“数据空间”,数据治理呼之欲出。要切实发挥数据治理的效用,推进社会治理的科学化、政府决策的精准化、公共服务的高效化、社会风险的预见化,需要处理好几个关系。
数据公开与信息保护的关系
大数据在推动经济社会发展的同时还面临着隐私保护和数据伦理问题。公民是社会的核心,公民信息是“数据空间”中最核心的部分,保护公民的隐私权是社会文明的基础,主动泄露、滥用个人信息的行为需要法律法规的明确规制。日前,我国国家标准《信息安全技术个人信息安全规范》再次发布了征求意见稿,对个人信息的收集、保存、使用、流转等全流程提出具体要求,最大限度保障个人合法权益和社会公共利益,《个人信息保护法》《数据安全法》也已列入十三届全国人大常委会立法规划,从制度设计的层面高度重视个人隐私信息的保护。数据公开与信息保护要找一个平衡点,既不能因为“可能”存在信息泄露风险就粗暴阻断数据公开,也不能因为需要数据而“毫无保留”的公开,应构建健康的大数据治理生态。在本次疫情防控工作中,网上出现多起以寻找确诊病例密切接触者为由的个人隐私披露事件,中央网信办紧急叫停,要求按“最小范围原则”进行信息采集,并明确不得公开的信息字段,实现了个人信息利用和公共安全之间的平衡,对数据公开与信息保护起到了示范作用。
数据共享与数据权属的关系
大数据对多源数据的综合分析可获得对事物的全方位认知,单个系统或组织存储的是片面、局部的信息,需要开放共享和数据跨域流动建立完整数据集,但是在当前大数据开放共享实践中阻力很大、掣肘很多,一个重要原因是数据权属没有界定清楚,数据所有权、管理权和使用权还没有明确的责权边界。在“谁生产谁负责”的机制下,拥有数据越少的机构越愿意开放数据,而数据越多的机构则越审慎的开放数据,许多省、市意识到这个问题,在机构改革的过程中组建了大数据局,统一管理全省或全市范围内的政务数据,这为政务大数据开放共享创造了有利条件。党的十九届四中全会确立了数据可作为生产要素参与分配的机制,为企业间数据共享打开“闸门”,数据资产可以产生收益、发挥价值,数据价值会引导企业打通数据壁垒、实现数据流动,上海数据交易中心作为国家大数据交易标准化的试点单位,从交易实践中探索数据治理的技术规范、制度规范,制定了《个人数据保护原则》《流通数据处理准则》《流通数据禁止清单》等一系列准则文件,研发了用于无特定标识的个体标记数据技术,使得交易数据无法识别个体且不能复原个人信息,其做法和经验为完善法律法规提供参考。
数据生产与数据质量的关系
数据的生产者按照“能采尽采”的原则不断扩展采集范围,数据量呈现指数级增长,衡量数据的单位从PB到EB再到ZB,超大规模数据中心在持续建设以满足数据存储需求。但在数据迅猛生产的同时,垃圾数据、无用数据、无效数据、伪造数据、重复数据等数据的质量问题接踵而来,低质数据的存在不仅浪费存储资源,还造成对数据清洗所需人力物力的大量浪费,关键的是严重影响数据分析的结果进而影响科学决策,迫切需要改善数据质量、提升数据有效性。在政务大数据领域,国务院《关于加快推进全国一体化在线政务服务平台建设的指导意见》要求按照“谁主管,谁提供,谁负责”的原则提高数据质量,多地迅速展开了数据质量的提升行动,通过数据质量的审查审核、数据质量评估体系的构建以及数据协同中的数据关联,来倒逼数据质量的提升。在其他领域,还没有明确的体制机制,有企业探索通过交叉检验、生物识别以及机器学习等智能技术解决数据低质问题,有些第三方征信机构其内部拥有上百种生活场景,外部积极与公安、公共事业等打通数据接口,通过内外部的交叉检验进行数据治理。重视数据质量需要制定测量标准,规划管理的统一流程,构建数据质量的管理体系,从制度层面保障数据的精准和有效。
数据权力与数据公平的关系
数据主体在拥有数据权力进行数据应用的同时还可能带来数据不公平。其一,数据权力冲击公平的市场竞争机制。企业在所从事的行业里收集客户数据,对数据分析进而优化所提供的服务,收集的数据越多其提供的服务就越精准,越能够满足客户需求,这种由数据所引发的正向反馈机制,使得其他企业无法公平参与市场竞争。其二,数据权力导致公众获取信息的局限。“算法”是数据应用的重要形式,用户在获取信息或服务时,算法会根据已收集的数据推测用户的偏好,进行个性化推荐,让用户体会到“保姆式”服务的同时,也割断了用户与全域信息的交流,剥夺了用户获取全方位服务的权利,大数据杀熟、基于算法的新闻生产、基于算法的购物推荐都是生动案例。其三,数据权力影响社会信用的评价机制。用户的互联网行为越频繁、使用场景越丰富、在线支付频次越高,其信用大数据就越丰富,在信用贷款、无押金消费方面越畅通,但是在农村或偏远山区等互联网低度发展地区,由于技术支撑、认知能力方面的差异,天然存在着互联网使用上的屏障,没有生动的大数据的支撑,企业或机构不足以分析其信用能力,也就无法在信用消费方面提供便利,隐含着数据权力导致的不公平。