摘要:浙江大学计算机科学与技术学院吴坚平团队在《大数据》发表论文《 基于联邦学习的政务大数据平台应用研究 》,该研究聚焦数字政府建设中政务大数据平台的隐私数据安全与合规难题,分析
浙江大学计算机科学与技术学院吴坚平团队在《大数据》发表论文《基于联邦学习的政务大数据平台应用研究》,该研究聚焦数字政府建设中政务大数据平台的隐私数据安全与合规难题,分析了隐私数据采集、分类分级、共享三大管理挑战,提出基于联邦学习的推荐算法和隐私集合求交技术解决方案,为政务大数据跨域安全共享提供了重要参考。

当前我国数字政府建设已进入深水区,截至2022年9月,全国已上线26个省级、257个市级、355个县级政务大数据平台,形成省市县一体化数据底座。但随着《数据安全法》《个人信息保护法》的实施,政务数据共享与隐私保护的矛盾日益凸显,“数据孤岛”问题仍未有效破解,隐私数据的采集适用性、分类一致性、共享安全性等成为关键痛点。
针对这些问题,团队提出三大核心解决路径。在数据采集环节,采用联邦学习隐私集合求交技术,实现数据需求方与数源方的安全数据回流,通过屏蔽重复数据、精准筛选目标数据,避免过度归集和数据冗余,同时保障数据鲜活性与一致性。
分类分级方面,构建国家、省、市、县四级统一的联邦学习分类分级模型,由国家级平台作为服务器节点,各级平台作为参与方协同维护分类指标,数源方为回流数据打上分类分级标签,大幅降低人工参与度,避免敏感信息泄露,确保分类分级合规统一。
数据共享环节,创新融合联邦推荐系统与隐私集合求交技术,通过隐私保护因子分解机算法构建跨层级推荐模型。数据需求方从本级平台发起申请,未达可信阈值时自动向上级平台逐级请求,实现跨领域、跨层级数据供需精准匹配,在“数据不出域”的前提下完成高质量共享,有效解决数据共享中的度量难、管控难问题。
研究同时指出,联邦学习在政务大数据应用中仍面临隐私保护、通信效率、数据异构三大挑战,未来需通过差分隐私、同态加密等技术强化安全防护,优化传输机制提升通信效率,破解多源异构数据融合难题。
该研究为国家一体化政务大数据体系建设提供了技术支撑,其提出的解决方案已在旅游精准营销、政务服务推荐等场景初步验证,有望推动政务数据从分析式共享向生成式共享转变,为数字政府高质量发展注入新动能。
声明:
①文献来自知网、维普、万方等检索数据库,说明本文献已经发表见刊,恭喜作者.
②如果您是作者且不想本平台展示文献信息,可联系学术顾问予以删除.