关键词:
联邦学习
智慧医疗服务
基于位置服务
安全多方计算
同态加密
隐私保护
摘要:
随着移动通信、大数据、物联网等技术的紧密结合与快速发展,以及智能终端设备的不断更新与换代,各种互联网服务不断涌现并深入到了人们生活工作的方方面面,提升了人们的生活质量。然而,数据作为互联网服务的支撑,包含了个人、企业、乃至国家的大量重要信息。同时,在互联网服务中,用户和服务商之间的数据交换与共享愈发频繁,随之而来的数据安全与隐私泄露问题日益严峻。为确保用户敏感数据的安全性,欧盟《通用数据保护条例》和我国《数据安全法》等法律相继发布,明确规定要建立用户敏感信息保护制度。与此同时,互联网服务中的隐私泄露问题也受到了学术界的广泛关注,大量基于同态加密、安全多方计算、差分隐私、匿名化等技术的隐私保护方案被相继提出。但是,现有的大多数互联网服务隐私保护方案并未考虑隐私保护效果和方案可用性相互制约的问题,在实现用户隐私保护的同时带来较大的计算和通信开销,难以满足互联网服务的实时性需求。因此,如何从方案的可用性和安全性两个维度对典型互联网服务进行需求分析,并在此基础上构造能效平衡的隐私保护方案,进而为用户提供安全高效的查询、预测、分析等服务,仍是互联网服务隐私保护方案构造所面临的挑战。本文针对互联网服务所面临的安全与隐私问题,选择联邦学习、智慧医疗和基于位置服务三种典型互联网服务场景开展研究,在对其安全需求以及服务特性进行分析的基础上,运用密码学、运算转化、机器学习等理论和方法,构造出系列安全高效的隐私保护方案,并从理论分析以及原型系统测试两方面对所提方案的正确性、安全性以及高效性进行了验证。具体地,本文的主要研究内容包括以下三个方面。1)联邦学习中的高效隐私保护技术在联邦学习中的高效隐私保护方面,本文围绕线性回归、岭回归、逻辑回归等三种回归模型开展研究。首先,针对逻辑回归中存在的指数运算,通过泰勒展开将其转换成为线性运算。在此基础上,通过对三种回归模型进行分析,提出了针对回归训练的数据预处理机制,实现了数据源与服务器仅需进行一次交互即可完成分布式回归模型的训练。此外,基于密钥拆分技术对Paillier同态加密算法进行了改进,提出了安全多方数据聚合算法,构造了隐私保护的非交互式回归模型联邦学习方案。所提方案能够保证分布式回归模型训练过程中本地训练数据的安全性,通过详细的安全性分析以及在真实数据集下的仿真测试,验证了所提方案的有效性和高效性。2)智慧医疗服务中的高效隐私保护方案在智慧医疗服务中的高效隐私保护方面,本文围绕基于朴素贝叶斯的疾病风险评估和基于Skyline计算的诊断模型融合开展研究。其中,针对朴素贝叶斯诊断模型训练以及疾病风险评估,一方面,基于所提出的数据安全聚合算法,构造了隐私保护的分布式诊断模型训练方案。另一方面,通过将数据预测操作转化为向量内积运算,并借助安全两方向量内积协议构造了安全疾病风险评估算法,实现了涵盖诊断模型训练以及风险评估全流程的高效隐私保护;针对Skyline诊断模型融合,将秘密分享技术与Paillier同态加密进行了结合,提出了分布式数值安全比较算法,进而构造了隐私保护的多方Skyline模型协同训练方案,实现了多方Skyline诊断模型的安全高效融合。通过详细的安全性分析以及在真实数据集下的仿真测试,验证了所提方案的有效性和高效性。3)基于位置服务中的高效隐私保护方案在基于位置服务中的高效隐私保护方面,本文围绕社交网络中的好友位置查询和在线打车服务开展研究。其中,针对社交网络好友位置查询,首先将多边形范围查询和圆形范围查询转换成为向量内积计算;之后,基于安全两方向量内积计算协议构造了安全空间范围查询算法,进而形成了高效隐私保护的好友模糊位置查询方案,能够有效保护查询用户空间查询坐标以及好友精确位置的安全性;针对在线打车服务,基于提出的安全范围查询算法,设计了车辆用户与打车用户安全匹配策略,并通过引入四叉树数据结构大幅提升了匹配效率,实现了在线打车服务中打车用户、车辆用户以及服务提供商敏感数据的高效隐私保护。通过搭建原型系统进行测试,充分验证了所提方案的安全性和高效性。