两方参与的隐私保护岭回归方案与应用

大数据环境下, 同态加密可以有效解决机器学习中的隐私泄露问题. 本文利用 CKKS 同态加密技术, 设计了一种两方参与、基于密文域上带除法延迟的改进共轭梯度法的隐私保护岭回归方案, 参与模型训练的双方可以通过少量的交互, 在密文数据上高效地训练岭回归模型, 防止过程中有隐私被泄露; 分析了方案的安全性、计算以及通信复杂度, 基于 HEAAN 同态加密库利用 C++ 实现了该方案; 在公开数据集上验证了该方案, 实验证明所提方案可以安全高效地训练岭回归模型. 对于特征维度为 77, 样本个数为 4000 的 UCI 数据集 Twitter, 训练模型所需迭代次数仅为 16, 时间损耗为 127....

Full description

Saved in:

Bibliographic Details
Published in	Journal of Cryptologic Research Vol. 10; no. 2; p. 276
Main Authors	LYU You, Wen-Yuan, WU, 吕由, 吴文渊
Format	Journal Article
Language	Chinese
Published	Beijing Chinese Association for Cryptologic Research, Journal of Cryptologic Research 21.04.2023
Subjects	Algorithms Big Data C++ (programming language) Communication Conjugate gradient method Cost analysis Encryption Machine learning Privacy Regression models
Online Access	Get full text
ISSN	2097-4116
DOI	10.13868/j.cnki.jcr.000593

Cover

More Information
Summary:	大数据环境下, 同态加密可以有效解决机器学习中的隐私泄露问题. 本文利用 CKKS 同态加密技术, 设计了一种两方参与、基于密文域上带除法延迟的改进共轭梯度法的隐私保护岭回归方案, 参与模型训练的双方可以通过少量的交互, 在密文数据上高效地训练岭回归模型, 防止过程中有隐私被泄露; 分析了方案的安全性、计算以及通信复杂度, 基于 HEAAN 同态加密库利用 C++ 实现了该方案; 在公开数据集上验证了该方案, 实验证明所提方案可以安全高效地训练岭回归模型. 对于特征维度为 77, 样本个数为 4000 的 UCI 数据集 Twitter, 训练模型所需迭代次数仅为 16, 时间损耗为 127.5 s, 通信量为 41.87 MB, 密文域上带除法延迟的改进共轭梯度法收敛速度快, 模型训练效率高, 通信损耗小, 且在密文数据上的训练得到的模型参数与在明文数据上的计算结果相比误差不超过 0.001, 可以满足特定场景下的实际应用需求.
Bibliography:	ObjectType-Article-1 SourceType-Scholarly Journals-1 ObjectType-Feature-2 content type line 14
ISSN:	2097-4116
DOI:	10.13868/j.cnki.jcr.000593