一种高效的非交互式隐私保护逻辑回归模型

TP309; 逻辑回归作为一种典型的机器学习算法,被广泛应用于医疗诊断、金融预测等领域.由于单个用户没有足够的样本构建高精度模型,传统的集中式训练则会导致隐私泄露,因此构建具有隐私保护的逻辑回归模型受到广泛关注.现有的要求用户和服务器之间进行交互的方案具有较高的计算成本和通信负担.提出一种高效的非交互式逻辑回归训练协议,利用具有良可分离结构的梯度更新公式,解耦样本数据和模型参数之间的计算耦合性,保证用户与服务器之间的单向单次传输性,即用户将本地数据整合并以秘密共享的方式上传给云服务器后即可离线.在训练阶段设计基于矩阵和向量运算的协议,保证服务器在每次迭代中使用固定的信息更新参数,降低计算成本和...

Full description

Saved in:
Bibliographic Details
Published in计算机工程 Vol. 49; no. 4; pp. 32 - 51
Main Authors 唐敏, 张宇浩, 邓国强
Format Journal Article
LanguageChinese
Published 桂林电子科技大学 数学与计算科学学院 广西高校数据分析与计算重点实验室,广西 桂林 541004 2023
Subjects
Online AccessGet full text
ISSN1000-3428
DOI10.19678/j.issn.1000-3428.0065549

Cover

More Information
Summary:TP309; 逻辑回归作为一种典型的机器学习算法,被广泛应用于医疗诊断、金融预测等领域.由于单个用户没有足够的样本构建高精度模型,传统的集中式训练则会导致隐私泄露,因此构建具有隐私保护的逻辑回归模型受到广泛关注.现有的要求用户和服务器之间进行交互的方案具有较高的计算成本和通信负担.提出一种高效的非交互式逻辑回归训练协议,利用具有良可分离结构的梯度更新公式,解耦样本数据和模型参数之间的计算耦合性,保证用户与服务器之间的单向单次传输性,即用户将本地数据整合并以秘密共享的方式上传给云服务器后即可离线.在训练阶段设计基于矩阵和向量运算的协议,保证服务器在每次迭代中使用固定的信息更新参数,降低计算成本和通信开销.同时,基于协议的安全性分析和数值实验,在UCI库的4个真实数据集上训练逻辑回归模型,实验结果表明,在保证模型精度的前提下,与最新的隐私保护逻辑回归方案VANE相比,该回归模型效率提升了80~120倍,且训练时间与明文域相近.
ISSN:1000-3428
DOI:10.19678/j.issn.1000-3428.0065549