检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
乳腺癌数据集作业结果 本节实验包含了如下三个部分:(1)训练轮数对联邦学习模型分类性能的影响;(2)迭代次数对联邦学习模型分类性能的影响;(3)参与方数据量不同时,本地独立训练对比横向联邦的模型性能。 不同训练参数对模型准确率、训练时长的影响 训练轮数对模型准确率的影响(迭代次数固定为20)
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练
模型训练 企业A在完成特征选择后,可以单击右下角的“启动训练”按钮,配置训练的超参数并开始训练。 等待训练完成后就可以看到训练出的模型指标。 模型训练完成后如果指标不理想可以重复调整7、8两步的所选特征和超参数,直至训练出满意的模型。 父主题: 使用TICS可信联邦学习进行联邦建模
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
企业A单击“发起预测”按钮,选择己方和大数据厂商B的预测数据集,单击确定即可发起预测。 TICS服务会对两方的数据先进行样本对齐,并对双方共有的数据进行联邦预测,预测的结果会保存在企业A(作业发起方)的计算节点上。企业A可以通过obs服务或者登录到计算节点后台获取到对应路径的文件。 当只有一方提供特征时,预
阶段五:基于MPC算法的高安全级别计算 完成demo验证阶段,为提升数据保护级别,接入以纯密文的状态做计算的更高安全级别的数据,可以通过开启高隐私级别开关,提升空间安全级别。 图1 高隐私级别开关 再次单击作业,审批进行的同时敏感数据被进行了秘密分享加密。DAG图显示了“psi +
据提供方企业B发送一条审批信息。 企业B在自己的计算节点上可以单击“审批管理”,选择“待处理”的实时隐匿查询作业审批,可以看到自己的数据被如何使用。待企业B同意审批之后,企业A可以开始执行实时隐匿查询作业。 父主题: 外部数据共享
为什么空间详情中“作业执行统计”实例数与空间作业中实例数统计不一致? 空间作业中的实例数统计的是实例总个数,而空间详情中“作业执行统计”实例数统计全部实例的总执行次数,可能存在一个实例执行多轮的情况。所以两个实例数统计不一致也是很正常的。
创建联邦预测作业 企业A单击“联邦预测 > 批量预测 > 创建”按钮,进入联邦预测作业的创建页面。企业A需要通过“算法类型”、“训练作业”等筛选条件可以找到用于预测的模型,点选使用的模型后单击“确定”按钮即完成联邦预测作业的创建。 父主题: 使用TICS联邦预测进行新数据离线预测
的业务诉求。 根据前一篇文章,企业A已经通过可信联邦学习功能训练出了一个预测客户时候是高价值用户的模型。 本文主要介绍企业A和大数据厂商B如何通过已有的模型对新的业务数据进行预测。 父主题: 使用TICS联邦预测进行新数据离线预测
常用概念 合作方、参与方: 空间成员,有权使用空间中的数据,或者将自有数据发布到空间,供其他合作方受限使用。 计算节点 部署在参与方侧,是可信智能计算与合作方侧数据的桥梁,保障数据按照合作方意愿受限使用。 计算节点是管理参与方数据的最小单位。部署计算节点时需要指定空间配置信息。在
环境准备 开发环境简介 参考:获取认证信息 配置CCE服务 配置IEF服务 TICS服务委托授权 配置IEF高可用节点 购买TICS服务 部署计算节点 创建连接器
数据集发布 前提条件 完成数据准备工作。 操作步骤 进入TICS服务控制台。 在计算节点管理中,找到购买的计算节点,通过登录地址,进入计算节点控制台。 图1 前往计算节点 登录计算节点后,在下图所述位置新建连接器。 图2 新建连接器 输入正确的连接信息,建立数据源和计算节点之间的安全连接。
启用区块链审计服务(可选) 若您希望空间启用区块链服务(BCS)来审计任务信息,请仔细阅读本章节。 空间发起方需要根据基于CCE集群创建联盟链完成联盟链的创建过程。 “区块链类型”参数值需要选择“联盟链”,否则将影响后续操作。 发起方按照组建联盟链中“邀请成员”部分的描述,邀请参与方加入联盟链。
批量隐匿查询 隐匿查询,也称隐私信息检索,是指查询方隐藏被查询对象关键词或客户id信息,数据服务方提供匹配的查询结果却无法获知具体对应哪个查询对象。数据不出门且能计算,杜绝数据缓存的可能性。 例如查询方希望查询身份证id为“张三”的人信贷公式数据,发起了一个类似于SELECT salary