检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
删除作业 删除可信联邦学习作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 可信联邦学习”,打开可信联邦学习作业页面。 在“可信联邦学习”页面,查找待删除的作业,单击“删除”。 删除操作无法撤销,请谨慎操作。 图1 删除作业 父主题: 可信联邦学习作业
联邦学习作业管理 查询联邦学习作业列表 父主题: 空间API
联邦学习作业管理 执行ID选取截断 执行纵向联邦分箱和IV计算作业 执行样本对齐 查询样本对齐结果 父主题: 计算节点API
共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。 根据前一篇文章,企业A已经通过可信联邦学习功能训练出了一个预测客户时候是高价值用户的模型。 本文主要介绍企业A和大数据
LR纵向联邦学习主要用于具有线性边界的二分类问题,支持用户双方训练联合逻辑回归(LR)模型。相较于单方训练,纵向联邦LR训练覆盖用户双方特征,模型预测精度更高。TICS采用SEAL同态加密确保双方数据交互安全,通过批处理技术进一步提升联邦训练性能。 公测 创建纵向联邦学习作业 2 样本对齐支持PSI算法
开发数据预处理作业 数据预处理通常被用于评估/训练作业场景。本文以使用训练数据训练预处理作业,然后再将预处理方法应用于评估/预测数据为例进行说明。 训练数据预处理作业 评估/预测数据预处理 前提条件 已提前准备好训练数据,和评估/预测数据。 数据预处理作业选择的结构化数据集(包括
征的多行样本进行联邦机器学习,联合建模。 模型评估 评估训练得出的模型权重在某一数据集上的预测输出效果。 纵向联邦机器学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的情况,联合多个参与者的共同样本的不同数据特征进行联邦机器学习,联合建模。 已发布区域:北京四、北京二
实验结果 乳腺癌数据集作业结果 父主题: 横向联邦学习场景
learning_rate 否 Float 学习率,最小值0,最大值1 batch_size 否 Integer 批大小,最小值1 epoch 否 Integer 迭代次数,最小值1 tree_num 否 Integer 树数量,最小值1 tree_depth 否 Integer 树深度,最小值1 split_num
两个配额参数的值为创建新容器的CPU核数和内存大小,默认CPU核数为1,内存大小512M。 然后勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,最后单击“确定”按钮完成作业创建。 参数配置完成后,单击确认,完成批量预测任务的创建。 父主题: 批量预测
f6d964d274" } 状态码 状态码 描述 200 执行样本对齐作业成功 401 操作无权限 500 内部服务器错误 父主题: 联邦学习作业管理
开任务详情,可以查看更详细的计算过程信息。 图7 作业计算过程信息详情(截图为多方安全计算作业示例,请以实际作业为准) 父主题: 可信联邦学习作业
"result_ext" : null } 状态码 状态码 描述 200 查询样本对齐结果成功 401 操作无权限 500 内部服务器错误 父主题: 联邦学习作业管理
d964d274" } 状态码 状态码 描述 200 执行ID选取截断作业成功 401 操作无权限 500 内部服务器错误 父主题: 联邦学习作业管理
"result_ext" : "" } 状态码 状态码 描述 200 查询执行结果成功 401 操作无权限 500 内部服务器错误 父主题: 可信联邦学习作业管理
reason”报错信息。 问题分析 该报错大概率是资源配额不足导致作业执行失败。 解决方案 如果是纵向联邦学习作业,您可以在该纵向联邦作业详情页面尝试新增内存配额和CPU配额,然后重新执行作业。 如果是横向联邦学习作业,您可以在该横向联邦作业详情页面尝试新增内存配额和CPU配额,然后保存、提交审批,等待审批通过后再重新执行作业。
的前提下,通过多方联合建模,金融机构补充了风控模型特征维度,提升模型准确率。 优势: 提升模型准确率 多方机构实现算法层面联合建模,提升了需求方模型的预测效果。 数据隐私保护强 多方采用隐私集合求交PSI对齐样本数据,本地数据或模型加密后在安全环境中运算,实现数据可用不可得。精细
择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模