检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开发数据预处理作业 数据预处理通常被用于评估/训练作业场景。本文以使用训练数据训练预处理作业,然后再将预处理方法应用于评估/预测数据为例进行说明。 训练数据预处理作业 评估/预测数据预处理 前提条件 已提前准备好训练数据,和评估/预测数据。 数据预处理作业选择的结构化数据集(包括
FEATURE_SELECTION.特征选择,MODEL_TRAIN.模型训练,MODEL_EVALUATION.模型评估,MODEL_PREDICT.预测 learning_rate 否 String 纵向联邦算法学习率,最大长度16 label_dataset 否 String 标签数据集,最大长度100
实验结果 乳腺癌数据集作业结果 父主题: 横向联邦学习场景
FEATURE_SELECTION.特征选择,MODEL_TRAIN.模型训练,MODEL_EVALUATION.模型评估,MODEL_PREDICT.预测 learning_rate String 纵向联邦算法学习率,最大长度16 label_dataset String 标签数据集,最大长度100
f6d964d274" } 状态码 状态码 描述 200 执行样本对齐作业成功 401 操作无权限 500 内部服务器错误 父主题: 联邦学习作业管理
d964d274" } 状态码 状态码 描述 200 执行ID选取截断作业成功 401 操作无权限 500 内部服务器错误 父主题: 联邦学习作业管理
开任务详情,可以查看更详细的计算过程信息。 图7 作业计算过程信息详情(截图为多方安全计算作业示例,请以实际作业为准) 父主题: 可信联邦学习作业
"result_ext" : null } 状态码 状态码 描述 200 查询样本对齐结果成功 401 操作无权限 500 内部服务器错误 父主题: 联邦学习作业管理
"result_ext" : "" } 状态码 状态码 描述 200 查询执行结果成功 401 操作无权限 500 内部服务器错误 父主题: 可信联邦学习作业管理
reason”报错信息。 问题分析 该报错大概率是资源配额不足导致作业执行失败。 解决方案 如果是纵向联邦学习作业,您可以在该纵向联邦作业详情页面尝试新增内存配额和CPU配额,然后重新执行作业。 如果是横向联邦学习作业,您可以在该横向联邦作业详情页面尝试新增内存配额和CPU配额,然后保存、提交审批,等待审批通过后再重新执行作业。
源列表。同时,有敏感信息的数据,还可以单独设置隐私策略,并在发布到空间侧后对其他参与方生效,限制敏感信息的使用。 数据预处理使用场景:训练机器学习模型前,可通过转换函数将特征数据转换成更加适合算法模型的特征数据。 父主题: 管理数据
择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模
首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
参数类型 描述 predict_threshold 否 Float 预测阈值,最小值0,最大值1 learning_rate 否 Float 学习率,最小值0,最大值1 batch_size 否 Integer 批大小,最小值1 epoch 否 Integer 迭代次数,最小值1 tree_num
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
Task) 作业实例拆解出的更细粒度任务。 多方安全计算 允许多合作方参与的结构化数据SQL分析作业。 可信联邦学习 允许多合作方参与的模型训练、评估作业。 联邦预测学习 允许多合作方参与的样本联合预测作业。 存储方式 指计算节点所属的CCE或IEF容器的工作负载,目前支持“OBS
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
约束限制 避免作业名重复。 必须选择一个已有的FiBiNet模型才能创建实时预测作业。 实时预测作业必须选择训练FiBiNet模型的参与方计算节点发布的数据集。 创建训练模型时参数必须有"save_format": "SAVED_MODEL"。 创建联邦预测作业 实时预测作业在本
因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。 根据前一篇文章,企业A已经通过可信联邦学习功能训练出了一个预测客户时候是高价值用户的模型。 本文主