检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
216 从上面两张表可以看出: (1)训练轮数对于联邦学习模型的性能影响不大,这主要是由于乳腺癌数据集的分类相对简单,且数据集经过了扩充导致的; (2)增大每个参与方本地模型训练的迭代次数,可以显著提升最终联邦学习模型的性能。 参与方数据量不同时,独立训练对比横向联邦训练的准确率 本节
(label)配置为字段类型:INTEGER,字段类别:标签。 图3 配置数据集参数 发布数据集。 图4 发布数据集 数据集发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。 父主题: 测试步骤
创建数据预处理作业 数据预处理是训练机器学习模型的一个重要前置步骤,其主要是通过转换函数将特征数据转换成更加适合算法模型的特征数据过程。TICS特征预处理功能能够实现对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。
为什么我的计算结果每次计算时结果都不一样? 当空间开启了“结果差分隐私”开关时, 对敏感数据字段的sum操作都会添加一个差分噪声,来保护单条敏感数据不被泄露。 如果需要更精确的结果, 可联系空间管理员关闭“结果差分隐私”开关, 或者联系敏感字段的合作方修改字段分类。
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
目前,纵向联邦学习支持“XGBoost”、“逻辑回归”、“FiBiNET”三种算法类型,XGBoost支持“分类”和“回归”两种任务类型。 图2 新建作业 在弹出的界面进行数据选择,选择两方数据集作为整个作业的数据集,必须选择一个当前代理的数据集,另一个数据集可以来自空间中的
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
状态码: 200 新建联邦学习作业成功 { "job_id" : "c098faeb38384be8932539bb6fbc28d3" } 状态码 状态码 描述 200 新建联邦学习作业成功 401 操作无权限 500 内部服务器错误 父主题: 可信联邦学习作业管理
横向联邦学习场景 TICS从UCI网站上获取了乳腺癌数据集Breast,进行横向联邦学习实验场景的功能介绍。 乳腺癌数据集:基于医学图像中提取的若干特征,判断癌症是良性还是恶性,数据来源于公开数据Breast Cancer Wisconsin (Diagnostic)。 场景描述
当计算节点执行横向联邦训练型作业时,若执行脚本中包含恶意行为,包含但不限于非授权访问其他作业数据、篡改文件和配置、恶意消耗容器资源等场景时,会影响到数据提供方的计算环境安全以及其他学习作业的正常执行。 针对该问题,在边缘节点部署场景中,TICS通过构建Python安全沙箱来单独运行横向联邦作业,做到作业运行的安全隔离。
征的多行样本进行可信联邦学习,联合建模。 模型评估 评估训练得出的模型权重在某一数据集上的预测输出效果。 纵向联邦机器学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的情况,联合多个参与者的共同样本的不同数据特征进行可信联邦学习,联合建模。 概念术语
删除联邦学习作业 功能介绍 删除联邦学习作业 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/leagues/{league_id}/fl-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
ague_id}/fl-jobs/{job_id} 保存横向联邦学习作业 响应示例 无 状态码 状态码 描述 200 保存横向联邦学习作业成功 401 操作无权限 500 内部服务器错误 父主题: 可信联邦学习作业管理
String 作业名称 job_type String 作业类型。SQL联合SQL分析,HFL横向联邦学习,VFL纵向联邦学习,PREDICT预测,DATA_EXCHANGE数据交换 learning_task_type String 纵向联邦任务类型。CLASSIFICATION分类,REGRESSION拟合
空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考发布数据。 参与方的计算节点如果是采用云租户部署,并且使用子账号进行创建的,需要参考配置CCE集群子账号权限。 创建可信联邦学习训练型作业 用户登录进入计算节点页面。
创建可信联邦学习作业 联邦建模的过程由企业A来操作,在“作业管理 > 可信联邦学习”页面单击“创建”,填写作业名称并选择算法类型后单击确定即进入联邦建模作业界面。本文逻辑回归算法为例。 父主题: 使用TICS可信联邦学习进行联邦建模
获取横向联邦学习作业详情 功能介绍 获取横向联邦学习作业详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/fl-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
执行横向联邦学习作业 功能介绍 执行横向联邦学习作业 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/leagues/{league_id}/fl-jobs/{job_id}/execute 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询联邦学习作业列表 功能介绍 查询联邦学习作业列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/fl-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String