检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
横向联邦机器学习,适用于参与者的数据特征重叠较多,而样本ID重叠较少的情况,联合多个参与者的具有相同特征的多行样本进行联邦机器学习,联合建模。 模型评估 评估训练得出的模型权重在某一数据集上的预测输出效果。 纵向联邦机器学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的
批量预测 批量预测通过在计算节点后台发起离线预测任务的方式,在任务完成后可以获得指定数据集中所有样本的预测结果。 创建批量预测作业 编辑批量预测作业 执行批量预测作业 删除批量预测作业 父主题: 联邦预测作业
能选择,IEF计算节点只能选择LOCAL。 执行脚本 用户本地的自定义执行脚本,样例请参考准备本地横向联邦数据资源中步骤4。 训练模型 用户自定义模型,样例请参考准备本地横向联邦数据资源中步骤3。 初始权重参数 评估时必填,训练时可选,样例请参考准备本地横向联邦数据资源中步骤3。
建子项目,并在子项目中创建资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 父主题: 使用前必读
数据选择,SAMPLE_ALIGNMENT.样本对齐,FEATURE_SELECTION.特征选择,MODEL_TRAIN.模型训练,MODEL_EVALUATION.模型评估,MODEL_PREDICT.预测 learning_rate String 纵向联邦算法学习率,最大长度16 label_dataset
数据选择,SAMPLE_ALIGNMENT.样本对齐,FEATURE_SELECTION.特征选择,MODEL_TRAIN.模型训练,MODEL_EVALUATION.模型评估,MODEL_PREDICT.预测 learning_rate 否 String 纵向联邦算法学习率,最大长度16
运维管理。 可信联邦学习 对接主流深度学习框架实现横向和纵向的联邦训练,支持基于安全密码学(如不经意传输、差分隐私等)的多方样本对齐和训练模型的保护。 数据使用监管 为数据参与方提供可视化的数据使用流图,提供插件化的区块链对接存储,实现使用过程的可审计、可追溯。 容器化部署 容器
Iris-virginica 准备模型文件/初始权重(作业发起方) 作业发起方需要提供模型、初始权重(非必须),上传到Agent1的挂载目录下并使用命令chown -R 1000:1000 /tmp/tics1/修改挂载目录下的文件的属主和组。 使用python代码创建模型文件,保存为二进制文件model
VerticalFlExternalParam object 纵向联邦的其他参数。 model_param 是 ModelParamVo object 纵向联邦的模型参数。 表4 DatasetFeatureEntity 参数 是否必选 参数类型 描述 agent_id 是 String 数据集所属agent
String 纵向联邦作业类型,CLASSIFICATION(1),REGRESSION(2) job_instance_id 否 String 模型ID,最大32位,由字母和数字组成 train_label_agent 否 String 标签方可信计算节点,最大32位,由字母和数字组成
instance Task) 作业实例拆解出的更细粒度任务。 多方安全计算 允许多合作方参与的结构化数据SQL分析作业。 可信联邦学习 允许多合作方参与的模型训练、评估作业。 联邦预测学习 允许多合作方参与的样本联合预测作业。 存储方式 指计算节点所属的CCE或IEF容器的工作负载,目前支持“O
发起方agent别名,最大长度128 boot_file_url 是 String 训练脚本路径,最大长度512 model_file_url 是 String 模型路径,最大长度512 engine_id 否 String 引擎id,最大长度50 spec_id 否 String 资源规格id,最大长度50
互信状态,“true”表示互信,“false”表示不互信 status String 节点状态,“ONLINE”表示节点在线,“OFFLINE”表示节点离线。 agent_id String 可信计算节点id agent_name String 可信计算节点名称 project_id String
发起方可信计算节点名称,最大长度128 boot_file_url String 训练脚本路径,最大长度512 model_file_url String 模型路径,最大长度512 engine_id String 引擎id,最大长度50 spec_id String 资源规格id,最大长度50 initial_weight_url
状态”为“在线”时,触发单击下线,计算节点会切换成离线状态,180秒后空间其他参与方无法使用该计算节点已发布的数据集运行作业。 用户想要加入空间,想被其他参与方使用自己的数据时,可以手动触发计算节点上线。即“计算节点状态”为“离线”时,触发单击上线,计算节点会切换成上线状态,90
String 参与方信息,最大长度128 is_single_predict Boolean 单方还是双方预测 metrics String 联邦学习模型评估指标 请求示例 查询作业的历史实例列表 get https://x.x.x.x:12345/v1/{project_id}/leagu
分布图。 图4 描述性统计 执行预处理。单击列表字段后的添加预处理方法,系统将利用所选的预处理方法(转换函数)将特征数据转换成更加适合算法模型的特征数据。当前TICS支持的特征预处理方法如表1所示。对于一个字段,可以添加多种预处理方法,并且建议按照如下处理顺序进行编排: 连续型字
GER聚合器管理节点,SERVER控制节点 ne_status String 网元状态。INIT初始化,UNKNOWN未知,OFFLINE离线,ONLINE在线,FAULT故障,TRUSTING互信中,TRUST已互信 node_id String 节点id node_name String
阶段三:审批防护 开启审批防护功能 前提条件 完成隐私规则防护。 操作步骤 敏感数据被查询时,可以在审批详情中,看到是否使查询敏感数据的结果可见,可由该提供方进行识别,并进行拒绝操作。 图1 审批详情 在审批详情中也可看到两个字段相加的情况,如下图所示。 图2 字段相加 通过查看
阶段二:隐私规则防护 使用TICS的隐私规则防护能力确保数据安全。 前提条件 完成数据发布。 操作步骤 进入多方安全计算的作业执行界面,单击创建。 图1 创建作业 在作业界面中,按照1~4提供的案例和SQL语句进行作业测试。 图2 作业界面 假设有人输入以下代码试图直接查询敏感数据。