检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
"result_ext" : "" } 状态码 状态码 描述 200 查询执行结果成功 401 操作无权限 500 内部服务器错误 父主题: 可信联邦学习作业管理
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
lt_10为该线性模型的系数加上偏置项。 图2 查看模型结果文件 本地利用测试集评估模型。可以采用如下脚本,会打印出模型在测试集上的准确率和AUC两个指标。 图3 本地评估模型的Python脚本 父主题: 测试步骤
参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算法模型,后续文档会介绍如何使用已有的算法模型对新的数据进行预测。 父主题: 使用TICS可信联邦学习进行联邦建模
发起联邦预测 企业A单击“发起预测”按钮,选择己方和大数据厂商B的预测数据集,单击确定即可发起预测。 TICS服务会对两方的数据先进行样本对齐,并对双方共有的数据进行联邦预测,预测的结果会保存在企业A(作业发起方)的计算节点上。企业A可以通过obs服务或者登录到计算节点后台获取到对应路径的文件。
允许多合作方参与的结构化数据SQL分析作业。 可信联邦学习 允许多合作方参与的模型训练、评估作业。 联邦预测学习 允许多合作方参与的样本联合预测作业。 存储方式 指计算节点所属的CCE或IEF容器的工作负载,目前支持“OBS存储”和“主机存储”方式。“OBS存储”方式是将OBS服务中的路径映射到服务容器内的本
选择邀空间链邀请租户时选择的通道。 组织 选择链代码部署的组织。 单击下一步并提交订单,完成计算节点部署。 计算节点在不同时刻有以下7种状态:部署中,部署失败,启动中,运行中,删除中,删除失败,重启中。 可以在“?”标识处,查看部署计算节点的概要事件信息。 计算节点在部署完成后会向外访问如下地址,发送节点状态信息
选择“算法类型”之后,勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,再勾选”选择数据集”列表中参与方预测要用的某一数据集,最后单击“保存并提交审批”按钮完成作业创建。等审批方审批完后,就可以执行任务。 注意:选择的数据集中需要有样本id列,后面预测需要使用。 图2
config_file_path String 配置文件地址 auto_generate_data Boolean 是否自动生成数据,即纵向联邦学习样本对齐之后的流程是否使用样本对其结果自动过滤。 ext LocalDatasetExtEntity object 扩展信息,包含multihot配置信息
查询执行结果 功能介绍 查询学习类型作业执行结果 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/job-instances/{instance_id}/result 表1 路径参数 参数 是否必选 参数类型
UPLOAD_FILE_SIZE_LIMIT”和“TICS_AGENT_UPLOAD_FILE_DIR_SIZE_LIMIT”,单击操作栏中的“编辑”修改对应键值,即可修改上传文件和文件夹大小限制。 键值中的数值可自定义,支持MB和GB两种单位。 图11 修改键值 编辑键值后,单
“目的端点”参数值为“tics-agent”; “目的端点资源”参数值为“/”。 云租户部署参数 部署规格 中规格 中规格:适用百万级别数据多方安全计算,五十万内对齐样本联邦建模 大规格:适用千万级别数据多方安全计算,百万级别对齐样本联邦建模 虚拟私有云 - 选择合适的VPC 子网 - 选择合适的子网地址 NAT网关
批量预测 批量预测通过在计算节点后台发起离线预测任务的方式,在任务完成后可以获得指定数据集中所有样本的预测结果。 创建批量预测作业 编辑批量预测作业 执行批量预测作业 删除批量预测作业 父主题: 联邦预测作业
config_file_path 否 String 配置文件地址 auto_generate_data 否 Boolean 是否自动生成数据,即纵向联邦学习样本对齐之后的流程是否使用样本对其结果自动过滤。 ext 否 LocalDatasetExtEntity object 扩展信息,包含multihot配置
实时预测 实时预测通过在计算节点部署在线预测服务的方式,允许用户利用POST请求,在毫秒级时延内获取单个样本的预测结果。 创建实时预测作业 执行实时预测作业 删除实时预测作业 父主题: 联邦预测作业
“目的端点”参数值为“tics-agent”; “目的端点资源”参数值为“/”。 云租户部署参数 部署规格 中规格 中规格:适用百万级别数据多方安全计算,五十万内对齐样本联邦建模 大规格:适用千万级别数据多方安全计算,百万级别对齐样本联邦建模 虚拟私有云 - 选择合适的VPC 子网 - 选择合适的子网地址 NAT网关
政府数据融合共治 金融联合营销 传统金融企业联合营销模式中,金融企业往往需要将双方的数据集中到一个安全实验室中进行标签融合,模型训练,但常面临数据泄露和隐私等挑战。联邦建模采用分布式架构进行部署和建模,参与联合营销的企业原始和明细数据不出库的前提下进行跨域数据建模,实现精准营销,同时保障企业数据安全与个人隐私。
“目的端点”参数值为“tics-agent”; “目的端点资源”参数值为“/”。 云租户部署参数 部署规格 中规格 中规格:适用百万级别数据多方安全计算,五十万内对齐样本联邦建模 大规格:适用千万级别数据多方安全计算,百万级别对齐样本联邦建模 虚拟私有云 - 选择合适的VPC 子网 - 选择合适的子网地址 NAT网关