检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
为什么我的计算结果每次计算时结果都不一样? 当空间开启了“结果差分隐私”开关时, 对敏感数据字段的sum操作都会添加一个差分噪声,来保护单条敏感数据不被泄露。 如果需要更精确的结果, 可联系空间管理员关闭“结果差分隐私”开关, 或者联系敏感字段的合作方修改字段分类。
一个CCE集群可以为同一用户的多个空间使用吗? TICS计算节点支持部署到CCE集群上。但当前在购买TICS服务时仅支持直接创建CCE集群,不支持选择已有的CCE集群。 因此一个CCE集群只能供一个空间使用,且必须是随TICS服务购买时直接创建的CCE集群,不能是已有集群。 CC
发布数据集 企业A和企业B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集,并单击“发布”。 以企业A为例,数据集信息如下: 隐私求交场景需要将求交的字段设置为“非敏感”的唯一标识。 父主题: 隐私求交黑名单共享场景
创建实时隐匿查询作业 实时隐匿查询作业需要由数据查询方创建作业,企业A单击“作业管理 > 隐匿查询 > 实时隐匿查询”页面的创建按钮,填写相关信息,例如: 其中“不可区分度”即为实时隐匿查询的安全级别,不可区分度越高,则安全级别越高,但查询的速度会变慢,传输的数据量也会变大。 企
查询联邦学习作业列表 功能介绍 查询联邦学习作业列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/fl-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
新建联邦学习作业 功能介绍 新建联邦学习作业 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/leagues/{league_id}/fl-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,最大32位,由字母和数字组成
删除联邦学习作业 功能介绍 删除联邦学习作业 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/leagues/{league_id}/fl-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
查询作业的历史实例列表 功能介绍 查询作业的历史实例列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/job-instances 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
统计型作业的差分隐私保护 本示例作业,以统计各行业的“企业税收总和”与“用电量总和”,进行统计分析: Select industry, sum(tax_bal), sum(electric_bal) from LEAGUE_CREATOR.tax a join
模型评估 训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算
场景描述 某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
执行纵向联邦分箱和IV计算作业 功能介绍 执行纵向联邦分箱和IV计算作业 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/leagues/{league_id}/fl-vertical-jobs/{job_id}/ivcalculate 表1
乳腺癌数据集作业结果 本节实验包含了如下三个部分:(1)训练轮数对联邦学习模型分类性能的影响;(2)迭代次数对联邦学习模型分类性能的影响;(3)参与方数据量不同时,本地独立训练对比横向联邦的模型性能。 不同训练参数对模型准确率、训练时长的影响 训练轮数对模型准确率的影响(迭代次数固定为20)
获取多方安全计算作业详情 功能介绍 获取多方安全计算作业详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/sql-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询联邦预测作业列表 功能介绍 查询联邦预测作业列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/fl-predicted-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询训练作业下的成功模型 功能介绍 查询训练作业下的成功模型 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/fl-job-instances 表1 路径参数 参数 是否必选 参数类型 描述 project_id
阶段四:基本计算能力验证 验证TICS的基础计算能力,以计算各企业在2021年的价值评分,用于评估信贷能力,其中的公式仅为简单的参考计算式。 前提条件 完成审批防护。 操作步骤 执行如下的sql作业。 select c.id as `企业id`, 0.5 * a.tax_bal
训练型横向联邦作业流程 联邦学习分为横向联邦及纵向联邦。相同行业间,特征一致,数据主体不同,采用横向联邦。不同行业间,数据主体一致,特征不同,采用纵向联邦。xx医院的应用场景为不同主体的相同特征建模,因此选用横向联邦。 创建训练型横向联邦学习作业。 图1 创建训练型横向联邦学习作业