检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
场景描述 某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。 父主题: 使用TICS多方安全计算进行联合样本分布统计
中端到端的安全和可审计,推动了跨行业的可信数据融合和协同。 在调用可信智能计算服务TICS API之前,请确保已经充分了解可信智能计算服务TICS相关概念,详细信息请参见产品介绍。 TICS的API可以分为空间API和计算节点API。 使用空间API可以查询TICS空间的相关信息
响训练出来的模型。 例如这里大数据厂商提供的f4特征iv值是0,说明这个特征对于标签的识别没有区分度,可以不选用;而f0、f2特征的iv值中等,适合作为模型的训练特征。 根据计算得出的iv值,企业A调整了训练使用的特征,没有选用双方提供的特征全集,去掉了部分iv值较低的特征,减少了无用的计算消耗。
使用TICS可信联邦学习进行联邦建模 场景描述 准备数据 发布数据集 创建可信联邦学习作业 选择数据 样本对齐 筛选特征 模型训练 模型评估 父主题: 纵向联邦建模场景
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
企业A在完成特征选择后,可以单击右下角的“启动训练”按钮,配置训练的超参数并开始训练。 等待训练完成后就可以看到训练出的模型指标。 模型训练完成后如果指标不理想可以重复调整7、8两步的所选特征和超参数,直至训练出满意的模型。 父主题: 使用TICS可信联邦学习进行联邦建模
样本对齐 单击右下角的下一步进入“样本对齐”页面,这一步是为了进行样本的碰撞,过滤出共有的数据交集,作为后续步骤的输入。企业A需要选择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模
使用TICS联邦预测进行新数据离线预测 场景描述 准备数据 发布数据集 创建联邦预测作业 发起联邦预测 父主题: 纵向联邦建模场景
至此,企业A完成了整个TICS联邦建模的流程,并将模型应用到了营销业务当中。这个预测作业可以作为后续持续预测的依据,企业A可以定期地使用模型预测自己的新业务数据。同时企业A也可以根据新积累的数据训练出新的模型,进一步优化模型预测的精确率,再创建新的联邦预测作业,产出更精准的预测结果供业务使用。 父主题: 使用TICS联邦预测进行新数据离线预测
企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
验sql语句中字段的使用方式,如有违反字段隐私配置规则的语句会被明确拒绝。 大数据厂商B在自己的计算节点单击“审批管理”模块,找到“待处理”的审批请求单击“查看详情”,可以看到企业A是如何使用自己的数据集的。 确认无误后再单击“同意”即允许企业A使用己方的数据集进行联合统计。 此
创建可信联邦学习作业 联邦建模的过程由企业A来操作,在“作业管理 > 可信联邦学习”页面单击“创建”,填写作业名称并选择算法类型后单击确定即进入联邦建模作业界面。本文逻辑回归算法为例。 父主题: 使用TICS可信联邦学习进行联邦建模
使用TICS多方安全计算进行联合样本分布统计 场景描述 准备数据 发布数据集 创建样本分布统计作业 执行样本分布联合统计 数据优化 父主题: 纵向联邦建模场景
单击返回文件系统列表,系统显示创建过程。 图6 创建过程 当状态显示“可用”,SFS_Turbo创建成功。 图7 创建成功 创建完成之后,单击文件系统的名称,跳转到基本信息页面,可查看文件系统的名称、ID、路径、容量以及网络等相关信息,单击ID后面的复制按钮,即可拿到所创建的SFS_Turbo文件系统的ID。
企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS多方安全计算进行联合样本分布统计
Transfer)风格API,支持您通过HTTPS请求调用。 空间API的调用方法与其他云服务接口调用方法类似,依赖服务终端节点Endpoint,但不支持AK/SK鉴权认证。详情请参见构造请求。 计算节点API接口调用方法有所不同,不依赖Endpoint,而是依赖计算节点 所在虚机的IP地址及开放端口,且不支持AK/SK鉴权认证。详情请参见构造请求。
执行样本分布联合统计 企业A单击“执行”并等待一段时间之后,可以在页面下方“执行结果”看到sql的运行结果。 也可以通过“作业管理 > 多方安全计算 > 历史作业 > 查看结果”查看对应的结果。 父主题: 使用TICS多方安全计算进行联合样本分布统计
项目ID可以通过调用IAM服务的查询指定条件下的项目信息API获取,接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可参考IAM文档获取。 响应示例如下,其中projects下的“id”即为项目ID。当返回
数据拥有方公司A同意数据需求方公司B的数据使用申请后,可以由公司A创建合约,合约是需要双方同意的数据使用证明。 合约内容包括:合约名称、合约描述、数据信息、公司B的访问需求、访问限制和自定义限制。其中数据信息、公司B的访问需求来自于公司B的数据使用申请,合约名称、合约描述、访问限制和自定义限制由公司A在创建合约时定义。