检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
场景描述 某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算法模型,后续文档会介绍
场景描述 有效的风险控制能够消灭或减少风险事件发生的各种可能性,或减少风险事件发生时造成的损失,对于企业具有重要意义。现阶段,企业级的单方风控体系已逐步建立,在机构内数据统一共享的基础上实现了覆盖业务前、中、后各环节的智能风控。然而,单方数据风控面临存在数据不全面、风控不及时的问
创建可信联邦学习作业 联邦建模的过程由企业A来操作,在“作业管理 > 可信联邦学习”页面单击“创建”,填写作业名称并选择算法类型后单击确定即进入联邦建模作业界面。本文逻辑回归算法为例。 父主题: 使用TICS可信联邦学习进行联邦建模
执行样本分布联合统计 企业A单击“执行”并等待一段时间之后,可以在页面下方“执行结果”看到sql的运行结果。 也可以通过“作业管理 > 多方安全计算 > 历史作业 > 查看结果”查看对应的结果。 父主题: 使用TICS多方安全计算进行联合样本分布统计
横向联邦学习场景 TICS从UCI网站上获取了乳腺癌数据集Breast,进行横向联邦学习实验场景的功能介绍。 乳腺癌数据集:基于医学图像中提取的若干特征,判断癌症是良性还是恶性,数据来源于公开数据Breast Cancer Wisconsin (Diagnostic)。 场景描述
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
是否开启bcs审计 bcs_endpoint String bcs浏览器地址 error_msg String 互信失败错误信息 请求示例 可信计算节点详情展示 get https://x.x.x.x:12345/v1/agents 响应示例 状态码: 200 可信计算节点详情 { "trusted"
前往计算节点 进入计算节点管理界面后,选择左侧“实例管理”。 实例管理页面上方展示了计算节点资源使用概况,分别为当前节点的多方安全计算和可信联邦学习的CPU资源当前使用量,并每分钟刷新一次。下方列表默认优先展示失败状态的实例,可通过列表调整按照执行时间排序,并支持以下筛选条件: 实例ID:全匹配或前N位模糊匹配
模型训练 企业A在完成特征选择后,可以单击右下角的“启动训练”按钮,配置训练的超参数并开始训练。 等待训练完成后就可以看到训练出的模型指标。 模型训练完成后如果指标不理想可以重复调整7、8两步的所选特征和超参数,直至训练出满意的模型。 父主题: 使用TICS可信联邦学习进行联邦建模
59718b9b5d03 4ec9599fc203d176a301536c2e091a19 至此,企业A可以得知这些用户存在于企业B的黑名单当中,这些用户的业务存在较高的风险。企业A可以提前做好风险预案,控制风险的发生或者减少风险造成的损失。 父主题: 隐私求交黑名单共享场景
支持按月或按年购买。 自动续费 - 支持自动续费。 按月购买时,自动续费周期为1个月。 按年购买时,自动续费周期为1年。 版本类型 企业版 当前可选版本只包含企业版 计算节点配置相关参数 计算节点名称 - 计算节点别名,由用户自定义,用以区分部署的各个计算节点。要求:名称不能以空白字符开头或结尾,也不能包含下列特殊字符:\
支持按月或按年购买。 自动续费 - 支持自动续费。 按月购买时,自动续费周期为1个月。 按年购买时,自动续费周期为1年。 版本类型 企业版 当前可选版本只包含企业版 计算节点配置相关参数 计算节点名称 - 计算节点别名,由用户自定义,用以区分部署的各个计算节点。要求:名称不能以空白字符开头或结尾,也不能包含下列特殊字符:\
大数据厂商B在自己的计算节点单击“审批管理”模块,找到“待处理”的审批请求单击“查看详情”,可以看到企业A是如何使用自己的数据集的。 确认无误后再单击“同意”即允许企业A使用己方的数据集进行联合统计。 此时企业A在自己的计算节点上可以看到这个样本分布联合统计作业的状态已经变为了审批通过,“执行”按钮已经亮起。
在返回最终统计结果前,增加了一个差分隐私计算的任务节点,如图3所示。 图3 差分隐私计算任务节点 再执行如下sql,sql中过滤掉了某个企业,试图用差值去计算这个企业的税收值。 Select industry, sum(tax_bal), sum(electric_bal) from
新建作业 在弹出的界面,继续配置可信联邦学习作业的参数,参数配置参考表1。 图3 配置参数 “数据集配置”的“可选数据列表”: 本地运行环境时,展示的是通过本地连接器发布的本地数据。 “评估型作业”只能选择当前计算节点的一个数据集。 表1 作业参数说明 参数名 参数描述 作业名称 用户
对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。 假设您有如下数据集(只展示部分数据),由于数据不够完整,如job、gender等字段均存在一定程度的缺失。为了不让机器理解形成偏差、以达到机器学习的使用标准,需要基
数据集注册管理 数据集列表展示 创建或更新数据集 批量删除数据集 发布数据集到空间 获取数据详情 父主题: 计算节点API