检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
金融联合营销 传统金融企业联合营销模式中,金融企业往往需要将双方的数据集中到一个安全实验室中进行标签融合,模型训练,但常面临数据泄露和隐私等挑战。联邦建模采用分布式架构进行部署和建模,参与联合营销的企业原始和明细数据不出库的前提下进行跨域数据建模,实现精准营销,同时保障企业数据安全与个人隐私。
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算法模型,后续文档会介绍
"column_name" : "credit_no", "data_type" : "STRING", "comments" : "企业号(企业社会信用代码)", "sql_col_privacy_type" : "NON_SENSITIVE", "privacy_policy"
执行样本分布联合统计 企业A单击“执行”并等待一段时间之后,可以在页面下方“执行结果”看到sql的运行结果。 也可以通过“作业管理 > 多方安全计算 > 历史作业 > 查看结果”查看对应的结果。 父主题: 使用TICS多方安全计算进行联合样本分布统计
创建可信联邦学习作业 联邦建模的过程由企业A来操作,在“作业管理 > 可信联邦学习”页面单击“创建”,填写作业名称并选择算法类型后单击确定即进入联邦建模作业界面。本文逻辑回归算法为例。 父主题: 使用TICS可信联邦学习进行联邦建模
B。 user.task.memory.size:参与方计算节点分配的作业最大内存。 tics.task.memory.size:TICS平台计算节点作业分配的作业最大内存。 具体使用哪个参数,作业结果界面会给出相应提示。 图3 设置参数
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
模型训练 企业A在完成特征选择后,可以单击右下角的“启动训练”按钮,配置训练的超参数并开始训练。 等待训练完成后就可以看到训练出的模型指标。 模型训练完成后如果指标不理想可以重复调整7、8两步的所选特征和超参数,直至训练出满意的模型。 父主题: 使用TICS可信联邦学习进行联邦建模
样本对齐 单击右下角的下一步进入“样本对齐”页面,这一步是为了进行样本的碰撞,过滤出共有的数据交集,作为后续步骤的输入。企业A需要选择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模
使用和监管。空间是联邦计算的载体,合作方只有加入空间才能参与联邦计算。 安全的作业管理 作业时,数据使用的过程可审计、可追溯。TICS数据集成支持多方安全计算、可信联邦学习和联邦预测作业等作业方式。 多方安全计算 多方安全计算是可信智能计算提供的关系型数据安全共享和分析功能,曾经
nt_power上发布。 表1 企业税收和资助金情况表tax 列名 含义 字段分类 Id 企业id 唯一标识 tax_bal 税收 敏感 Industry 行业类型 不敏感 表2 企业政府资助金数据表support 列名 含义 字段分类 Id 企业id 唯一标识 supp_bal
59718b9b5d03 4ec9599fc203d176a301536c2e091a19 至此,企业A可以得知这些用户存在于企业B的黑名单当中,这些用户的业务存在较高的风险。企业A可以提前做好风险预案,控制风险的发生或者减少风险造成的损失。 父主题: 隐私求交黑名单共享场景
大数据厂商B在自己的计算节点单击“审批管理”模块,找到“待处理”的审批请求单击“查看详情”,可以看到企业A是如何使用自己的数据集的。 确认无误后再单击“同意”即允许企业A使用己方的数据集进行联合统计。 此时企业A在自己的计算节点上可以看到这个样本分布联合统计作业的状态已经变为了审批通过,“执行”按钮已经亮起。
在返回最终统计结果前,增加了一个差分隐私计算的任务节点,如图3所示。 图3 差分隐私计算任务节点 再执行如下sql,sql中过滤掉了某个企业,试图用差值去计算这个企业的税收值。 Select industry, sum(tax_bal), sum(electric_bal) from
String fl作业类型枚举。TRAIN(训练),EVALUATE(评估)。 hfl_platform_type 否 String 联邦学习运行平台枚举值。LOCAL(本地),MODEL_ARTS(modelarts) agent_id 是 String 作业发起可信计算节点id,最大32位,由字母和数字组成
hfl_type 是 String fl作业类型枚举。TRAIN,EVALUATE。 hfl_platform_type 是 String 联邦学习运行平台枚举值。LOCAL,MODEL_ARTS host_agent_id 是 String 发起方agent id,最大长度32 host_agent_name
hfl_type String fl作业类型枚举。TRAIN, EVALUATE hfl_platform_type String 联邦学习运行平台枚举值。LOCAL,MODEL_ARTS host_agent_id String 发起方agent id,最大32位,由字母和数字组成 host_agent_name
[ "1bd73bb795094859bbead5f1b6abcfa8" ] } 响应示例 无 状态码 状态码 描述 200 删除数据集成功 401 操作无权限 500 内部服务器错误 父主题: 数据集注册管理
String fl作业类型枚举。1.TRAIN训练,2.EVALUATE评估 hfl_platform_type String 联邦学习运行平台枚举值。LOCAL,MODEL_ARTS learning_rate String 纵向联邦算法学习率 algorithm_type String