检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
简介 背景信息 本案例以“小微企业信用评分”的场景为例。 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算
统计型作业的差分隐私保护 本示例作业,以统计各行业的“企业税收总和”与“用电量总和”,进行统计分析: Select industry, sum(tax_bal), sum(electric_bal) from LEAGUE_CREATOR.tax a join
模型评估 训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算法模型
应用场景 政企信用联合风控 金融机构对于中小微企业的信用数据通常不足,央行征信数据覆盖率有限,不良企业多家骗贷事件屡有发生。金融机构与政府部门,如税务部门、市场监管部门、水电公司等在保护各方原始数据隐私的前提下,通过多方联合建模,金融机构补充了风控模型特征维度,提升模型准确率。 优势
创建横向训练型作业 前提条件 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考发布数据。 参与方的计算节点如果是采用云租户部署
执行样本对齐 功能介绍 执行样本对齐 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/leagues/{league_id}/fl-vertical-jobs/{job_id}/sampleAlignment 表1 路径参数 参数 是否必选 参数类型
安全沙箱机制 背景 当计算节点执行横向联邦训练型作业时,若执行脚本中包含恶意行为,包含但不限于非授权访问其他作业数据、篡改文件和配置、恶意消耗容器资源等场景时,会影响到数据提供方的计算环境安全以及其他学习作业的正常执行。 针对该问题,在边缘节点部署场景中,TICS通过构建Python
管理文件 文件管理是可信智能计算服务提供的一项管理联邦学习模型文件的功能。通过文件管理,参与方无需通过登录后台手动导入模型文件,而是直接将模型文件上传到数据目录进行管理。 使用文件管理功能后,创建联邦学习作业时用户可以便捷地选择自己以前上传的执行脚本、训练模型、数据文件、权重参数文件
功能总览 功能总览 全部 空间管理 计算节点管理 多方安全计算作业 可信联邦学习作业 联邦预测作业 空间管理 空间是联邦计算的载体。合作方只有加入空间才能参与联邦计算。空间为首个成员部署计算节点时创建。首个成员空间内的别名为默认league_creator。空间名在创建者租户范围内唯一
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
数据准备 乳腺癌数据集从UCI获取,该数据集只包含连续类型特征,因此对所有特征使用Scikit-Learn的StandardScaler进行了归一化。为了模拟横向联邦学习场景,将数据集随机划分为三个大小类似的部分:(1)xx医院的训练集;(2)其他机构的训练集;(3)独立的测试集,
场景描述 有效的风险控制能够消灭或减少风险事件发生的各种可能性,或减少风险事件发生时造成的损失,对于企业具有重要意义。现阶段,企业级的单方风控体系已逐步建立,在机构内数据统一共享的基础上实现了覆盖业务前、中、后各环节的智能风控。然而,单方数据风控面临存在数据不全面、风控不及时的问题
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
开发规范 规则 多方安全计算中,基础的sql语法都能够支持,但无法支持所有特殊语法。 语法规则如下: 图1 语法规则 建议及示例 查询示例中两表join场景,建议将大表置于join左侧,小表置于join右侧,可借助初筛的能力,进行小表在大表端的加密过滤,提升性能。 建议示例: Select
创建隐私求交作业 前提条件 参与计算的双方需要在其代理节点上创建好各自的数据集,并需要确保数据集含有非敏感的唯一标识字段。 创建作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐私求交”,打开隐私求交作业列表页面。 在隐私求交作业列表页面,单击“创建”。 图
启用区块链审计服务(可选) 若您希望空间启用区块链服务(BCS)来审计任务信息,请仔细阅读本章节。 空间发起方需要根据基于CCE集群创建联盟链完成空间链的创建过程。 “区块链类型”参数值需要选择“空间链”,否则将影响后续操作。 发起方按照组建联盟链中“邀请成员”部分的描述,邀请参与方加入空间链
训练型横向联邦作业流程 联邦学习分为横向联邦及纵向联邦。相同行业间,特征一致,数据主体不同,采用横向联邦。不同行业间,数据主体一致,特征不同,采用纵向联邦。xx医院的应用场景为不同主体的相同特征建模,因此选用横向联邦。 创建训练型横向联邦学习作业。 图1 创建训练型横向联邦学习作业
TICS使用简介 可信智能计算服务TICS( Trusted Intelligence Computing Service )打破数据孤岛,在数据隐私保护的前提下,实现行业内部、各行业间的多方数据联合分析和联邦计算。TICS基于安全多方计算MPC、区块链等技术,实现了数据在存储、流通
发布数据 前提条件 计算节点已创建完成,创建方法请参考部署计算节点。 发布数据 发布数据前,若不存在已创建好的连接器和数据,需先执行创建连接器和创建数据集操作。 若待发布的数据已经创建完成,参照以下流程进入“数据管理”页,执行以下操作即可。 用户登录TICS控制台。 进入TICS控制台后
场景描述 背景信息 本案例以“预测乳腺癌是良性/恶性”的场景为例。假设一部分的乳腺癌患者数据存储在xx医院,另一部分数据存储在某个其他机构,不同机构数据所包含的特征相同。 这种情况下,xx医院想申请使用其他机构的乳腺癌患者数据进行乳腺癌预测模型建模会非常困难。因此可以通过华为TICS