检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自动校验sql语句中字段的使用方式,如有违反字段隐私配置规则的语句会被明确拒绝。 大数据厂商B在自己的计算节点单击“审批管理”模块,找到“待处理”的审批请求单击“查看详情”,可以看到企业A是如何使用自己的数据集的。 确认无误后再单击“同意”即允许企业A使用己方的数据集进行联合统计。
合和协同。 使用TICS的用户角色 根据人员的职能进行划分,使用TICS的用户主要可以分为以下两类。 组织方 面向熟悉业务并具有管理、决策、审核权限的管理人员。组织方具有TICS的所有权限,包括创建空间、邀请空间成员、删除空间等权限。例如,在创建空间模块中,组织方可以对合作方人员发布的数据进行审核,把好质量关。
碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。 父主题: 使用TICS多方安全计算进行联合样本分布统计
据信息,以及附加其上的隐私策略。 字段分类(Field classification) 各数据集字段在其联邦分析上的业务分类,以明确字段用途和场景,避免不合理应用。 唯一标识(Unique Identifier) 用于标识某个事物实体身份的字段。例如身份证、工号、公司代码等。 敏感(Sensitive)
8 11785 2947 下图为当Host方拥有不同数据量时,使用横向联邦对比己方独立训练的性能对比。 图1 Host方拥有不同数据量时,横向联邦对比对立训练的模型性能 结论为:使用横向联邦学习,在己方拥有不同数据量的情况下都可以显著提升模型性能。 父主题: 实验结果
述了字段的属性,如字段名称和分布类型。另外可以通过列表下方的“描述性统计”按键来统计字段的统计量,包括缺失值数量、最大值、最小值及数据分布图。还可以通过为字段添加预处理方法。 图3 作业开发页面 进行字段描述性统计。单击列表下方的“描述性统计”按键,会对该数据集的选定字段(即数据
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
用户的账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在项目ID下,您可以查看项目ID和账号I
创建”按钮,进入联邦预测作业的创建页面。企业A需要通过“算法类型”、“训练作业”等筛选条件可以找到用于预测的模型,点选使用的模型后单击“确定”按钮即完成联邦预测作业的创建。 父主题: 使用TICS联邦预测进行新数据离线预测
用户Token也就是调用获取用户Token接口的响应值,因此调用该接口时,不用填写本字段。 请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 使用Token认证时该字段必选。 注:以下仅为Token示例片段 MIIPAgYJKoZIhvcNAQcCo...ggg1BBIINPXsidG9rZ
verification failed”。 原因是SQL语句中存在使用隐患字段的情况。 请根据具体提示,涉及以下情形请检查并修改SQL语句: 情形一:直接查询其他参与方的唯一标识、度量数据。 情形二:试图使用唯一标识做条件过滤操作。 情形三:使用直接可以逆推度量数据的简单计算式。 情形四:将标识分组后的度量数据聚合值直接明文呈现。
模型训练 企业A在完成特征选择后,可以单击右下角的“启动训练”按钮,配置训练的超参数并开始训练。 等待训练完成后就可以看到训练出的模型指标。 模型训练完成后如果指标不理想可以重复调整7、8两步的所选特征和超参数,直至训练出满意的模型。 父主题: 使用TICS可信联邦学习进行联邦建模
用户需要计算节点短暂脱离空间,一段时间内不想被其他参与方使用自己的数据时,可以手动触发计算节点下线。即“计算节点状态”为“在线”时,触发单击下线,计算节点会切换成离线状态,180秒后空间其他参与方无法使用该计算节点已发布的数据集运行作业。 用户想要加入空间,想被其他参与方使用自己的数据时,可以手动触发计
使用场景 多方安全计算场景 纵向联邦建模场景 隐私求交黑名单共享场景 实时隐匿查询场景 可信数据交换场景 横向联邦学习场景
多方数据实现的联合建模。 安全可信。 多种训练场景。 方便与已有服务对接。 使用场景 横向联邦机器学习 横向联邦机器学习,适用于参与者的数据特征重叠较多,而样本ID重叠较少的情况,联合多个参与者的具有相同特征的多行样本进行可信联邦学习,联合建模。 模型评估 评估训练得出的模型权重在某一数据集上的预测输出效果。
本案例以“小微企业信用评分”的场景为例。 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算。 图1 企业信用评估应用场景示意图
了营销业务当中。这个预测作业可以作为后续持续预测的依据,企业A可以定期地使用模型预测自己的新业务数据。同时企业A也可以根据新积累的数据训练出新的模型,进一步优化模型预测的精确率,再创建新的联邦预测作业,产出更精准的预测结果供业务使用。 父主题: 使用TICS联邦预测进行新数据离线预测
这个特征对于标签的识别没有区分度,可以不选用;而f0、f2特征的iv值中等,适合作为模型的训练特征。 根据计算得出的iv值,企业A调整了训练使用的特征,没有选用双方提供的特征全集,去掉了部分iv值较低的特征,减少了无用的计算消耗。 父主题: 使用TICS可信联邦学习进行联邦建模
A不想暴露给企业B自己查询的用户id,因为查询该用户的信息隐含着“该用户是企业A的客户”的信息,存在用户隐私泄露的风险。 企业A和企业B可以使用TICS服务的实时隐匿查询功能,既能满足实时业务高效低延迟的业务需求,又能避免暴露企业A想要查询哪个用户的隐私安全风险。 父主题: 外部数据共享
更新空间信息 功能介绍 功能描述:用户可以使用接口更新空间信息(包含空间描述,空间版本,隐私保护等级,查分隐私开关)。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/leagues/{league_id} 表1 路径参数 参数 是否必选 参数类型