检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据目录”,打开“数据目录”页面。 在“数据目录”页面,对数据集单击“申请使用”。 图1 创建数据申请 在申请使用界面配置使用字段及用数方的访问需求。 图2 设置使用的字段及访问的需求 支持选择访问截止时间、访问方式、访问次数。 不设置访问次数时,则不限制访问次数。 单击保存或者保存并提交审批。
节点上,当大数据厂商B同意审批之后才可以执行该条sql。 除此之外,tics服务会基于数据集的安全隐私策略自动校验sql语句中字段的使用方式,如有违反字段隐私配置规则的语句会被明确拒绝。 大数据厂商B在自己的计算节点单击“审批管理”模块,找到“待处理”的审批请求单击“查看详情”,
com/v3/auth/tokens 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 空间API公共请求消息头 名称 描述 是否必选 示例 Content-Type
节点agent_power上发布。 表1 企业税收和资助金情况表tax 列名 含义 字段分类 Id 企业id 唯一标识 tax_bal 税收 敏感 Industry 行业类型 不敏感 表2 企业政府资助金数据表support 列名 含义 字段分类 Id 企业id 唯一标识 supp_bal
双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 label float int 企业A数据特征
d前缀,使用大数据组件筛选出id前缀相符的数据,达到减少数据量的目的。样本粗筛时还可以选择多个标记为“非敏感”的字段进行过滤,结果会按照“id前缀,过滤字段1,过滤字段2……”的格式保存成csv文本文件。 选择完成后单击“下一步”。 图3 数据选择 图4 样本粗筛 (可选步骤)
connector_type 是 String 连接器类型 1.MRS--MapReduce连接器 2.JDBC--JAVA数据库连接器 3.MYSQL--MySQL连接器 4.DWS--高斯数据库连接器 5.ORACLE--ORACLE连接器 auth_type 是 String 认证类型1.PWD----密码
准备数据 企业A的实时业务不需要准备数据,在发起查询时通过参数传递需要查询的用户id。 表1 企业B用户画像数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 f0-f4 float 用户数据画像特征 bigdata_all.csv id,f0,f1,f2
POWER_DATA c where b.id = c.id and a.id = b.id 审批时可以看到如下的信息,涉及关联字段较多,其使用方式都能够在审批界面中展示出来。 图1 基础信息 执行结果如下。 图2 执行结果 结果显示,TICS支持大量基础的SQL语法。
POWER_DATA c where b.id = c.id and a.id = b.id 审批时可以看到如下的信息,涉及关联字段较多,其使用方式都能够在审批界面中展示出来。 图1 基础信息 执行结果如下。 图2 执行结果 结果显示,TICS支持大量基础的SQL语法。
encrypted_res 否 Boolean 作业是否加密保存结果 external_param 否 SqlExternalParamDto object 拓展字段 表4 SqlExternalParamDto 参数 是否必选 参数类型 描述 agg.count 否 Integer 此次计算的分布式agg节点数量,最大值2的32次方-1
taxpay和water_fee。 开启空间中的差分隐私开关保护敏感数据,符合差分隐私条件的统计作业,会自动应用差分隐私算法对计算结果进行加噪保护, 在一定误差范围内保证数据无法被恶意偷取。 图1 差分隐私开关 第一次执行作业的结果如下: 图2 作业结果 在返回最终统计结果前,增
id_column_name 否 String 唯一标识列名称。最大值200。 filters 否 Array of strings 过滤字段名称 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 job_instance_id String 作业实例id,最大长度32 请求示例
场景描述 有效的风险控制能够消灭或减少风险事件发生的各种可能性,或减少风险事件发生时造成的损失,对于企业具有重要意义。现阶段,企业级的单方风控体系已逐步建立,在机构内数据统一共享的基础上实现了覆盖业务前、中、后各环节的智能风控。然而,单方数据风控面临存在数据不全面、风控不及时的问
ce_id} 表1 路径参数 参数 是否必选 参数类型 描述 agent_id 是 String 可信计算节点id。 支持数字,英文字母,下划线,长度32。 notice_id 是 String 通知记录id。 支持数字,英文字母,下划线,长度32。 请求参数 表2 请求Header参数
连接正常 进入数据管理,进行数据集发布。 图5 新建数据管理 填写参数信息。 图6 填写参数 重复步骤1~7,发布tax税务表和power_data能源表。 数据发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。 父主题:
数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。
基于MPC算法的高安全级别计算 完成demo验证阶段,为提升数据保护级别,接入以纯密文的状态做计算的更高安全级别的数据,可以通过开启高隐私级别开关,提升空间安全级别。 图1 高隐私级别开关 再次单击作业,审批进行的同时敏感数据被进行了同态加密。DAG图显示了“psi + 同态”的
阶段五:基于MPC算法的高安全级别计算 完成demo验证阶段,为提升数据保护级别,接入以纯密文的状态做计算的更高安全级别的数据,可以通过开启高隐私级别开关,提升空间安全级别。 图1 高隐私级别开关 再次单击作业,审批进行的同时敏感数据被进行了秘密分享加密。DAG图显示了“psi +
新建作业 在作业列表中查找创建的作业,单击“开发”,进入作业开发页面编写SQL语句。SQL语句开发完成后单击“保存”。 在作业开发页面“合作方数据”一栏可查看此空间合作方共享的数据。 数据第一级是合作方名称,第二级是数据名称。 SQL语句中用“合作方名.数据名”表示一张表。 SQL语句开发完成,