检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
阶段六:统计型作业的差分隐私保护 本示例作业,以统计各行业的“企业税收总和”与“用电量总和”,进行统计分析: Select industry, sum(tax_bal), sum(electric_bal) from LEAGUE_CREATOR.tax a join
Connector,选择数据文件的路径,填写数据名称;(2)字段配置中特征字段(x_{特征序号})均配置为字段类型:FLOAT,字段类别:特征,特征类型:连续;标签字段(label)配置为字段类型:INTEGER,字段类别:标签。 图3 配置数据集参数 发布数据集。 图4 发布数据集
column_sensitive_level SENSITIVE:表示该字段敏感。 NON_SENSITIVE:表示该字段非敏感。 feature_type CONTINUOUS:表示该字段特征类型为连续。 DISCRETE:表示该字段特征类型为离散。 MULTIHOT:表示该字段特征类型为MULTIHOT。当数据集
以直接执行作业并获取作业结果,无编辑、查看、删除、初始化等权限。 然后选择数据集及其对应的查询字段和返回字段。当前支持最多选择3个数据集,同时返回字段支持配置默认值,针对相同的返回字段支持配置优先级。 图2 选择数据文件 单击“保存并提交审批”。 父主题: 实时隐匿查询
”。 配置数据参数时,若“连接器”为Hive、MySQL、RDS、DWS、ORACLE类型时,可对字段信息进行隐私策略的配置: 字段类别: 唯一标识:指用于标识某个事物实体身份的字段。例如身份证、工号、公司代码等。勾选后,会通过一定的语法限制和运行期校验,保护数据集内的id总集,确保无法被恶意逆推。
String 字段备注 data_id String 数据集id。 支持数字,英文字母,下划线,长度0-32。 column_name String 字段名称 data_type String 字段类型 sql_col_privacy_type String sql数据集字段隐私分类。
用户Token也就是调用获取用户Token接口的响应值,因此调用该接口时,不用填写本字段。 请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 使用Token认证时该字段必选。 注:以下仅为Token示例片段 MIIPAgYJKoZIhvcNAQcCo
描述 comments 否 String 字段备注 data_id 否 String 数据集id。 支持数字,英文字母,下划线,长度0-32。 column_name 是 String 字段名称 data_type 否 String 字段类型 sql_col_privacy_type
假设您有如下数据集(只展示部分数据),由于数据不够完整,如job、gender等字段均存在一定程度的缺失。为了不让机器理解形成偏差、以达到机器学习的使用标准,需要基于对数据的理解,对数据进行特征预处理。例如: job字段是多类别的变量,其值0、1、2实际没有大小之分,一般会将该特征转换成向量,如值为0用向量[1
原始文件,需要指定csv文件的“分隔符”、“是否包含表头”。“是否包含表头”是指文件的第一行是否是每一个字段的名称。 数据结构:配置每个字段的类别标签,包括以下几种: “字段类型”:支持BOOLEAN、TINYINT、SMALLINT、INTEGER、BIGINT、FLOAT、D
据信息,以及附加其上的隐私策略。 字段分类(Field classification) 各数据集字段在其联邦分析上的业务分类,以明确字段用途和场景,避免不合理应用。 唯一标识(Unique Identifier) 用于标识某个事物实体身份的字段。例如身份证、工号、公司代码等。 敏感(Sensitive)
https://Ip:port/v1/agent/user/token 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 计算节点API公共请求消息头 名称 描述 是否必选
供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 label int 企业A对用户的标签属性
myhuaweicloud.com/v3/auth/tokens 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 空间API公共请求消息头 名称 描述 是否必选 示例
数据目录”,打开“数据目录”页面。 在“数据目录”页面,对数据集单击“申请使用”。 图1 创建数据申请 在申请使用界面配置使用字段及用数方的访问需求。 图2 设置使用的字段及访问的需求 支持选择访问截止时间、访问方式、访问次数。 不设置访问次数时,则不限制访问次数。 单击保存或者保存并提交审批。
数据集管理 获取字段隐私详情 数据集列表 父主题: 计算节点API
节点上,当大数据厂商B同意审批之后才可以执行该条sql。 除此之外,tics服务会基于数据集的安全隐私策略自动校验sql语句中字段的使用方式,如有违反字段隐私配置规则的语句会被明确拒绝。 大数据厂商B在自己的计算节点单击“审批管理”模块,找到“待处理”的审批请求单击“查看详情”,
r上发布。 表1 企业税收和资助金情况表tax 列名 含义 字段分类 Id 企业id 唯一标识 tax_bal 税收 敏感 Industry 行业类型 不敏感 表2 企业政府资助金数据表support 列名 含义 字段分类 Id 企业id 唯一标识 supp_bal 资助金的金额
通配符:%;--与like配合使用; 注意事项: 不识别的数据类型被认为是字符串类型。 “隐私保护等级”设置为高级别后,参与多方计算的字段会进行秘密分享加密。 “隐私保护等级”设置为高级别后,参与2方计算的join字段会使用psi算法输出碰撞的密文数据。 由于本地数据集不支持统计信息上报,因此本地数据集不支持差分隐私功能。
定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 label float int 企业A数据特征 企业A对用户的标签属性