检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
假设您有如下数据集(只展示部分数据),由于数据不够完整,如job、gender等字段均存在一定程度的缺失。为了不让机器理解形成偏差、以达到机器学习的使用标准,需要基于对数据的理解,对数据进行特征预处理。例如: job字段是多类别的变量,其值0、1、2实际没有大小之分,一般会将该特征转换成向量,如值为0用向量[1
是否必选 参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
执行样本分布联合统计 企业A单击“执行”并等待一段时间之后,可以在页面下方“执行结果”看到sql的运行结果。 也可以通过“作业管理 > 多方安全计算 > 历史作业 > 查看结果”查看对应的结果。 父主题: 使用TICS多方安全计算进行联合样本分布统计
d前缀,使用大数据组件筛选出id前缀相符的数据,达到减少数据量的目的。样本粗筛时还可以选择多个标记为“非敏感”的字段进行过滤,结果会按照“id前缀,过滤字段1,过滤字段2……”的格式保存成csv文本文件。 选择完成后单击“下一步”。 图3 数据选择 图4 样本粗筛 (可选步骤)
通配符:%;--与like配合使用; 注意事项: 不识别的数据类型被认为是字符串类型。 “隐私保护等级”设置为高级别后,参与多方计算的字段会进行秘密分享加密。 “隐私保护等级”设置为高级别后,参与2方计算的join字段会使用psi算法输出碰撞的密文数据。 由于本地数据集不支持统计信息上报,因此本地数据集不支持差分隐私功能。
用户Token也就是调用获取用户Token接口的响应值,因此调用该接口时,不用填写本字段。 请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 使用Token认证时该字段必选。 注:以下仅为Token示例片段 MIIPAgYJKoZIhvcNAQcCo
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
页面,选择需要增加权限的CCE集群,单击右上角“添加权限”,进入添加权限页面。 图1 CCE管理控制台权限管理 在添加权限页面,在用户下拉框选择需要添加权限的子账号,权限类型选择“运维权限”,然后单击右下角“确认”按钮。 图2 添加子用户权限 父主题: 准备工作
https://Ip:port/v1/agent/user/token 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 计算节点API公共请求消息头 名称 描述 是否必选
datasets 否 Map<String,String> 样本对齐数据集 align_ids 否 Map<String,String> 样本对齐字段ID集合 agents 否 Array of strings 样本对齐agentId agent_names 否 Array of strings
com(地址信息以空间所在region为准)。 2.聚合器ip(空间创建时自动申请的聚合器公网ip)。 给CCE类型计算节点的最终租户增加CCE命名空间运维权限。 图2 添加运维权限-入口 图3 添加运维权限-类型 父主题: 环境准备
com(地址信息以空间所在region为准)。 2.聚合器ip(空间创建时自动申请的聚合器公网ip)。 给CCE类型计算节点的最终租户增加CCE命名空间运维权限。 图2 添加运维权限-入口 图3 添加运维权限-类型 父主题: 计算节点管理
供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 label int 企业A对用户的标签属性
数据集管理 获取字段隐私详情 数据集列表 父主题: 计算节点API
M,您可以: 根据企业的业务组织,在您的华为账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用TICS资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将TICS资源委托给更专业、高效的其他华为账号或者云服务,这些账号或者云服务可以根据权限进行代运维。
单击页面左侧“计算节点管理”,进入计算节点管理页面。在操作列单击“更多 ->配置变更”。 图4 配置变更 在配置变更的操作栏中添加步骤6的文件,单击确定。 图5 添加配置变更文件 配置变更成功,计算节点进入重启状态。待状态变为“运行中”,空间证书更新完成。 图6 计算节点重启 父主题:
定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 label float int 企业A数据特征 企业A对用户的标签属性
在弹出的界面配置待邀请的合作方的“租户名称”和“租户别名”,“租户名称”从合作方侧获取即可,保存后单击“确定”,完成邀请合作方操作。 图1 添加合作方 父主题: 快速入门
支持在分布式的、信任边界缺失的多个参与方之间建立互信空间; 实现跨组织、跨行业的多方数据融合分析和多方联合学习建模。 灵活多态 支持对接主流数据源(如MRS、 DLI、 RDS、 Oracle等)的联合数据分析; 支持对接多种深度学习框架(TICS,TensorFlow)的联邦计算; 支持控制流和数据流的分离,用
准备数据 企业A的实时业务不需要准备数据,在发起查询时通过参数传递需要查询的用户id。 表1 企业B用户画像数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 f0-f4 float 用户数据画像特征 bigdata_all.csv id,f0,f1,f2