检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
英文字母开头,特殊符号不包括?!.*?_$ 长度0-128 data_type String 连接器数据类型 1.RDS--云数据库类型 2.MYSQL--MySQL类型 3.DWS--高斯数据库类型 4.MRS--MapReduce数据类型 5.ORACLE--ORACLE数据类型
的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 label int 企业A对用户的标签属性 industry1.csv id,col0,col1
要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict.csv id,col0,col1,col2,col3,col4
使用范围 功能介绍 缺失值处理 连续型/离散型 针对连续特征有均值、中位数2种填充策略,针对离散特征有众数的填充策略。 离散特征编码 离散型 将字符串形式存储的特征,映射为[0, n_classes-1]范围内的整数 Onehot编码 离散型 将[0, n_classes-1]范围内整数
字母开头,特殊符号不包括?!.*?_$ 长度0-128 data_type 是 String 连接器数据类型 1.RDS--云数据库类型 2.MYSQL--MySQL类型 3.DWS--高斯数据库类型 4.MRS--MapReduce数据类型 5.ORACLE--ORACLE数据类型
Sql中必须包含where条件。不支持join操作,即使是单方内的join操作。 where条件后必须包含隐匿查询字段,隐匿查询字段只能是非敏感唯一标识,且字段数值类型只能是字符串或整数。 where条件后出现多个字段时必须使用.pir或.PIR标识隐匿查询字段。 where条件后不支持or语句,多个条件必须使用and进行拼接。
企业A的实时业务不需要准备数据,在发起查询时通过参数传递需要查询的用户id。 表1 企业B用户画像数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 f0-f4 float 用户数据画像特征 bigdata_all.csv id,f0,f1,f2,f3,f4 5feceb66ffc86
行日志。 连接器(Connector) 连接器是可信智能计算节点内置的连接特定数据源所需的对象模板,目前支持连接MRS Hive、MySQL、RDS、DWS、ORACLE等多种连接器,并支持扩展增加新的连接器。 数据集(Data set) 数据集为计算节点获取并配置的合作方数据的元数据信息,以及附加其上的隐私策略。
String 模型保存格式 loss_function 否 String 损失函数 loss_param 否 String 损失函数参数json字符串 响应参数 状态码: 200 表7 响应Body参数 参数 参数类型 描述 job_instance_id String 作业实例id,最大长度32
String 模型保存格式 loss_function 否 String 损失函数 loss_param 否 String 损失函数参数json字符串 启动作业后会生成一条新的历史作业记录。 等待执行完成,在“历史作业”页面查看更详细的作业运行信息,包括执行结果、作业报告。 父主题: 可信联邦学习作业
之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 label float int 企业A数据特征 企业A对用户的标签属性 industry_all.csv id,col0
数据类型,DWS.DWS类型数据集,LOCAL_CSV.本地文件类型数据集,MRS.HIVE类型数据集,MYSQL.MySql类型数据集,ORACLE.Oracle类型数据集,RDS.RDS类型数据集 description String 描述 id String 数据集id name String
是否必选 参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
String 模型保存格式 loss_function 否 String 损失函数 loss_param 否 String 损失函数参数json字符串 图9 常规参数配置(XGBoost) 图10 常规参数配置(逻辑回归/FiBiNET) 图11 自定义参数配置 填写完作业参数,单击“确
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
联邦sql分析作业运行过慢,如何提升执行速度? 提升计算并行度 可以在作业开发界面的运行参数中,填写user.task.concurrency参数,提升用户侧此类加密任务的并行度。推荐该值填4-16左右,不建议超过30。 图1 填写参数 tics.task.concurrency
支持在分布式的、信任边界缺失的多个参与方之间建立互信空间; 实现跨组织、跨行业的多方数据融合分析和多方联合学习建模。 灵活多态 支持对接主流数据源(如MRS、 DLI、 RDS、 Oracle等)的联合数据分析; 支持对接多种深度学习框架(TICS,TensorFlow)的联邦计算; 支持控制流和数据流的分离,用
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
String 作业、任务状态:1.新建,2.已接收,3.运行中,4.成功,5.失败,6.终止 result String json格式:records 记录数;obs_path 文件存放地址; execute_time 执行时间 job_id String 作业id。 支持数字,英文字母,下划线,长度32。
创建样本分布统计作业 创建样本分布统计作业步骤如下: 在“作业管理 > 多方安全计算”页面单击创建,进入sql开发页面,展开左侧的“合作方数据”可以看到企业A、大数据厂商B发布的不同数据集。 单击某一个数据集可以看到数据集的表结构信息。 此时企业A可以编写如下的sql语句统计双方