检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
英文字母开头,特殊符号不包括?!.*?_$ 长度0-128 data_type String 连接器数据类型 1.RDS--云数据库类型 2.MYSQL--MySQL类型 3.DWS--高斯数据库类型 4.MRS--MapReduce数据类型 5.ORACLE--ORACLE数据类型
添加入方向规则 (可选)准备RDS(MySQL)数据源 如果您的数据需通过RDS(MySQL)发布到TICS,则您需要提前准备RDS(MySQL)数据源。 JDBC数据源支持原生MySQL及RDS(MySQL)的连接。这里介绍RDS(MySQL)准备数据的步骤: 购买RDS服务,操作步骤参考
行日志。 连接器(Connector) 连接器是可信智能计算节点内置的连接特定数据源所需的对象模板,目前支持连接MRS Hive、MySQL、RDS、DWS、ORACLE等多种连接器,并支持扩展增加新的连接器。 数据集(Data set) 数据集为计算节点获取并配置的合作方数据的元数据信息,以及附加其上的隐私策略。
使用范围 功能介绍 缺失值处理 连续型/离散型 针对连续特征有均值、中位数2种填充策略,针对离散特征有众数的填充策略。 离散特征编码 离散型 将字符串形式存储的特征,映射为[0, n_classes-1]范围内的整数 Onehot编码 离散型 将[0, n_classes-1]范围内整数
Sql中必须包含where条件。不支持join操作,即使是单方内的join操作。 where条件后必须包含隐匿查询字段,隐匿查询字段只能是非敏感唯一标识,且字段数值类型只能是字符串或整数。 where条件后出现多个字段时必须使用.pir或.PIR标识隐匿查询字段。 where条件后不支持or语句,多个条件必须使用and进行拼接。
要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict.csv id,col0,col1,col2,col3,col4
字母开头,特殊符号不包括?!.*?_$ 长度0-128 data_type 是 String 连接器数据类型 1.RDS--云数据库类型 2.MYSQL--MySQL类型 3.DWS--高斯数据库类型 4.MRS--MapReduce数据类型 5.ORACLE--ORACLE数据类型
String 模型保存格式 loss_function 否 String 损失函数 loss_param 否 String 损失函数参数json字符串 启动作业后会生成一条新的历史作业记录。 等待执行完成,在“历史作业”页面查看更详细的作业运行信息,包括执行结果、作业报告。 父主题: 可信联邦学习作业
的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 label float int 企业A数据特征 企业A对用户的标签属性 industry_all.csv id,col0,col1,col2,col3,col4
String 模型保存格式 loss_function 否 String 损失函数 loss_param 否 String 损失函数参数json字符串 响应参数 状态码: 200 表7 响应Body参数 参数 参数类型 描述 job_instance_id String 作业实例id,最大长度32
行日志。 连接器(Connector) 连接器是可信智能计算节点内置的连接特定数据源所需的对象模板,目前支持连接MRS Hive、MySQL、RDS、DWS、ORACLE等多种连接器,并支持扩展增加新的连接器。 数据集(Data set) 数据集为计算节点获取并配置的合作方数据的元数据信息,以及附加其上的隐私策略。
企业A的实时业务不需要准备数据,在发起查询时通过参数传递需要查询的用户id。 表1 企业B用户画像数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 f0-f4 float 用户数据画像特征 bigdata_all.csv id,f0,f1,f2,f3,f4 5feceb66ffc86
数据类型,DWS.DWS类型数据集,LOCAL_CSV.本地文件类型数据集,MRS.HIVE类型数据集,MYSQL.MySql类型数据集,ORACLE.Oracle类型数据集,RDS.RDS类型数据集 description String 描述 id String 数据集id name String
数据准备 乳腺癌数据集从UCI获取,该数据集只包含连续类型特征,因此对所有特征使用Scikit-Learn的StandardScaler进行了归一化。为了模拟横向联邦学习场景,将数据集随机划分为三个大小类似的部分:(1)xx医院的训练集;(2)其他机构的训练集;(3)独立的测试集
是否必选 参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
(可选步骤)进行特征选择,此步骤要求数据已经对齐,即两方数据集每一行的数据都是一一对应的。 单击数据集按钮切换数据集,勾选特征作为模型训练的指定特征,选择分箱方式后单击“启动分箱和IV计算”,计算得到所选特征对标签的影响程度。计算完成后,单击特征行的可以展开图表形式的分箱woe值。 “FiBiNET”算法新增限制:
支持在分布式的、信任边界缺失的多个参与方之间建立互信空间; 实现跨组织、跨行业的多方数据融合分析和多方联合学习建模。 灵活多态 支持对接主流数据源(如MRS、 DLI、 RDS、 Oracle等)的联合数据分析; 支持对接多种深度学习框架(TICS,TensorFlow)的联邦计算; 支持控制流和数据流的分离,用
String 作业、任务状态:1.新建,2.已接收,3.运行中,4.成功,5.失败,6.终止 result String json格式:records 记录数;obs_path 文件存放地址; execute_time 执行时间 job_id String 作业id。 支持数字,英文字母,下划线,长度32。
管理密钥 密钥用于对加密的数据文件进行AES加解密。在多方安全计算作业场景,当SQL语句使用系统函数进行AES加解密时需要使用密钥。 约束限制 上传密钥文件需要以.key为后缀结尾。 上传密钥文件大小不超过256B。 上传密钥文本为base64编码之后的密钥,长度小于1000。 上传密钥
计算节点以容器的形式部署,支持云容器引擎(CCE,Cloud Container Engine)服务和智能边缘平台(IEF,Intelligent EdgeFabric)服务部署,用户可根据数据上云的实际需求,采用合适的计算节点部署方案。 云容器引擎(CCE,Cloud Container Engi