检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数类型 描述 name String 作业名称。名称不能以空白字符开头结尾、或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间 description String 作业描述,最大长度512 sql_text String sql内容,最大长度8000
{URI-scheme}://{Endpoint}/{resource-path}?{query-string} 尽管请求URI包含在请求消息头中,但大多数语言或框架都要求您从请求消息中单独传递它,所以在此单独强调。 表1 URI中的参数说明 参数 描述 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。
参数类型 描述 name 是 String 作业名称。名称不能以空白字符开头结尾、或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间。 description 否 String 作业描述,最大长度512 hfl_type 否 String fl作业类型枚
已提前准备好训练数据,和评估/预测数据。 存在未参与其他预处理作业的结构化数据集,且在创建数据集时已定义字段的分布类型。注意预处理作业对数据集的发布状态无要求。 创建数据预处理作业 用户登录TICS控制台。 进入TICS控制台后,单击页面左侧“计算节点管理”,进入计算节点管理页面。 在“计算节点
MPC; job_name 否 String 作业名称。名称不能以空白字符开头结尾、或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间 id_column_name 否 String 唯一标识列名称。最大值200。 filters 否 Array of strings
场景描述 有效的风险控制能够消灭或减少风险事件发生的各种可能性,或减少风险事件发生时造成的损失,对于企业具有重要意义。现阶段,企业级的单方风控体系已逐步建立,在机构内数据统一共享的基础上实现了覆盖业务前、中、后各环节的智能风控。然而,单方数据风控面临存在数据不全面、风控不及时的问
运行作业前,提示“Privacy rule verification failed”,怎么处理? 当在作业编辑页面编写SQL语句,并试图运行时,右上角提示“Privacy rule verification failed”。 原因是SQL语句中存在使用隐患字段的情况。 请根据具体
批量隐匿查询 隐匿查询,也称隐私信息检索,是指查询方隐藏被查询对象关键词或客户id信息,数据服务方提供匹配的查询结果却无法获知具体对应哪个查询对象。数据不出门且能计算,杜绝数据缓存的可能性。 例如查询方希望查询身份证id为“张三”的人信贷公式数据,发起了一个类似于SELECT salary
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
计算节点配置相关参数 计算节点名称 计算节点别名,由用户自定义,用以区分部署的各个计算节点。要求:名称不能以空白字符开头或结尾,也不能包含下列特殊字符:\ / : * ? " < > |,长度要求在1~128之间。 访问密钥ID(AK) 用户的身份标识,需要用户去IAM服务自行下载。
计算节点配置相关参数 计算节点名称 计算节点别名,由用户自定义,用以区分部署的各个计算节点。要求:名称不能以空白字符开头或结尾,也不能包含下列特殊字符:\ / : * ? " < > |,长度要求在1~128之间。 访问密钥ID(AK) 用户的身份标识,需要用户去IAM服务自行下载。
job_name String 作业名称,最大长度128,名称不能以空白字符开头结尾、或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间。 algorithm_type String 纵向联邦算法类型枚举,XG_BOOST,LIGHT_BGM,LOGISTIC_REGRESSION
job_name 是 String 作业名称,最大长度128,名称不能以空白字符开头结尾、或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间。 algorithm_type 是 String 纵向联邦算法类型枚举,XG_BOOST,LIGHT_BGM,LOGISTIC_REGRESSION
job_name 否 String 作业名称。名称不能以空白字符开头结尾、或者包含下列任何字符:\ / : * ? " < > |,长度要求在1~128之间 ,最大值2的31次方-1 binning_type 否 String 特征分箱策略。 DISTANCE, FREQUENCY;
数据准备 乳腺癌数据集从UCI获取,该数据集只包含连续类型特征,因此对所有特征使用Scikit-Learn的StandardScaler进行了归一化。为了模拟横向联邦学习场景,将数据集随机划分为三个大小类似的部分:(1)xx医院的训练集;(2)其他机构的训练集;(3)独立的测试集
乳腺癌数据集作业结果 本节实验包含了如下三个部分:(1)训练轮数对联邦学习模型分类性能的影响;(2)迭代次数对联邦学习模型分类性能的影响;(3)参与方数据量不同时,本地独立训练对比横向联邦的模型性能。 不同训练参数对模型准确率、训练时长的影响 训练轮数对模型准确率的影响(迭代次数固定为20)
计算节点配置相关参数 计算节点名称 计算节点别名,由用户自定义,用以区分部署的各个计算节点。要求:名称不能以空白字符开头或结尾,也不能包含下列特殊字符:\ / : * ? " < > |,长度要求在1~128之间。 访问密钥ID(AK) 用户的身份标识,需要用户去IAM服务自行下载。
选择界面左侧“数据管理”,单击“创建”,在弹出的界面选择API类型连接器,配置创建数据的参数,配置完成后单击“确定”。 图7 创建数据 API数据集配置的外部数据源需满足如下要求: 请求方式为GET或POST 由查询条件可以查出对应一条或多条数据 当配置隐匿查询作业的外部数据源时,接口需支持模糊查询id经过sha256转换后的值。
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
作业中通过这两个数据集计算得到的结果,如图6所示。 图5 使用新对齐结果 图6 复用隐私求交作业中的结果 (可选步骤)进行特征选择,此步骤要求数据已经对齐,即两方数据集每一行的数据都是一一对应的。 单击数据集按钮切换数据集,勾选特征作为模型训练的指定特征,选择分箱方式后单击“启动