检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
league_creator.industry1 i on b.id = i.id; 编写完成后单击“保存”和“提交审批”,由于这条sql使用到了大数据厂商B的数据集,为保证数据安全和参与方的知情权,tics服务会自动解析sql语句将大数据厂商B需要执行的sql语句发送到大数据厂商B的
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
添加预处理方法后,勾选添加预处理方法的字段,然后单击列表下方的“批量刷新分布”按键预览预处理结果,查看是否符合预期并进行预处理方法调试。直到预处理结果符合预期结果,则单击列表下方的“保存并执行”按键执行预处理。 图5 添加预处理方法 执行预处理结束后,页面跳转到作业列表。单击预处理作业列表中的开发按钮,再次进入
零件的长度,或者收到付款的日期和时间。 MULTIHOT:使用multihot编码的特征,常见于类别特征,例如app列表、性格等。 MULTIHOT分组配置: 用户可单击“添加分组”创建MULTIHOT分组,分组包含特征集、字典数两部分。特征集表示分组内所选MULTIHOT特征
在弹出的界面,继续配置联邦训练作业的参数,参数配置参考表1。 图3 配置参数 “数据配置文件”的“可选数据列表”: LOCAL运行环境,展示的是通过本地连接器发布的本地数据。 “训练型作业”同一个计算节点只能选一个数据集,但是一个作业必须要选两个及两个以上的数据集才能做训练。 表1 作业参数说明 参数名 参数描述
常规配置:通过界面点选算法使用的常规参数,具体支持的参数请参考表1。 表1 常规配置参数 算法类型 参数名 参数描述 XGBoost 学习率 控制权重更新的幅度,以及训练的速度和精度。取值范围为0~1的小数。 树数量 定义XGBoost算法中决策树的数量,一个样本的预测值是多棵树预测值的加权和。取值范围为1~50的整数。
对重试操作配置后,配置CPU配额和内存配额。执行批量预测作业时,会创建新容器来执行,这两个配额参数的值为创建新容器的CPU核数和内存大小,默认CPU核数为1,内存大小512M。 然后勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,最后单击“确定”按钮完成作业创建。
单击边缘节点名,进入节点详情,然后切换到实例列表页签。 在实例列表页签找到命名如“agent-x-xxxxx”的实例,记录实例名称前三段,如图所示。 图13 记录实例名称 在IEF服务控制台,单击“边缘应用 > 应用配置”,进入配置项页签。 图14 进入配置项页签 在配置项列表上方的搜索栏中输入3中记录的实例名称前三段,搜索配置项。
0, 0]表示,1用向量[0,1,0]表示,2用向量[0, 0, 1]表示,此即为onehot编码。 gender字段先填补缺失值,再将其映射成算法可以理解的数值型,比如将woman映射成0,man映射成1,此即为离散特征编码。 图1 数据集样例 数据预处理通常被用于评估和预测场景
作业运行参数中增加join.runtime.filter参数为true。 开启初筛后,做PSI或者聚合join前,会将提前做过安全处理的小表id放置到大表代理侧,进行提前过滤和初筛。大大减少了需要在网络中消耗的时间,避免传递不需要输出的数据。
进入资源池创建页面。 在资源池创建页面,单击“创建”,进入购买专属资源池页面。 进入购买专属资源池页面后,配置购买参数,各参数说明如表表1所示。 表1 资源池配置参数 参数名称 说明 样例 名称 资源池的名称,创建时会随机生成一个名字。 pool-6e8a 描述 对创建的资源池进行说明。
/v1/agent/user/token 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 消息体的类型(格式),必选,默认取值为“application/json”,有其他取值时会在具体接口中专门说明。 表2 请求Body参数 参数 是否必选
录用户名”和“密码”。 图2 前往计算节点 登录成功后,进入到计算节点界面,选择左侧导航栏中“连接器管理”,单击“创建”,在弹出的界面配置创建连接器的参数,配置完成后单击“确定”。 测试功能为数据源连通性及密码正确性的检查测试。 图3 创建连接器(以RDS服务为例) 表1 参数说明
开发流程 图1 开发流程 表1 开发流程 阶段 说明 参考文档 了解基本概念 在开始开发前,需要了解多方安全计算的基本概念。 常用概念 准备TICS执行环境 TICS执行环境当前依赖TICS空间、计算节点和连接器。 环境准备 根据场景编写sql程序 当前多方安全计算支持通过编写s
column_sensitive_level SENSITIVE:表示该字段敏感。 NON_SENSITIVE:表示该字段非敏感。 feature_type CONTINUOUS:表示该字段特征类型为连续。 DISCRETE:表示该字段特征类型为离散。 MULTIHOT:表示该字段特征类型为MULTIHOT。
署计算节点时设置的“登录用户名”和“密码”。 图2 前往计算节点 进入计算节点管理界面后,选择左侧“任务管理”,单击待查看计算过程的“作业名称”。 图3 计算过程查看入口 计算过程页面可以单击任务节点,查看开始和结束时间等信息。可以在下方详情列表打开任务详情,查看更详细的任务信息。
t/user/token 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 计算节点API公共请求消息头 名称 描述 是否必选 示例 Content-Type
“连接器类型”选择MySql和ORACLE时,呈现此参数。JDBC驱动。 其他属性 “连接器类型”选择MySql时,呈现此参数。用户根据实际情况设置任务所需的Key和Value。 管理连接器 在“计算节点详情”页,单击“前往计算节点”,在登录页正确输入部署计算节点时设置的“登录用户名”和“密码”。
“连接器类型”选择MySql和ORACLE时,呈现此参数。JDBC驱动。 其他属性 “连接器类型”选择MySql时,呈现此参数。用户根据实际情况设置任务所需的Key和Value。 管理连接器 在“计算节点详情”页,单击“前往计算节点”,在登录页正确输入部署计算节点时设置的“登录用户名”和“密码”。
数据管理概述 TICS的数据管理由“连接器管理”和“数据管理”两部分来实现: 连接器是可信智能计算服务提供的一项访问参与方数据资源的功能。参与方填写连接信息来创建对应类型的连接器,并通过这些连接器访问到各类型资源的结构化信息。当前支持MRS服务(Hive)、本地数据集、RDS数据