检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
填4-16左右,不建议超过30。 图1 填写参数 tics.task.concurrency参数提升的是tics平台提供的计算节点并发度,一般填写4左右即可,不建议超过8。 数据量提前过滤 作业运行参数中增加join.runtime.filter参数为true。 开启初筛后,做P
账号是您访问华为云的责任主体,有关账号的详细介绍请参见账号中心。此处介绍如何注册一个华为账号。若您已有华为账号,可以略过此部分内容。 打开华为云网站www.huaweicloud.com。 单击页面右上角的“注册”按钮。 在注册页面,根据页面提示完成账号注册。 为了能够给您提供更好的云
可信智能计算服务的终端节点Endpoint构造规则如下,请您根据业务需要选择对应区域的终端节点。 表1 可信智能计算服务Endpoint 区域名称 区域ID 终端节点(Endpoint) 协议类型 华北-北京四 cn-north-4 tics.cn-north-4.myhuaweicloud
管理文件 文件管理是可信智能计算服务提供的一项管理联邦学习模型文件的功能。通过文件管理,参与方无需通过登录后台手动导入模型文件,而是直接将模型文件上传到数据目录进行管理。 使用文件管理功能后,创建联邦学习作业时用户可以便捷地选择自己以前上传的执行脚本、训练模型、数据文件、权重参数
“存储方式”选择“主机存储”时呈现此参数,计算节点成功部署后通过输入的“主机路径”来进行文件的上传。 例如:“192.168.0.61/tmp”,如何在后台查找该路径请参考登录节点的相关描述。 说明: 请确保选择的主机路径具有1000:1000属组权限,否则会影响部分功能使用。 资源分配策略 CPU(Cores)
“存储方式”选择“主机存储”时呈现此参数,计算节点成功部署后通过输入的“主机路径”来进行文件的上传。 例如:“192.168.0.61/tmp”,如何在后台查找该路径请参考登录节点的相关描述。 说明: 请确保选择的主机路径具有1000:1000属组权限,否则会影响部分功能使用。 资源分配策略 CPU(Cores)
“存储方式”选择“主机存储”时呈现此参数,计算节点成功部署后通过输入的“主机路径”来进行文件的上传。 例如:“192.168.0.61/tmp”,如何在后台查找该路径请参考登录节点的相关描述。 说明: 请确保选择的主机路径具有1000:1000属组权限,否则会影响部分功能使用。 资源分配策略 CPU(Cores)
己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练特征;过低的iv值没有区分性会造成训练资源的浪费,过高的iv值又过于突出可能会过度影响训练出来的模型。
“存储方式”选择“主机存储”时呈现此参数,计算节点成功部署后通过输入的“主机路径”来进行文件的上传。 例如:“192.168.0.61/tmp”,如何在后台查找该路径请参考登录节点的相关描述。 说明: 请确保选择的主机路径具有1000:1000属组权限,否则会影响部分功能使用。 资源分配策略 CPU(Cores)
、以达到机器学习的使用标准,需要基于对数据的理解,对数据进行特征预处理。例如: job字段是多类别的变量,其值0、1、2实际没有大小之分,一般会将该特征转换成向量,如值为0用向量[1, 0, 0]表示,1用向量[0,1,0]表示,2用向量[0, 0, 1]表示,此即为onehot编码。
描述 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同。 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同。本服
baebabe5ef03f7c3017bb5b7”这样的一条数据,查询结果中即会返回企业A所选择的企业B的数据字段。 同时企业A的业务系统后台也可以通过API调用的方式调用企业A计算节点的接口发起实时隐匿查询,更好地服务生产业务。 父主题: 外部数据共享
密钥用于对加密的数据文件进行AES加解密。在多方安全计算作业场景,当SQL语句使用系统函数进行AES加解密时需要使用密钥。 约束限制 上传密钥文件需要以.key为后缀结尾。 上传密钥文件大小不超过256B。 上传密钥文本为base64编码之后的密钥,长度小于1000。 上传密钥 用户登录进入计算节点页面。
用户根据需求选择是否选择自动续费。 - 登录方式 选择登录方式,有密码和密钥对两种方式。 选择密码登录,默认用户名为“root”,需要设置密码用来登录节点后台。 选择密钥对,需要选择密钥对,如果没有密钥对,可以单击右边“创建密钥对”按钮创建。 - 父主题: 准备工作
“存储方式”选择“主机存储”时呈现此参数,计算节点成功部署后通过输入的“主机路径”来进行文件的上传。 例如:“192.168.0.61/tmp”,如何在后台查找该路径请参考登录节点的相关描述。 说明: 请确保选择的主机路径具有1000:1000属组权限,否则会影响部分功能使用。 资源分配策略 CPU(Cores)
“存储方式”选择“主机存储”时呈现此参数,计算节点成功部署后通过输入的“主机路径”来进行文件的上传。 例如:“192.168.0.61/tmp”,如何在后台查找该路径请参考登录节点的相关描述。 说明: 请确保选择的主机路径具有1000:1000属组权限,否则会影响部分功能使用。 资源分配策略 CPU(Cores)
、日志文件也会输出到数据目录,供用户查看、获取。 文件管理 文件管理是可信智能计算服务提供的一项管理联邦学习模型文件的功能。参与方无需登录后台手动导入模型文件,通过该功能即可将模型文件上传到数据目录,并支持批量删除。在创建联邦学习作业时可以选到上传的脚本模型等文件,提高了易用性及可维护性。
TICS服务会对两方的数据先进行样本对齐,并对双方共有的数据进行联邦预测,预测的结果会保存在企业A(作业发起方)的计算节点上。企业A可以通过obs服务或者登录到计算节点后台获取到对应路径的文件。 当只有一方提供特征时,预测的结果如下,第一列是用户的id,第二列是用户是否是高价值用户的标签,第三列、第四列是对应的概率:
”可以将作业生成的训练数据集发布到空间。发布时可查看生成数据集的各项属性,包括数据名称(预处理生成的数据集前缀为preprocessed,后缀为train)、数据文件位置、数据结构等。确认无误后,单击确定即可发布数据集。 发布后可在“数据管理>数据创建”页面查看生成的数据集。 图8
以及包含CSV文本的数据目录。目录数据集下必须至少包含一个CSV文件,且多个CSV文件表头结果必须保持一致。以下示例中如果没有特别说明,一般都是CSV格式的文件。 例如,标签方有30条数据,每条数据有1列ID、7列特征和1列标签: ID,f1,f2,f3,f4,f5,f6,f7