检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
填4-16左右,不建议超过30。 图1 填写参数 tics.task.concurrency参数提升的是tics平台提供的计算节点并发度,一般填写4左右即可,不建议超过8。 数据量提前过滤 作业运行参数中增加join.runtime.filter参数为true。 开启初筛后,做P
己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练特征;过低的iv值没有区分性会造成训练资源的浪费,过高的iv值又过于突出可能会过度影响训练出来的模型。
创建合约 数据拥有方公司A同意数据需求方公司B的数据使用申请后,可以由公司A创建合约,合约是需要双方同意的数据使用证明。 合约内容包括:合约名称、合约描述、数据信息、公司B的访问需求、访问限制和自定义限制。其中数据信息、公司B的访问需求来自于公司B的数据使用申请,合约名称、合约描
须保证目录下至少包含一个csv文件,且所有csv文件的特征数保持一致。 非结构化数据是指数据结构属性不规则、不完整的数据,例如二进制文件、图片等。 创建api数据集 用户登录TICS控制台。 进入TICS控制台后,单击页面左侧“计算节点管理”,进入计算节点管理页面。 在“计算节点
、以达到机器学习的使用标准,需要基于对数据的理解,对数据进行特征预处理。例如: job字段是多类别的变量,其值0、1、2实际没有大小之分,一般会将该特征转换成向量,如值为0用向量[1, 0, 0]表示,1用向量[0,1,0]表示,2用向量[0, 0, 1]表示,此即为onehot编码。
步骤6:空间成员发布数据 发布数据 空间成员登录TICS控制台。进入TICS控制台后,单击页面左侧“计算节点管理”,进入“计算节点管理”页面。 在“计算节点管理”页,查找需要发布数据的计算节点名称,单击“计算节点名称”进入计算节点详情页。 图1 选择计算节点 在“计算节点详情”页
以及包含CSV文本的数据目录。目录数据集下必须至少包含一个CSV文件,且多个CSV文件表头结果必须保持一致。以下示例中如果没有特别说明,一般都是CSV格式的文件。 例如,标签方有30条数据,每条数据有1列ID、7列特征和1列标签: ID,f1,f2,f3,f4,f5,f6,f7