检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
发布数据集 企业A将自己的需要预测的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建用于预测的数据集。 企业A预测数据集如下: 大数据厂商B仍使用训练时的提供的全量数据作为预测数据集,没有发布新的数据集。 父主题: 使用TICS联邦预测进行新数据离线预测
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
样本对齐 单击右下角的下一步进入“样本对齐”页面,这一步是为了进行样本的碰撞,过滤出共有的数据交集,作为后续步骤的输入。企业A需要选择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
场景描述 某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
为什么空间详情中“作业执行统计”实例数与空间作业中实例数统计不一致? 空间作业中的实例数统计的是实例总个数,而空间详情中“作业执行统计”实例数统计全部实例的总执行次数,可能存在一个实例执行多轮的情况。所以两个实例数统计不一致也是很正常的。
创建联邦预测作业 企业A单击“联邦预测 > 批量预测 > 创建”按钮,进入联邦预测作业的创建页面。企业A需要通过“算法类型”、“训练作业”等筛选条件可以找到用于预测的模型,点选使用的模型后单击“确定”按钮即完成联邦预测作业的创建。 父主题: 使用TICS联邦预测进行新数据离线预测
如果需要执行的作业计算量比较小,也可以根据结果提示,在执行界面的运行参数处设置user.task.memory.size或tics.task.memory.size,将其值设置小于剩余内存,单位GB/MB/KB。 user.task.memory.size:参与方计算节点分配的作业最大内存。
创建可信联邦学习作业 联邦建模的过程由企业A来操作,在“作业管理 > 可信联邦学习”页面单击“创建”,填写作业名称并选择算法类型后单击确定即进入联邦建模作业界面。本文逻辑回归算法为例。 父主题: 使用TICS可信联邦学习进行联邦建模
执行作业时,提示“启动新任务失败,服务器任务队列超出缓存长度”,如何解决? TICS执行作业时,如果当前环境资源不足,会将任务缓存入队列中。任务队列长度默认为10。当空间缓存的任务超出长度时,界面会提示报错。 您可以通过TICS空间页查看是否有作业等待中或正在运行,等待任务运行完成或者停止其他任务后,再执行作业。