检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
样本对齐 单击右下角的下一步进入“样本对齐”页面,这一步是为了进行样本的碰撞,过滤出共有的数据交集,作为后续步骤的输入。企业A需要选择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模
使用TICS联邦预测进行新数据离线预测 场景描述 准备数据 发布数据集 创建联邦预测作业 发起联邦预测 父主题: 纵向联邦建模场景
使用TICS多方安全计算进行联合样本分布统计 场景描述 准备数据 发布数据集 创建样本分布统计作业 执行样本分布联合统计 数据优化 父主题: 纵向联邦建模场景
使用TICS可信联邦学习进行联邦建模 场景描述 准备数据 发布数据集 创建可信联邦学习作业 选择数据 样本对齐 筛选特征 模型训练 模型评估 父主题: 纵向联邦建模场景
获取可信计算节点访问token 功能介绍 本接口用于获取访问token。 用户使用账号密码获取访问token,有效期一天。 账户密码错误超过五次,账户将被锁定1分钟。 调用方法 请参见如何调用API。 URI POST /v1/agent/user/token 请求参数 表1 请求Header参数
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
评估型横向联邦作业流程 基于横向联邦作业的训练结果,可以进一步评估横向联邦模型,将训练好的模型用于预测。 选择对应训练型作业的“历史作业”按钮,获取最新作业的模型结果文件路径。 图1 查看模型结果文件的保存位置 前往工作节点上步骤1展示的路径,下载模型文件。由于Logistic
乳腺癌数据集作业结果 本节实验包含了如下三个部分:(1)训练轮数对联邦学习模型分类性能的影响;(2)迭代次数对联邦学习模型分类性能的影响;(3)参与方数据量不同时,本地独立训练对比横向联邦的模型性能。 不同训练参数对模型准确率、训练时长的影响 训练轮数对模型准确率的影响(迭代次数固定为20)
阶段五:基于MPC算法的高安全级别计算 完成demo验证阶段,为提升数据保护级别,接入以纯密文的状态做计算的更高安全级别的数据,可以通过开启高隐私级别开关,提升空间安全级别。 图1 高隐私级别开关 再次单击作业,审批进行的同时敏感数据被进行了秘密分享加密。DAG图显示了“psi +
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
发布数据集 企业A将自己的需要预测的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建用于预测的数据集。 企业A预测数据集如下: 大数据厂商B仍使用训练时的提供的全量数据作为预测数据集,没有发布新的数据集。 父主题: 使用TICS联邦预测进行新数据离线预测
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练
执行分析作业时,提示“节点内存不足,已拒绝在节点中运行该任务”,如何解决? 执行作业时提运行失败,报错如图1所示: 图1 作业报错信息 TICS针对每个作业,分配了固定的工作内存,当同时运行的作业较多时,可能出现该报错。如图2所示,您可以在TICS空间作业列表查看是否有其他作业正在运行,等待其运行完成,再重试该作业。
数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。
统计型作业的差分隐私保护 本示例作业,以统计各行业的“企业税收总和”与“用电量总和”,进行统计分析: Select industry, sum(tax_bal), sum(electric_bal) from LEAGUE_CREATOR.tax a join
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
可信计算节点发生主备切换,原节点登录地址不可用,如何处理? 若可信节点因为节点故障等原因产生了主备切换的操作,会导致原先可信节点控制台登录地址改变。此时需重新登录TICS管理台,单击前往计算节点,登录最新的节点控制台。 图1 登录最新的节点控制台 原先的可信节点控制台登录后右上角会显示不互信。
为什么空间详情中“作业执行统计”实例数与空间作业中实例数统计不一致? 空间作业中的实例数统计的是实例总个数,而空间详情中“作业执行统计”实例数统计全部实例的总执行次数,可能存在一个实例执行多轮的情况。所以两个实例数统计不一致也是很正常的。