检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
提升作业性能时,可以修改该参数,参考配置为CCE集群中规格时建议配置范围为4~8,大规格部署时建议配置范围为8~16,具体根据实际需求和情况调整。 user.task.concurrency:在用户所属计算节点计算时的并行度,默认值为1。当需要提升作业性能时,可以修改该参数,参考
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练特
审计日志 审计日志页面是可信智能计算服务提供的一项审计数据流动的功能。通过计算节点侧审计页面信息,用户可以清晰地获知空间中的参与方通过该计算节点运行的任务详情。同时,部署计算节点时若开启BCS功能,审计数据会同步至区块链上。 计算节点侧查看审计日志 用户登录TICS控制台。 进入
在实例列表中,查找待查看计算过程的作业,单击实例ID展开,在操作栏单击“计算过程”。 图4 在计算节点侧查看作业计算过程 计算过程页面可以单击任务节点,查看开始和结束时间等信息。在计算过程页面下方详情列表打开任务详情,可以查看更详细的计算过程信息。 图5 作业计算过程信息详情(截图为多方安全计算作业示例,请以实际作业为准)
使用场景 购买计算节点页面,选择边缘部署模式。 操作步骤 进入购买计算节点页面。 部署配置选择边缘节点部署。 云租户部署模式下,TICS服务可以按照选取的规格,为客户预置默认资源分配策略。 边缘节点部署模式下,使用的纳管节点为客户机器或者云上虚机,TICS服务无法主动感知到节点资源大小,需客户手动填入。
保存后退出。 在节点B上重复步骤3~步骤4操作,注意步骤3中脚本内容应替换为对端节点A的ip。 使用tail /var/log/cron 可以查看定时命令执行情况,务必保证同步命令执行正常。 如何在两个节点间免密ssh登录 登录机器A,执行如下命令 ssh-keygen 遇到需要
数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。
业A不想暴露给企业B自己查询的用户id,因为查询该用户的信息隐含着“该用户是企业A的客户”的信息,存在用户隐私泄露的风险。 企业A和企业B可以使用TICS服务的实时隐匿查询功能,既能满足实时业务高效低延迟的业务需求,又能避免暴露企业A想要查询哪个用户的隐私安全风险。 父主题: 外部数据共享
过文件管理,参与方无需通过登录后台手动导入模型文件,而是直接将模型文件上传到数据目录进行管理。 使用文件管理功能后,创建联邦学习作业时用户可以便捷地选择自己以前上传的执行脚本、训练模型、数据文件、权重参数文件,极大地提高了系统的易用性及可维护性。 创建文件 用户登录TICS控制台。
保存后退出。 在节点B上重复步骤3~步骤4操作,注意步骤3中脚本内容应替换为对端节点A的ip。 使用tail /var/log/cron 可以查看定时命令执行情况,务必保证同步命令执行正常。 如何在两个节点间免密ssh登录 登录机器A,执行如下命令 ssh-keygen 遇到需要
据。 存在已创建的合约。 约束限制 仅用数方操作。 如果用数方一直未审批签署合约,供数方可以撤回合约,重新编辑。一旦用数方确认,则合约内容无法修改。但供数方可中止合约。 对审批中的合约才可以进行签署。 操作步骤 用户登录进入计算节点页面。 在左侧导航树上选择“可信数据交换 > 数据合约”,打开数据合约页面。
数据持有双方为获取己方与对方数据的交集,在不暴露其它数据的情况下,将需要获取交集的那一部分数据与对方的数据,通过创建并执行可信智能计算服务提供的隐私求交作业,可以得到最终交集数据并保存下来,用于后续的数据分析以及使用。 联合使用场景 用于纵向联邦学习中数据对齐。 父主题: 隐私求交
数据集,最后单击“保存并提交审批”按钮完成作业创建。等审批方审批完后,就可以执行任务。 注意:选择的数据集中需要有样本id列,后面预测需要使用。 图2 新建作业 等待参与方审批,当参与方单击“同意”后,就可以执行任务了。 图3 审批详情 父主题: 实时预测
该参数的值为创建新容器的内存。 样本粗筛:当己方数据过大无法导出成文本文件时,可以使用样本粗筛获取合作方的明文id前缀,使用大数据组件筛选出id前缀相符的数据,达到减少数据量的目的。样本粗筛时还可以选择多个标记为“非敏感”的字段进行过滤,结果会按照“id前缀,过滤字段1,过滤字段2……”的格式保存成csv文本文件。
v3_req -extensions v3_ca”命令,在当前目录(容器的根目录)下生成新的证书文件。执行该命令的过程中可以交互式地填入地区、用户名等身份信息,也可以直接按回车键采取默认值。 执行“rm -f /opt/postgres/server.*”命令,删除旧的证书文件。 执行“mv
本案例以“小微企业信用评分”的场景为例。 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算。 图1 企业信用评估应用场景示意图
模型评估 训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算
某个其他机构,不同机构数据所包含的特征相同。 这种情况下,xx医院想申请使用其他机构的乳腺癌患者数据进行乳腺癌预测模型建模会非常困难。因此可以通过华为TICS可信智能计算平台的横向联邦功能,实现在患者隐私不泄露的前提下,利用其他机构的医疗数据提升乳腺癌预测模型的准确率。 进一步地
作业后的开发按钮,进入作业开发页面。该页面描述了字段的属性,如字段名称和分布类型。另外可以通过列表下方的“描述性统计”按键来统计字段的统计量,包括缺失值数量、最大值、最小值及数据分布图。还可以通过为字段添加预处理方法。 图3 作业开发页面 进行字段描述性统计。单击列表下方的“描述
批量预测 批量预测通过在计算节点后台发起离线预测任务的方式,在任务完成后可以获得指定数据集中所有样本的预测结果。 创建批量预测作业 编辑批量预测作业 执行批量预测作业 删除批量预测作业 父主题: 联邦预测作业