检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
实验结果 乳腺癌数据集作业结果 父主题: 横向联邦学习场景
公测 创建纵向联邦学习作业 2 样本对齐支持PSI算法 纵向联邦作业中支持对两方数据集进行样本对齐,在不泄露数据隐私的情况下计算出双方共有的数据,并将共有的数据作为后续特征选择、模型训练的数据集。 公测 创建纵向联邦学习作业 2021年3月 序号 功能名称 功能描述 阶段 相关文档
空间API 统计信息管理 空间管理 数据集管理 联邦分析作业管理 联邦学习作业管理 作业实例管理 审计日志管理 可信节点管理
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
Regression模型本质上还是线性模型,因此模型文件result_10为该线性模型的系数加上偏置项。 图2 查看模型结果文件 本地利用测试集评估模型。可以采用如下脚本,会打印出模型在测试集上的准确率和AUC两个指标。 图3 本地评估模型的Python脚本 父主题: 测试步骤
置连接器,注册数据集,任务执行,查看任务执行日志。 连接器(Connector) 连接器是可信智能计算节点内置的连接特定数据源所需的对象模板,目前支持连接MRS Hive、MySQL、RDS、DWS、ORACLE等多种连接器,并支持扩展增加新的连接器。 数据集(Data set)
Lite资源池已创建完毕。 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考4.1 部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考4.6.4 发布数据。 对接MA的计算节点如果是使用子账号进
获取数据详情 功能介绍 本接口用于获取数据集详情。 调用方法 请参见如何调用API。 URI GET /v1/agents/datasets/{dataset_id} 表1 路径参数 参数 是否必选 参数类型 描述 dataset_id 是 String 数据集id。 支持数字,英文字母,下划线,长度32。
使用场景 购买计算节点页面,选择边缘部署模式。 操作步骤 进入购买计算节点页面。 部署配置选择边缘节点部署。 云租户部署模式下,TICS服务可以按照选取的规格,为客户预置默认资源分配策略。 边缘节点部署模式下,使用的纳管节点为客户机器或者云上虚机,TICS服务无法主动感知到节点资源大小,需客户手动填入。
某个其他机构,不同机构数据所包含的特征相同。 这种情况下,xx医院想申请使用其他机构的乳腺癌患者数据进行乳腺癌预测模型建模会非常困难。因此可以通过华为TICS可信智能计算平台的横向联邦功能,实现在患者隐私不泄露的前提下,利用其他机构的医疗数据提升乳腺癌预测模型的准确率。 进一步地
创建或更新数据集 功能介绍 本接口用于创建或更新数据集。 - 根据是否存在id字段,判断是创建还是更新数据集 - 返回数据集ID 调用方法 请参见如何调用API。 URI POST /v1/agents/datasets 请求参数 表1 请求Header参数 参数 是否必选
当数据集达到目标需求后,单击页面下方的“保存并执行”按键即可将所选取的预处理方法及其参数进行保存。然后页面跳转到作业列表,此处可以查看预处理作业的任务状态和作业状态。 图7 查看预处理作业 发布预处理后的训练数据集。在预处理作业列表,单击“发布”可以将作业生成的训练数据集发布到空
数据持有双方为获取己方与对方数据的交集,在不暴露其它数据的情况下,将需要获取交集的那一部分数据与对方的数据,通过创建并执行可信智能计算服务提供的隐私求交作业,可以得到最终交集数据并保存下来,用于后续的数据分析以及使用。 联合使用场景 用于纵向联邦学习中数据对齐。 父主题: 隐私求交
是否必选 参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练特
参考准备本地横向联邦数据资源 -> 上传数据集文件,将该文件上传到计算节点的挂载路径下,即完成多方安全计算数据集配置。 如果数据集文件不含有csv文件表头,需要用户提供额外的配置文件用来说明数据集每一列的信息。以上述标签方数据集为例,没有表头的数据集文件和数据配置文件的格式如下: 491915
空间成员在计算节点中完成数据发布,参考发布数据。 约束限制 避免作业名重复。 支持本地连接器配置的CSV类型数据集。 支持DWS连接器配置的DWS数据集。 支持API连接器配置的API数据集。 创建实时隐匿查询作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐匿查询 >
E集群子账号权限。 约束限制 避免作业名重复。 必须选择一个已有模型才能创建批量预测作业。 批量预测作业必须选择一个当前计算节点发布的数据集。 创建联邦预测作业 批量预测作业在本地运行,目前支持XGBoost算法、逻辑回归LR算法、深度神经网络FiBiNet算法。 用户登录进入计算节点页面。
按钮,购买CCE集群。 - 自定义节点名称 集群节点名称,会随机生成,用户也可以根据自己需求来指定节点前缀名。 - 规格管理 选择规则类型、可用区、节点数量等。 - 购买时长 购买资源池的时间,用户可以根据续期选择,到期后,会自动清理。 - 自动续费 用户根据需求选择是否选择自动续费。
申请使用数据 数据需求方公司B在自己的计算节点页面上可以查看数据目录,找到数据拥有方公司A创建并发布的数据。 图1 创建数据申请 对数据集单击“申请使用”,在弹窗中填写需要使用的字段和访问需求,保存后可以提交审批,由公司A审核。 访问需求包括: 访问截止时间:设置访问的时间限制,