检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
167 216 从上面两张表可以看出: (1)训练轮数对于联邦学习模型的性能影响不大,这主要是由于乳腺癌数据集的分类相对简单,且数据集经过了扩充导致的; (2)增大每个参与方本地模型训练的迭代次数,可以显著提升最终联邦学习模型的性能。 参与方数据量不同时,独立训练对比横向联邦训练的准确率
创建数据集 通过数据集,用户可获取到名下详细的资源列表。同时,对于有敏感信息的数据集,还可以单独设置隐私策略,并在发布到空间侧后对其他参与方生效,限制敏感信息的使用,保障数据安全。 创建结构化数据集 创建数据集前需存在已创建好的连接器,参考创建连接器。 用户登录TICS控制台。
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS多方安全计算进行联合样本分布统计
发布数据集 企业A将自己的需要预测的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建用于预测的数据集。 企业A预测数据集如下: 大数据厂商B仍使用训练时的提供的全量数据作为预测数据集,没有发布新的数据集。 父主题: 使用TICS联邦预测进行新数据离线预测
用于准确评估横向联邦学习得到的模型准确率。此外由于原始的数据集较小,采用了Imbalanced-Learn中的SMOTE算法,进行了数据集的扩充。下表为扩充过后的数据集统计信息。 乳腺癌数据集统计信息。 统计量 取值 特征数目 30 xx医院的训练样本数目 7366 其他机构的训练样本数目
参与方租户名称 dataset_id String 数据集id dataset_intercept_cnt Long 数据集拦截次数 dataset_name String 数据集名称 dataset_use_cnt Long 数据集使用次数 状态码: 401 表6 响应Body参数
发布数据集 企业B分别自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集,并单击“发布”。 企业B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 外部数据共享
两种任务类型。 图2 新建作业 在弹出的界面进行数据选择,选择两方数据集作为整个作业的数据集,必须选择一个当前代理的数据集,另一个数据集可以来自空间中的任意一方。两方的数据集中一方数据集只含有特征,另一方的数据集必须含有标签。 重试:开关开启后,执行失败的作业会根据配置定时进行重
发布数据集 企业A和企业B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集,并单击“发布”。 以企业A为例,数据集信息如下: 隐私求交场景需要将求交的字段设置为“非敏感”的唯一标识。 父主题: 隐私求交黑名单共享场景
图4 连接正常 进入数据管理,进行数据集发布。 图5 新建数据管理 填写参数信息。 图6 填写参数 重复步骤1~7,发布support资助金数据表和power_data能源表。 数据发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。
数据集管理 查询空间已注册数据集列表 父主题: 空间API
是否必选 参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
创建或更新数据集 功能介绍 本接口用于创建或更新数据集。 - 根据是否存在id字段,判断是创建还是更新数据集 - 返回数据集ID 调用方法 请参见如何调用API。 URI POST /v1/agents/datasets 请求参数 表1 请求Header参数 参数 是否必选
数据集管理 获取字段隐私详情 数据集列表 父主题: 计算节点API
批量删除数据集 功能介绍 本接口用于批量删除数据集。 调用方法 请参见如何调用API。 URI POST /v1/agents/datasets/batch-delete 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 [数组元素] 是 Array of strings
发布数据集到空间 功能介绍 本接口用于发布数据集到空间。 调用方法 请参见如何调用API。 URI POST /v1/agents/{agent_id}/datasets/{dataset_id}/publish 表1 路径参数 参数 是否必选 参数类型 描述 agent_id 是
data_type String 数据类型,DWS.DWS类型数据集,LOCAL_CSV.本地文件类型数集据,MRS.HIVE类型数据集,MYSQL.MySql类型数据集,ORACLE.Oracle类型数据集,RDS.RDS类型数据集 枚举值: DWS LOCAL_CSV MRS MYSQL
Array of DatasetListVo objects 数据集列表 表4 DatasetListVo 参数 参数类型 描述 id String 数据集id。 支持数字,英文字母,下划线,长度32。 name String 数据集名称 connector_name String 连接器名称
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模