检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取字段隐私详情 功能介绍 获取空间中已发布数据集字段信息,包括隐私属性 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/datasets/{dataset_id}/schema-info 表1 路径参数
获取数据详情 功能介绍 本接口用于获取数据集详情。 调用方法 请参见如何调用API。 URI GET /v1/agents/datasets/{dataset_id} 表1 路径参数 参数 是否必选 参数类型 描述 dataset_id 是 String 数据集id。 支持数字,英文字母,下划线,长度32。
签字段(label)配置为字段类型:INTEGER,字段类别:标签。 图3 配置数据集参数 发布数据集。 图4 发布数据集 数据集发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。 父主题: 测试步骤
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
数据申请”,打开数据申请页面。 在数据申请页面单击“我收到的”,查看供数方节点收到的申请列表。 数据来源为数据需求方公司B发送来的使用申请:申请交换的数据集、数据集字段(结构化数据才有该字段)。 在申请列表中选择申请状态为“待处理”,单击“查看详情”了解用数方需求。根据实际情况同意或者驳回申请。 父主题:
创建对应类型的连接器,并通过这些连接器访问到各类型资源的结构化信息。当前支持MRS服务(Hive)、本地数据集、RDS数据集、DWS数据集、Oracle数据集、Mysql数据集,后续会支持更多华为云服务及原生服务的资源访问功能。连接信息中的敏感部分不会离开参与方侧。 数据管理包含
模型评估 训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算
创建隐私求交作业 前提条件 参与计算的双方需要在其代理节点上创建好各自的数据集,并需要确保数据集含有非敏感的唯一标识字段。 创建作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐私求交”,打开隐私求交作业列表页面。 在隐私求交作业列表页面,单击“创建”。 图1
作业生成的训练数据集发布到空间。发布时可查看生成数据集的各项属性,包括数据名称(预处理生成的数据集前缀为preprocessed,后缀为train)、数据文件位置、数据结构等。确认无误后,单击确定即可发布数据集。 发布后可在“数据管理>数据创建”页面查看生成的数据集。 图8 查看生成的数据集
空间成员在计算节点中完成数据发布,参考发布数据。 约束限制 避免作业名重复。 支持本地连接器配置的CSV类型数据集。 支持DWS连接器配置的DWS数据集。 支持API连接器配置的API数据集。 创建实时隐匿查询作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐匿查询
窗中填写要预测的“样本id”和“模型特征”对应的数值,然后单击“预测”,就会有系统弹窗弹出,显示预测结果。 注意:样本id从创建作业选择数据集的样本id列获取。 图2 发起预测 父主题: 实时预测
a8ad73d567e348f1ace5f5b9d499b683,保存备用。 创建数据集 连接创建成功后,调用创建或更新数据集API创建数据集,数据集样例如下: 连接器选择上一步创建的mysql-con,数据集名称:dataset_test。 创建的数据集对应的mysql数据库名称为demo1,表名称为mys
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
创建申请 用数方可以在数据目录选取需要的数据集,创建数据申请并描述需求,发送至供数方审视需求。 支持的数据源类型:CSV或者二进制的本地文件、MySQL、Hive,其中MySQL和Hive的数据集配置可参照管理数据章节。 前提条件 空间组建完成,参考组建空间。 空间成员完成计算节
在弹出的界面,继续配置可信联邦学习作业的参数,参数配置参考表1。 图3 配置参数 “数据集配置”的“可选数据列表”: 本地运行环境时,展示的是通过本地连接器发布的本地数据。 “评估型作业”只能选择当前计算节点的一个数据集。 表1 作业参数说明 参数名 参数描述 作业名称 用户自定义作业的名称
在界面左侧选择“审计日志”,在弹出的界面查看详细信息。 图3 审计日志 事件信息内容主要有:参与方[参与方别名]创建[作业类型]作业[作业名称:作业实例id],使用数据集[数据集名称],耗费[时间],输出[条数]。 多方安全计算作业中的作业详情信息,即SQL语句也会参与审计,但该信息属于敏感信息不会上链。 父主题:
的作业,单击“发起预测”,在系统弹窗中填写“分类阈值”,勾选数据集发起联邦预测。 如果在创建联邦预测作业 步骤4中勾选的模型不包含标签方特征,联邦预测支持只勾选己方数据集发起单方预测。 图1 发起预测 图2 勾选数据集 在“联邦预测”页面批量预测Tab页单击“历史预测”,可以“查看结果”和“作业报告”。
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
图4 连接正常 进入数据管理,进行数据集发布。 图5 新建数据管理 填写参数信息。 图6 填写参数 重复步骤1~7,发布support资助金数据表和power_data能源表。 数据发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。
图3 前往计算节点 选择界面左侧“数据管理>数据预处理”,单击“创建”,可输入作业名称、描述及数据集,单击保存。若当前选不到目标数据集,可查看该数据集是否已参与其他的预处理作业。 目标数据集需要对所选字段的分布类型进行严格定义。处理评估/预测数据前建议先使用训练数据进行预处理,以确保当数据处理达到目标需求。