检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取字段隐私详情 功能介绍 获取空间中已发布数据集字段信息,包括隐私属性 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/datasets/{dataset_id}/schema-info 表1 路径参数
创建数据 数据拥有方公司A创建和发布数据集。可供选择有两种数据资产类型:结构化数据集、非结构化数据集。创建数据集后,发布数据集,此时对空间内的所有代理可见。 父主题: 可信数据交换场景
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
在“可信联邦学习”页面,单击“创建”。 图1 创建作业 在弹出的对话框中配置作业名称相关参数,完成后单击“确定”。 图2 新建作业 在弹出的界面,继续配置可信联邦学习作业的参数,参数配置参考表1。 图3 配置参数 “数据集配置”的“可选数据列表”: 本地运行环境时,展示的是通过本地连接器发布的本地数据。
创建对应类型的连接器,并通过这些连接器访问到各类型资源的结构化信息。当前支持MRS服务(Hive)、本地数据集、RDS数据集、DWS数据集、Oracle数据集、Mysql数据集,后续会支持更多华为云服务及原生服务的资源访问功能。连接信息中的敏感部分不会离开参与方侧。 数据管理包含
签字段(label)配置为字段类型:INTEGER,字段类别:标签。 图3 配置数据集参数 发布数据集。 图4 发布数据集 数据集发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。 父主题: 测试步骤
数据申请”,打开数据申请页面。 在数据申请页面单击“我收到的”,查看供数方节点收到的申请列表。 数据来源为数据需求方公司B发送来的使用申请:申请交换的数据集、数据集字段(结构化数据才有该字段)。 在申请列表中选择申请状态为“待处理”,单击“查看详情”了解用数方需求。根据实际情况同意或者驳回申请。 父主题:
创建隐私求交作业 前提条件 参与计算的双方需要在其代理节点上创建好各自的数据集,并需要确保数据集含有非敏感的唯一标识字段。 创建作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐私求交”,打开隐私求交作业列表页面。 在隐私求交作业列表页面,单击“创建”。 图1
作业生成的训练数据集发布到空间。发布时可查看生成数据集的各项属性,包括数据名称(预处理生成的数据集前缀为preprocessed,后缀为train)、数据文件位置、数据结构等。确认无误后,单击确定即可发布数据集。 发布后可在“数据管理>数据创建”页面查看生成的数据集。 图8 查看生成的数据集
空间成员在计算节点中完成数据发布,参考发布数据。 约束限制 避免作业名重复。 支持本地连接器配置的CSV类型数据集。 支持DWS连接器配置的DWS数据集。 支持API连接器配置的API数据集。 创建实时隐匿查询作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐匿查询
窗中填写要预测的“样本id”和“模型特征”对应的数值,然后单击“预测”,就会有系统弹窗弹出,显示预测结果。 注意:样本id从创建作业选择数据集的样本id列获取。 图2 发起预测 父主题: 实时预测
模型评估 训练时的评估指标是用训练的数据集中随机采样的记录计算的,完成训练后企业A也可以使用其他的数据集对同一个模型进行多次的评估。单击“发起评估”选择训练参与方不同的数据集即可发起模型评估。 至此使用可信联邦学习进行联邦建模的过程已经完成,企业A已经训练出了一个符合自己要求的算
a8ad73d567e348f1ace5f5b9d499b683,保存备用。 创建数据集 连接创建成功后,调用创建或更新数据集API创建数据集,数据集样例如下: 连接器选择上一步创建的mysql-con,数据集名称:dataset_test。 创建的数据集对应的mysql数据库名称为demo1,表名称为mys
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
器发布的本地数据。 “训练型作业”同一个计算节点只能选一个数据集,但是一个作业必须要选两个及两个以上的数据集才能做训练。 表1 作业参数说明 参数名 参数描述 作业名称 用户自定义作业的名称,只能包含英文字母、数字、中文、“-”、“_”、“.”,且长度为1~128个字符 描述 作业的详细描述信息。
页,单击创建。 图1 创建作业 在弹出的对话框中编辑“作业名称”,选择“算法类型”。 选择“算法类型”之后,勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,再勾选”选择数据集”列表中参与方预测要用的某一数据集,最后单击“保存并提交审批”按钮完成作业创建。等审批方审批完后,就可以执行任务。
创建申请 用数方可以在数据目录选取需要的数据集,创建数据申请并描述需求,发送至供数方审视需求。 支持的数据源类型:CSV或者二进制的本地文件、MySQL、Hive,其中MySQL和Hive的数据集配置可参照管理数据章节。 前提条件 空间组建完成,参考组建空间。 空间成员完成计算节
在界面左侧选择“审计日志”,在弹出的界面查看详细信息。 图3 审计日志 事件信息内容主要有:参与方[参与方别名]创建[作业类型]作业[作业名称:作业实例id],使用数据集[数据集名称],耗费[时间],输出[条数]。 多方安全计算作业中的作业详情信息,即SQL语句也会参与审计,但该信息属于敏感信息不会上链。 父主题:
的作业,单击“发起预测”,在系统弹窗中填写“分类阈值”,勾选数据集发起联邦预测。 如果在创建联邦预测作业 步骤4中勾选的模型不包含标签方特征,联邦预测支持只勾选己方数据集发起单方预测。 图1 发起预测 图2 勾选数据集 在“联邦预测”页面批量预测Tab页单击“历史预测”,可以“查看结果”和“作业报告”。
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景