检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据预处理 创建数据预处理作业 开发数据预处理作业 父主题: 管理数据
外部数据共享 场景描述 准备数据 发布数据集 创建实时隐匿查询作业 执行实时隐匿查询作业 父主题: 实时隐匿查询场景
可信数据交换 概述 创建申请 确认申请 创建合约 签署合约 查看履约记录 查看作业计算过程和作业报告
数据集管理 获取字段隐私详情 数据集列表 父主题: 计算节点API
_$ 长度0-128 data_type String 连接器数据类型 1.RDS--云数据库类型 2.MYSQL--MySQL类型 3.DWS--高斯数据库类型 4.MRS--MapReduce数据类型 5.ORACLE--ORACLE数据类型 6.LOCAL_CSV--本地数据类型
数据集管理 查询空间已注册数据集列表 父主题: 空间API
您需要配置CCE集群的部署规格、虚拟私有云、子网、节点密码、弹性IP等信息。 说明: CCE集群的部署规格根据您的业务量自行选择。 所创建CCE集群的虚拟私有云、子网,应与数据源所在云服务(如MRS Hive、DWS等)的虚拟私有云、子网保持一致,以确保网络互通。
您需要配置CCE集群的部署规格、虚拟私有云、子网、节点密码、弹性IP等信息。 说明: CCE集群的部署规格根据您的业务量自行选择。 所创建CCE集群的虚拟私有云、子网,应与数据源所在云服务(如MRS Hive、DWS等)的虚拟私有云、子网保持一致,以确保网络互通。
数据集注册管理 数据集列表展示 创建或更新数据集 批量删除数据集 发布数据集到空间 获取数据详情 父主题: 计算节点API
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。
name String 数据集名称 connector_name String 连接器名称 data_source String 数据库名称 table_name String 表名称 data_type String 连接器类型1.MRS,2.DLI,3.OBS,4.MODEL_ARTS
dataset_type=MRS 响应示例 状态码: 200 查询可用数据集列表成功 { "total" : 3, "lists" : [ { "dataset" : [ { "id" : "45cd8dc4d2884cb0a73fdd495566aded
可信数据交换场景 场景描述 创建数据 申请使用数据 审批数据申请 创建合约 父主题: 使用场景
创建数据 数据拥有方公司A创建和发布数据集。可供选择有两种数据资产类型:结构化数据集、非结构化数据集。创建数据集后,发布数据集,此时对空间内的所有代理可见。 父主题: 可信数据交换场景
图2 前往计算节点 在“数据管理”页签找到待发布的数据名称,单击“发布”,弹出发布数据集选择框。 图3 发布数据 在发布数据集选择框中选择需要发布的合作方,单击“发布”,数据就会被同步到对应合作方作业管理的数据集中。数据集创建者默认拥有数据集权限。
数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。
准备数据 企业A的实时业务不需要准备数据,在发起查询时通过参数传递需要查询的用户id。
数据准备 数据准备 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
准备数据 A方提供了待查询的用户ID数据,样例如下: blacklist_query.csv id 1914fd1aef9346e7a1b0a63c95aa918e 6b86b273ff34fce19d6b804eff5a3f57 66985617b4f74d14b4eceeaa25d61f5e