检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
申请使用数据 数据需求方公司B在自己的计算节点页面上可以查看数据目录,找到数据拥有方公司A创建并发布的数据。 图1 创建数据申请 对数据集单击“申请使用”,在弹窗中填写需要使用的字段和访问需求,保存后可以提交审批,由公司A审核。 访问需求包括: 访问截止时间:设置访问的时间限制,
开发数据预处理作业 数据预处理通常被用于评估/训练作业场景。本文以使用训练数据训练预处理作业,然后再将预处理方法应用于评估/预测数据为例进行说明。 训练数据预处理作业 评估/预测数据预处理 前提条件 已提前准备好训练数据,和评估/预测数据。 数据预处理作业选择的结构化数据集(包括
横向联邦训练作业对接MA 前提条件 MA Lite资源池已创建完毕。 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考4.1 部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考4
数据准备 数据准备 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。 政府信息提供方的数据tax和su
准备数据 A方提供了待查询的用户ID数据,样例如下: blacklist_query.csv id 1914fd1aef9346e7a1b0a63c95aa918e 6b86b273ff34fce19d6b804eff5a3f57 66985617b4f74d14b4eceeaa25d61f5e
阶段二:隐私规则防护 使用TICS的隐私规则防护能力确保数据安全。 前提条件 完成数据发布。 操作步骤 进入多方安全计算的作业执行界面,单击创建。 图1 创建作业 在作业界面中,按照1~4提供的案例和SQL语句进行作业测试。 图2 作业界面 假设有人输入以下代码试图直接查询敏感数据。
查看作业计算过程和作业报告 在空间侧查看作业计算过程和作业报告 用户登录TICS控制台。 在左侧导航树上单击“空间作业”,打开“空间作业”页面。 在作业列表上,单击对应作业操作栏的“作业报告”。可在弹出的页面查看作业报告。 图1 空间侧查看作业报告 空间侧不支持查看作业执行结果,
创建数据预处理作业 数据预处理是训练机器学习模型的一个重要前置步骤,其主要是通过转换函数将特征数据转换成更加适合算法模型的特征数据过程。TICS特征预处理功能能够实现对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。
为什么我的计算结果每次计算时结果都不一样? 当空间开启了“结果差分隐私”开关时, 对敏感数据字段的sum操作都会添加一个差分噪声,来保护单条敏感数据不被泄露。 如果需要更精确的结果, 可联系空间管理员关闭“结果差分隐私”开关, 或者联系敏感字段的合作方修改字段分类。
阶段四:基本计算能力验证 验证TICS的基础计算能力,以计算各企业在2021年的价值评分,用于评估信贷能力,其中的公式仅为简单的参考计算式。 前提条件 完成审批防护。 操作步骤 执行如下的sql作业。 select c.id as `企业id`, 0.5 * a.tax_bal
查询联邦分析作业列表 功能介绍 查询联邦分析作业列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/sql-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
新建或更新连接器 功能介绍 本接口用于创建或更新连接器。 - 根据是否存在connector_id字段,判断是创建还是更新连接器 - 创建mysql连接器时需上传驱动文件,详见应用示例 - 该接口需将请求body转换为json字符串,详见请求示例 - 返回连接器ID
查询实例执行状态 功能介绍 查询实例执行状态 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/job-instances/{instance_id}/status 表1 路径参数 参数 是否必选 参数类型
数据集列表 功能介绍 查询空间中可用(已发布)数据集列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/available-datasets 表1 路径参数 参数 是否必选 参数类型 描述 project_id
隐私规则防护 使用TICS的隐私规则防护能力确保数据安全。 前提条件 完成数据集发布。 操作步骤 进入多方安全计算的作业执行界面,单击创建。 图1 创建作业 在作业界面中,按照示例一和示例二提供的案例和SQL语句进行作业测试。 图2 作业界面 示例一: 假设有人输入以下代码试图直接查询敏感数据。
查询作业执行结果抽样 功能介绍 本接口用于查询分析类型作业执行结果抽样。 调用方法 请参见如何调用API。 URI GET /v1/agents/{agent_id}/job-instances/{instance_id}/sample 表1 路径参数 参数 是否必选 参数类型 描述
获取字段隐私详情 功能介绍 获取空间中已发布数据集字段信息,包括隐私属性 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/datasets/{dataset_id}/schema-info 表1 路径参数
查询作业实例列表 功能介绍 本接口用于查询作业实例列表。 调用方法 请参见如何调用API。 URI GET /v1/agents/{agent_id}/job-instances 表1 路径参数 参数 是否必选 参数类型 描述 agent_id 是 String 可信计算节点id
发布数据集 企业B分别自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集,并单击“发布”。 企业B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 外部数据共享
数据准备 乳腺癌数据集从UCI获取,该数据集只包含连续类型特征,因此对所有特征使用Scikit-Learn的StandardScaler进行了归一化。为了模拟横向联邦学习场景,将数据集随机划分为三个大小类似的部分:(1)xx医院的训练集;(2)其他机构的训练集;(3)独立的测试集