检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
申请使用数据 数据需求方公司B在自己的计算节点页面上可以查看数据目录,找到数据拥有方公司A创建并发布的数据。 图1 创建数据申请 对数据集单击“申请使用”,在弹窗中填写需要使用的字段和访问需求,保存后可以提交审批,由公司A审核。 访问需求包括: 访问截止时间:设置访问的时间限制,超过访问时间后
数据集发布 前提条件 完成数据准备工作。 操作步骤 进入TICS服务控制台。 在计算节点管理中,找到购买的计算节点,通过登录地址,进入计算节点控制台。 图1 前往计算节点 登录计算节点后,在下图所述位置新建连接器。 图2 新建连接器 输入正确的连接信息,建立数据源和计算节点之间的安全连接
阶段一:数据发布 前提条件 完成数据准备工作。 操作步骤 进入TICS服务控制台。 在计算节点管理中,找到购买的计算节点,通过登录地址,进入计算节点控制台。 图1 前往计算节点 登录计算节点后,在下图所述位置新建连接器。 图2 新建连接器 输入正确的连接信息,建立数据源和计算节点之间的安全连接
开发数据预处理作业 数据预处理通常被用于评估/训练作业场景。本文以使用训练数据训练预处理作业,然后再将预处理方法应用于评估/预测数据为例进行说明。 训练数据预处理作业 评估/预测数据预处理 前提条件 已提前准备好训练数据,和评估/预测数据。 数据预处理作业选择的结构化数据集(包括CSV
创建数据预处理作业 数据预处理是训练机器学习模型的一个重要前置步骤,其主要是通过转换函数将特征数据转换成更加适合算法模型的特征数据过程。TICS特征预处理功能能够实现对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。
开发规范 规则 多方安全计算中,基础的sql语法都能够支持,但无法支持所有特殊语法。 语法规则如下: 图1 语法规则 建议及示例 查询示例中两表join场景,建议将大表置于join左侧,小表置于join右侧,可借助初筛的能力,进行小表在大表端的加密过滤,提升性能。 建议示例: Select
批量删除数据集 功能介绍 本接口用于批量删除数据集。 调用方法 请参见如何调用API。 URI POST /v1/agents/datasets/batch-delete 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 [数组元素] 是 Array of strings
创建或更新数据集 功能介绍 本接口用于创建或更新数据集。 - 根据是否存在id字段,判断是创建还是更新数据集 - 返回数据集ID 调用方法 请参见如何调用API。 URI POST /v1/agents/datasets 请求参数 表1 请求Header参数 参数 是否必选
发布数据集到空间 功能介绍 本接口用于发布数据集到空间。 调用方法 请参见如何调用API。 URI POST /v1/agents/{agent_id}/datasets/{dataset_id}/publish 表1 路径参数 参数 是否必选 参数类型 描述 agent_id 是
数据集列表 功能介绍 查询空间中可用(已发布)数据集列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/available-datasets 表1 路径参数 参数 是否必选 参数类型 描述 project_id
步骤6:空间成员发布数据 发布数据 空间成员登录TICS控制台。进入TICS控制台后,单击页面左侧“计算节点管理”,进入“计算节点管理”页面。 在“计算节点管理”页,查找需要发布数据的计算节点名称,单击“计算节点名称”进入计算节点详情页。 图1 选择计算节点 在“计算节点详情”页,
数据集列表展示 功能介绍 本接口用于获取数据集信息。 调用方法 请参见如何调用API。 URI GET /v1/agents/datasets 表1 Query参数 参数 是否必选 参数类型 描述 offset 是 Integer 起始位置。 当前页面数,默认为0,取值0-2147483647
乳腺癌数据集作业结果 本节实验包含了如下三个部分:(1)训练轮数对联邦学习模型分类性能的影响;(2)迭代次数对联邦学习模型分类性能的影响;(3)参与方数据量不同时,本地独立训练对比横向联邦的模型性能。 不同训练参数对模型准确率、训练时长的影响 训练轮数对模型准确率的影响(迭代次数固定为
简介 背景信息 本案例以“小微企业信用评分”的场景为例。 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算
场景描述 本章节以“小微企业信用评分”场景为例。 背景信息 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算
创建数据集时,不允许使用哪些名字? 问题描述 创建数据集时,对数据集名字有一定约束。 解决办法 创建数据集时,不允许使用如下名字: <EOF> A ABS ABSENT ABSOLUTE ACTION ADA ADD ADMIN AFTER ALL ALLOCATE ALLOW ALTER
查询空间已注册数据集列表 功能介绍 功能描述:用户可以使用该接口查询空间已注册数据集列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/leagues/{league_id}/datasets 表1 路径参数 参数 是否必选 参数类型 描述
创建横向训练型作业 前提条件 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择存储方式和数据目录,参考部署计算节点。 空间成员完成数据集准备工作,参考准备本地横向联邦数据资源。 空间成员在数据目录中完成数据发布,参考发布数据。 参与方的计算节点如果是采用云租户部署
运行作业时,提示存在数据泄露风险,怎么处理? 如果错误提示是可能泄露了唯一标识(may disclose the specific value of the uniqueID…),则检查自己的最终输出结果中,是否有和自己做Join连接的ID完全对应的字段。例如输出了名字,而名字可以倒推身份证
场景描述 背景信息 本案例以“预测乳腺癌是良性/恶性”的场景为例。假设一部分的乳腺癌患者数据存储在xx医院,另一部分数据存储在某个其他机构,不同机构数据所包含的特征相同。 这种情况下,xx医院想申请使用其他机构的乳腺癌患者数据进行乳腺癌预测模型建模会非常困难。因此可以通过华为TICS