检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS多方安全计算进行联合样本分布统计
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 使用TICS可信联邦学习进行联邦建模
首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征
进入TICS服务控制台。 在计算节点管理中,找到购买的计算节点,通过登录地址,进入计算节点控制台。 图1 前往计算节点 登录计算节点后,在下图所述位置新建连接器。 图2 新建连接器 输入正确的连接信息,建立数据源和计算节点之间的安全连接。 图3 输入信息 建立完成后,连接器显示正常说明连接正常。
在左侧导航树上选择“可信数据交换 > 数据申请”,打开数据申请页面。 在数据申请页面单击“我收到的”,查看供数方节点收到的申请列表。 数据来源为数据需求方公司B发送来的使用申请:申请交换的数据集、数据集字段(结构化数据才有该字段)。 在申请列表中选择申请状态为“待处理”,单击“查看
首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4
数据预处理是训练机器学习模型的一个重要前置步骤,其主要是通过转换函数将特征数据转换成更加适合算法模型的特征数据过程。TICS特征预处理功能能够实现对数据的探索、分析、规整以及转换,以达到数据在训练模型中可使用、可实用,在TICS平台内完成数据处理到建模的闭环。 假设您有如下数据集(
训练轮数 训练的轮数,每一轮训练结束都会对各方训练出的权重进行一次安全聚合。 重试 开关开启后,执行失败的作业会根据配置定时进行重试,仅对开启后的执行作业生效。 开关关闭后,关闭前已触发重试的作业不受影响,仅对关闭后的执行作业生效。 CPU配额 执行作业使用容器的CPU核数。 内存配额
阶段二:隐私规则防护 使用TICS的隐私规则防护能力确保数据安全。 前提条件 完成数据发布。 操作步骤 进入多方安全计算的作业执行界面,单击创建。 图1 创建作业 在作业界面中,按照1~4提供的案例和SQL语句进行作业测试。 图2 作业界面 假设有人输入以下代码试图直接查询敏感数据。
保证目录下至少包含一个csv文件,且所有csv文件的特征数保持一致。此外,选择数据集的原始文件,需要指定csv文件的“分隔符”、“是否包含表头”。“是否包含表头”是指文件的第一行是否是每一个字段的名称。 数据结构:配置每个字段的类别标签,包括以下几种: “字段类型”:支持BOOL
多方安全计算”页面单击创建,进入sql开发页面,展开左侧的“合作方数据”可以看到企业A、大数据厂商B发布的不同数据集。 单击某一个数据集可以看到数据集的表结构信息。 此时企业A可以编写如下的sql语句统计双方的数据碰撞后的正负样本总数,正负样本总数相加即为双方共有数据的总数。 select sum(
法模型的特征数据。 使用场景 连接器使用场景:参与方的数据信息分布在不同的资源服务上,即可通过连接器管理功能来快速连接到名下的各类资源服务。 数据创建使用场景:参与方加入空间后,需要提供自己的数据集信息,用户即可通过数据创建功能,获取到名下详细的资源列表。同时,有敏感信息的数据,
将加密的二进制字节内容使用用户上传的密钥和数据的iv字节解密。 用户上传的密钥是指在上传密钥上传的AES密钥。 binary:必填。加密的数据,参数类型为字节数组byte[]类型。 binary:必填。加密时使用的iv信息,参数类型为字节数组byte[]类型。 返回解密后的字节数组。
创建合约 数据拥有方公司A同意数据需求方公司B的数据使用申请后,可以由公司A创建合约,合约是需要双方同意的数据使用证明。 合约内容包括:合约名称、合约描述、数据信息、公司B的访问需求、访问限制和自定义限制。其中数据信息、公司B的访问需求来自于公司B的数据使用申请,合约名称、合约描述、访问
隐私规则防护 使用TICS的隐私规则防护能力确保数据安全。 前提条件 完成数据集发布。 操作步骤 进入多方安全计算的作业执行界面,单击创建。 图1 创建作业 在作业界面中,按照1~4提供的案例和SQL语句进行作业测试。 图2 作业界面 假设有人输入以下代码试图直接查询敏感数据。 select
创建数据 数据拥有方公司A创建和发布数据集。可供选择有两种数据资产类型:结构化数据集、非结构化数据集。创建数据集后,发布数据集,此时对空间内的所有代理可见。 父主题: 可信数据交换场景
用于处理评估/预测数据的数据预处理作业。注意,作业中所选的数据集应为评估/预测数据集,且字段定义、尤其是分布类型的定义与之前的训练数据集相同。 单击创建的数据预处理作业后的开发按钮,进入作业开发页面。然后单击左上角的“关联历史作业”,在弹窗中选择训练数据的预处理作业后,单击“保存”。
指计算节点所属的CCE或IEF容器的工作负载,目前支持“OBS存储”和“主机存储”方式。“OBS存储”方式是将OBS服务中的路径映射到服务容器内的本地路径,“主机存储”方式是指将计算节点所在机器的本地路径映射到服务容器内的本地路径。 主机路径 挂载使用的容器外部的路径,用于服务容
概述 基于数据胶囊技术,将用户配置属性嵌入到数据加密策略中,只有匹配属性的用户才能打开文件,达到数据出域后仍然主权可控的目的。 进行数据交换的角色分为用数方和供数方,用数方通过发送申请传递数据使用需求;供数方确认使用需求后,创建合约发送到供数方进行签署,一旦合约生效,数据交换作业就可以执行。
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict