检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图2 作业界面 假设有人输入以下代码试图直接查询敏感数据。 select tax_bal, id from league_creator.tax 系统提示不支持进行敏感数据的SELECT操作。
图2 作业界面 示例一: 假设有人输入以下代码试图直接查询敏感数据。 select tax_bal, id from league_creator.tax 系统提示不支持进行敏感数据的SELECT操作。
已获取到了SFS_Turbo文件系统的挂载地址。 本端VPC指子网下没有SFS_Turbo文件系统,对端VPC则是子网下存在SFS_Turbo文件系统 操作步骤 登录本端VPC下的ECS服务器,登录ECS服务器的方式有两种。
图8 文件系统ID 已有SFS_Turbo 如果已有的SFS_Turbo文件系统,打开SFS服务台,找到SFS_Turbo页面,页面上会显示已有的SFS_Turbo文件系统列表。 图9 文件系统列表 获取文件系统ID请参考步骤6。
创建隐私求交作业 前提条件 参与计算的双方需要在其代理节点上创建好各自的数据集,并需要确保数据集含有非敏感的唯一标识字段。 创建作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐私求交”,打开隐私求交作业列表页面。 在隐私求交作业列表页面,单击“创建”。
图1 高隐私级别开关 再次单击作业,审批进行的同时敏感数据被进行了秘密分享加密。DAG图显示了“psi + 秘密分享”的全过程流向,基本符合业界已公开的PSI算法流程和秘密分享流程。 图2 加密流程 图3 加密流程 父主题: 基于TICS实现端到端的企业积分查询作业
图1 高隐私级别开关 再次单击作业,审批进行的同时敏感数据被进行了同态加密。DAG图显示了“psi + 同态”的全过程流向,基本符合业界已公开的PSI算法流程和同态加密流程。 图2 加密流程 图3 加密流程 父主题: 可验证代码示例
敏感级别:包含敏感、非敏感两个选项。 敏感:涉及隐私的数据, 例如薪水、 消费金额等。 非敏感:不涉及隐私的数据, 例如所处城市、公司类型等。 脱敏:勾选后,该字段内容将在分析结果中加密呈现,否则明文呈现。默认不勾选(作业发起方所属字段不做脱敏)。
开启空间中的差分隐私开关保护敏感数据,符合差分隐私条件的统计作业,会自动应用差分隐私算法对计算结果进行加噪保护, 在一定误差范围内保证数据无法被恶意偷取。
操作步骤 敏感数据被查询时,可以在审批详情中,看到是否使查询敏感数据的结果可见,可由该提供方进行识别,并进行拒绝操作。 图1 审批详情 在审批详情中也可看到两个字段相加的情况,如下图所示。
敏感(Sensitive) 涉及隐私的数据,例如薪水、纳税、用电量、成交量等。 非敏感(Nonsensitive) 不涉及隐私的数据, 例如所处城市、公司类型等。 脱敏(Desensitization) 按照一定的算法,将原始数据的敏感部分隐去。
如果错误提示是可能泄露的敏感数据(may disclose the value of the measurement…),则查看分组时选择的键是否有问题,不建议选用分类后组内数量非常少的分组键,这种分组键容易在求和后,泄露实际的敏感数据。
多方融合分析 对接多种主流数据存储系统,为数据消费者实现多方数据的融合分析,参与方敏感数据能够在聚合计算节点中实现安全计算。 多方联邦训练 对接主流深度学习框架实现横向和纵向联邦建模,支持基于SMPC(如不经意传输、同态加密等)的多方样本对齐和训练模型保护。
数据融合分析 支持对接多个数据参与方的主流数据存储系统,为数据消费者实现多方数据的SQL Join等融合分析,各方的敏感数据在具有安全支撑的聚合计算节点中实现安全统计。
同时,有敏感信息的数据,还可以单独设置隐私策略,并在发布到空间侧后对其他参与方生效,限制敏感信息的使用。 数据预处理使用场景:训练机器学习模型前,可通过转换函数将特征数据转换成更加适合算法模型的特征数据。 父主题: 管理数据
行业类型 不敏感 表3 企业水电情况表power 列名 含义 字段分类 Id 企业id 唯一标识 electric_bal 电费 敏感 water_bal 水费 敏感 从业务角度考虑,安排五个阶段,来对TICS系统进行验证和测试。
当空间开启了“结果差分隐私”开关时, 对敏感数据字段的sum操作都会添加一个差分噪声,来保护单条敏感数据不被泄露。 如果需要更精确的结果, 可联系空间管理员关闭“结果差分隐私”开关, 或者联系敏感字段的合作方修改字段分类。
以企业A为例,数据集信息如下: 隐私求交场景需要将求交的字段设置为“非敏感”的唯一标识。 父主题: 隐私求交黑名单共享场景
行业类型 不敏感 表3 企业水电情况表power 列名 含义 字段分类 Id 企业id 唯一标识 electric_bal 电费 敏感 water_bal 水费 敏感 从业务角度考虑,安排五个阶段,来对TICS系统进行验证和测试。
TICS会保护唯一标识和敏感数据不被成对地明文泄露,同时会对敏感数据的求和计算添加差分噪声,以保护敏感数据不被泄露。 非敏感:指不参与数值分析,也和唯一身份无关的数据。例如等级、公司类型。 脱敏:勾选后,会对数据进行脱敏。