检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于TICS实现端到端的企业积分查询作业 简介 阶段一:数据发布 阶段二:隐私规则防护 阶段三:审批防护 阶段四:基本计算能力验证 阶段五:基于MPC算法的高安全级别计算 阶段六:统计型作业的差分隐私保护
nt_power上发布。 表1 企业税收和资助金情况表tax 列名 含义 字段分类 Id 企业id 唯一标识 tax_bal 税收 敏感 Industry 行业类型 不敏感 表2 企业政府资助金数据表support 列名 含义 字段分类 Id 企业id 唯一标识 supp_bal
阶段四:基本计算能力验证 验证TICS的基础计算能力,以计算各企业在2021年的价值评分,用于评估信贷能力,其中的公式仅为简单的参考计算式。 前提条件 完成审批防护。 操作步骤 执行如下的sql作业。 select c.id as `企业id`, 0.5 * a.tax_bal + 0
示。 图2 字段相加 通过查看字段是否可见,以及字段用途,能够确认该字段的应用是否符合自己的安全预期。 父主题: 基于TICS实现端到端的企业积分查询作业
= b.id TICS会识别并提示。 图4 执行失败告警 上述隐私规则,均为TICS系统提供的默认规则。 父主题: 基于TICS实现端到端的企业积分查询作业
数据发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。 父主题: 基于TICS实现端到端的企业积分查询作业
在返回最终统计结果前,增加了一个差分隐私计算的任务节点,如图3所示。 图3 差分隐私计算任务节点 再执行如下sql,sql中过滤掉了某个企业,试图用差值去计算这个企业的税收值。 Select industry, sum(tax_bal), sum(electric_bal) from
场景描述 现有企业A和企业B达成了一项数据共享合作协议,企业B允许企业A根据用户id查询企业B的数据,辅助企业A的实时分析业务。而企业A不想暴露给企业B自己查询的用户id,因为查询该用户的信息隐含着“该用户是企业A的客户”的信息,存在用户隐私泄露的风险。 企业A和企业B可以使用TI
秘密分享”的全过程流向,基本符合业界已公开的PSI算法流程和秘密分享流程。 图2 加密流程 图3 加密流程 父主题: 基于TICS实现端到端的企业积分查询作业
bb5b7”这样的一条数据,查询结果中即会返回企业A所选择的企业B的数据字段。 同时企业A的业务系统后台也可以通过API调用的方式调用企业A计算节点的接口发起实时隐匿查询,更好地服务生产业务。 父主题: 外部数据共享
企业A完成信息选择后,单击“保存并提交审批”即可向数据提供方企业B发送一条审批信息。 企业B在自己的计算节点上可以单击“审批管理”,选择“待处理”的实时隐匿查询作业审批,可以看到自己的数据被如何使用。待企业B同意审批之后,企业A可以开始执行实时隐匿查询作业。 父主题: 外部数据共享
发布数据集 企业A和企业B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集,并单击“发布”。 以企业A为例,数据集信息如下: 隐私求交场景需要将求交的字段设置为“非敏感”的唯一标识。 父主题: 隐私求交黑名单共享场景
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
Access Management,简称IAM)。通过IAM,您可以: 根据企业的业务组织,在您的华为账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用TICS资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将TICS资源委
场景描述 某企业A在进行新客户营销时的成本过高,想要通过引入外部数据的方式提高营销的效果,降低营销成本。 因此企业A希望与某大数据厂商B展开一项合作,基于双方共有的数据进行联邦建模,使用训练出的联邦模型对新数据进行联邦预测,筛选出高价值的潜在客户,再针对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。
创建联邦预测作业 企业A单击“联邦预测 > 批量预测 > 创建”按钮,进入联邦预测作业的创建页面。企业A需要通过“算法类型”、“训练作业”等筛选条件可以找到用于预测的模型,点选使用的模型后单击“确定”按钮即完成联邦预测作业的创建。 父主题: 使用TICS联邦预测进行新数据离线预测
发起联邦预测 企业A单击“发起预测”按钮,选择己方和大数据厂商B的预测数据集,单击确定即可发起预测。 TICS服务会对两方的数据先进行样本对齐,并对双方共有的数据进行联邦预测,预测的结果会保存在企业A(作业发起方)的计算节点上。企业A可以通过obs服务或者登录到计算节点后台获取到对应路径的文件。
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练
发布数据集 企业A将自己的需要预测的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建用于预测的数据集。 企业A预测数据集如下: 大数据厂商B仍使用训练时的提供的全量数据作为预测数据集,没有发布新的数据集。 父主题: 使用TICS联邦预测进行新数据离线预测
发布数据集 企业B分别自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集,并单击“发布”。 企业B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。 父主题: 外部数据共享