检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0.405262468,1.264947591,1.027350049,1.293868423 其中为了保证数据安全,企业A和大数据厂商B通过讨论决定使用hash过后的手机号作为已有数据的唯一标识id字段,并将唯一标识作为数据对齐的依据。 父主题: 使用TICS多方安全计算进行联合样本分布统计
征信数据覆盖率有限,不良企业多家骗贷事件屡有发生。金融机构与政府部门,如税务部门、市场监管部门、水电公司等在保护各方原始数据隐私的前提下,通过多方联合建模,金融机构补充了风控模型特征维度,提升模型准确率。 优势: 提升模型准确率 多方机构实现算法层面联合建模,提升了需求方模型的预测效果。
样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练特征;过低的iv值没有区分性会造成训练资源的浪
和配置、恶意消耗容器资源等场景时,会影响到数据提供方的计算环境安全以及其他学习作业的正常执行。 针对该问题,在边缘节点部署场景中,TICS通过构建Python安全沙箱来单独运行横向联邦作业,做到作业运行的安全隔离。 验证安全沙箱防护能力 接下来模拟篡改文件的恶意行为,来验证安全沙箱防护能力。
实时预测 实时预测通过在计算节点部署在线预测服务的方式,允许用户利用POST请求,在毫秒级时延内获取单个样本的预测结果。 创建实时预测作业 执行实时预测作业 删除实时预测作业 父主题: 联邦预测作业
根据自身的业务需求使用TICS提供的常用实践。 表1 常用最佳实践 实践 描述 基于TICS实现端到端的企业积分查询作业 本最佳实践提供了通过统一制定隐私规则,使用TICS进行安全计算,避免真实数据被窃取的使用案例。 父主题: 快速入门
基本概念 空间(League) 可信智能计算服务的逻辑概念,由组织方创建。空间绑定不同数据保护方式的聚合器,并邀请多方数据提供者参与,在空间内实现数据有限共享应用,提炼数据价值。 空间是联邦计算的载体。空间需要购买才能使用,在空间中可以管理合作成员,合作数据以及查看可信智能计算环境。执行联邦计算任务需要指定空间。
具体操作步骤如下: 作业发起方进入自己所属的计算节点,编写完作业之后,单击“提交审批”。在页面下方可查看审批方和审批进度。 图1 提交审批 审批中或者审批通过后, 如果进行了修改SQL和保存操作,那么就需要重新提交审批。 提交完成后,在页面下方可查看审批方和审批进度。 图2 审批进度 数据提供方
据目录,供用户查看、获取。 文件管理 文件管理是可信智能计算服务提供的一项管理联邦学习模型文件的功能。参与方无需登录后台手动导入模型文件,通过该功能即可将模型文件上传到数据目录,并支持批量删除。在创建联邦学习作业时可以选到上传的脚本模型等文件,提高了易用性及可维护性。 使用场景:
联防联控效用。 在信息核验过程中,通过隐私计算技术实现多方黑名单数据共享,对电诈、洗钱、骗贷等行为的黑名单用户进行安全求交、匿踪查询,能够有效提升客户背景调查的安全可信程度。 现有两家企业A、B,双方决定通过TICS平台实现黑名单数据共享,通过隐私求交作业计算两方黑名单ID交集。本文以企业A为计算作业的发起方为例。
辑回归(LR)模型。相较于单方训练,纵向联邦LR训练覆盖用户双方特征,模型预测精度更高。TICS采用SEAL同态加密确保双方数据交互安全,通过批处理技术进一步提升联邦训练性能。 公测 创建纵向联邦学习作业 2 样本对齐支持PSI算法 纵向联邦作业中支持对两方数据集进行样本对齐,在
在弹出的界面,继续配置联邦训练作业的参数,参数配置参考表1。 图3 配置参数 “数据配置文件”的“可选数据列表”: LOCAL运行环境,展示的是通过本地连接器发布的本地数据。 “训练型作业”同一个计算节点只能选一个数据集,但是一个作业必须要选两个及两个以上的数据集才能做训练。 表1 作业参数说明
批量预测 批量预测通过在计算节点后台发起离线预测任务的方式,在任务完成后可以获得指定数据集中所有样本的预测结果。 创建批量预测作业 编辑批量预测作业 执行批量预测作业 删除批量预测作业 父主题: 联邦预测作业
的结果可见,可由该提供方进行识别,并进行拒绝操作。 图1 审批详情 在审批详情中也可看到两个字段相加的情况,如下图所示。 图2 字段相加 通过查看字段是否可见,以及字段用途,能够确认该字段的应用是否符合自己的安全预期。 父主题: 基于TICS实现端到端的企业积分查询作业
后的开发按钮,进入作业开发页面。该页面描述了字段的属性,如字段名称和分布类型。另外可以通过列表下方的“描述性统计”按键来统计字段的统计量,包括缺失值数量、最大值、最小值及数据分布图。还可以通过为字段添加预处理方法。 图3 作业开发页面 进行字段描述性统计。单击列表下方的“描述性统
选择完成后单击“下一步”。 图3 数据选择 图4 样本粗筛 (可选步骤) 样本对齐,支持使用新对齐的结果,如图5所示;也支持复用隐私求交作业中通过这两个数据集计算得到的结果,如图6所示。 图5 使用新对齐结果 图6 复用隐私求交作业中的结果 (可选步骤)进行特征选择,此步骤要求数据已
Order by grade.base_grade desc 单击右侧的,进行作业配置。 图4 作业配置 单击“保存”,然后“提交审批”并通过后,单击“执行”。等待执行完成后在下方“执行结果”页签查看结果。 图5 执行结果 父主题: 快速入门
常用概念 合作方、参与方: 空间成员,有权使用空间中的数据,或者将自有数据发布到空间,供其他合作方受限使用。 计算节点 部署在参与方侧,是可信智能计算与合作方侧数据的桥梁,保障数据按照合作方意愿受限使用。 计算节点是管理参与方数据的最小单位。部署计算节点时需要指定空间配置信息。在
环境准备 开发环境简介 参考:获取认证信息 配置CCE服务 配置IEF服务 TICS服务委托授权 配置IEF高可用节点 购买TICS服务 部署计算节点 创建连接器
启用区块链审计服务(可选) 若您希望空间启用区块链服务(BCS)来审计任务信息,请仔细阅读本章节。 空间发起方需要根据基于CCE集群创建联盟链完成联盟链的创建过程。 “区块链类型”参数值需要选择“联盟链”,否则将影响后续操作。 发起方按照组建联盟链中“邀请成员”部分的描述,邀请参与方加入联盟链。