检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
扩充。下表为扩充过后的数据集统计信息。 乳腺癌数据集统计信息。 统计量 取值 特征数目 30 xx医院的训练样本数目 7366 其他机构的训练样本数目 7366 测试集样本数目 7257 操作步骤 进入TICS服务控制台。 在计算节点管理中,找到购买的计算节点,通过登录地址,进入计算节点控制台。
使用TICS可信联邦学习进行联邦建模 场景描述 准备数据 发布数据集 创建可信联邦学习作业 选择数据 样本对齐 筛选特征 模型训练 模型评估 父主题: 纵向联邦建模场景
方数据和模型实现样本联合预测。 公测 联邦预测作业 2 联邦分析新增union all语法 安全多方计算MPC扩展语法支持union all语法。 公测 创建联邦数据分析作业 3 纵向联邦支持“样本粗筛”功能和“等距分箱”方式 纵向联邦作业在特征选择时,支持“样本粗筛”,能够筛选
发起联邦预测 企业A单击“发起预测”按钮,选择己方和大数据厂商B的预测数据集,单击确定即可发起预测。 TICS服务会对两方的数据先进行样本对齐,并对双方共有的数据进行联邦预测,预测的结果会保存在企业A(作业发起方)的计算节点上。企业A可以通过obs服务或者登录到计算节点后台获取到对应路径的文件。
横向联邦机器学习,适用于参与者的数据特征重叠较多,而样本ID重叠较少的情况,联合多个参与者的具有相同特征的多行样本进行联邦机器学习,联合建模。 模型评估 评估训练得出的模型权重在某一数据集上的预测输出效果。 纵向联邦机器学习 纵向联邦机器学习,适用于参与者训练样本ID重叠较多,而数据特征重叠较少的
前提下,利用多方数据实现的联合建模,曾经被称为联邦机器学习。 联邦预测作业 联邦预测作业在保障用户数据安全的前提下,利用多方数据和模型实现样本联合预测。 可信智能计算节点 数据参与方使用数据源计算节点模块实现自主可控的数据源注册、隐私策略(脱敏、加密)的设定、元数据的发布等,为数
对这些客户进行定向营销,达成提高营销效果、降低营销成本的业务诉求。 基于多方安全计算功能准备好合适的数据,本文主要介绍双方对已有的数据进行样本对齐、特征筛选和联邦建模,并对产生的模型进行评估。 父主题: 使用TICS可信联邦学习进行联邦建模
JOIN数据碰撞、可信联邦学习模型参数)的加密保护; 支持安全多方计算,如基于隐私集合求交PSI(Private Set Intersection)技术的多方样本对齐、 基于差分隐私、加法同态、秘密共享等技术的训练模型保护; 可插件化的对接区块链存储,实现多方数据的流动轨迹、使用过程的全程可追溯、可审计。
纵向联邦建模场景 使用TICS多方安全计算进行联合样本分布统计 使用TICS可信联邦学习进行联邦建模 使用TICS联邦预测进行新数据离线预测 父主题: 使用场景
的可靠性监控、运维管理。 可信联邦学习 对接主流深度学习框架实现横向和纵向的联邦训练,支持基于安全密码学(如不经意传输、差分隐私等)的多方样本对齐和训练模型的保护。 数据使用监管 为数据参与方提供可视化的数据使用流图,提供插件化的区块链对接存储,实现使用过程的可审计、可追溯。 容器化部署
批量预测 批量预测通过在计算节点后台发起离线预测任务的方式,在任务完成后可以获得指定数据集中所有样本的预测结果。 创建批量预测作业 编辑批量预测作业 执行批量预测作业 删除批量预测作业 父主题: 联邦预测作业
5.VFL_ID_TRUNCATION---纵向联邦学习(样本粗筛) 6.VFL_FEATURE_SELECTION---纵向联邦学习(特征选择) 7.VFL_SAMPLE_ALIGNMENT---纵向联邦学习(样本对齐) 8.VFL_PREDICT---纵向联邦学习(预测) job_name
实时预测 实时预测通过在计算节点部署在线预测服务的方式,允许用户利用POST请求,在毫秒级时延内获取单个样本的预测结果。 创建实时预测作业 执行实时预测作业 删除实时预测作业 父主题: 联邦预测作业
神经网络,FIBINET work_step String 纵向联邦操作步骤枚举值。DATA_SELECTION.数据选择,SAMPLE_ALIGNMENT.样本对齐,FEATURE_SELECTION.特征选择,MODEL_TRAIN.模型训练,MODEL_EVALUATION.模型评估,MODEL_PREDICT
神经网络,FIBINET work_step 否 String 纵向联邦操作步骤枚举值。DATA_SELECTION.数据选择,SAMPLE_ALIGNMENT.样本对齐,FEATURE_SELECTION.特征选择,MODEL_TRAIN.模型训练,MODEL_EVALUATION.模型评估,MODEL_PREDICT
表中参与方预测要用的某一数据集,最后单击“保存并提交审批”按钮完成作业创建。等审批方审批完后,就可以执行任务。 注意:选择的数据集中需要有样本id列,后面预测需要使用。 图2 新建作业 等待参与方审批,当参与方单击“同意”后,就可以执行任务了。 图3 审批详情 父主题: 实时预测
确率。 优势: 提升模型准确率 多方机构实现算法层面联合建模,提升了需求方模型的预测效果。 数据隐私保护强 多方采用隐私集合求交PSI对齐样本数据,本地数据或模型加密后在安全环境中运算,实现数据可用不可得。精细化的数据隐私保护策略,确保分析结果中强制执行隐私数据的脱敏。 图1 政企信用联合风控
config_file_path String 配置文件地址 auto_generate_data Boolean 是否自动生成数据,即纵向联邦学习样本对齐之后的流程是否使用样本对其结果自动过滤。 ext LocalDatasetExtEntity object 扩展信息,包含multihot配置信息,
mlp_dims 否 Array of integers 多层感知机每层的节点数 reduction_ratio 否 Integer senet层压缩比例,最小值2 save_format 否 String 模型保存格式 loss_function 否 String 损失函数 loss_param
多方安全计算 允许多合作方参与的结构化数据SQL分析作业。 可信联邦学习 允许多合作方参与的模型训练、评估作业。 联邦预测学习 允许多合作方参与的样本联合预测作业。 存储方式 指计算节点所属的CCE或IEF容器的工作负载,目前支持“OBS存储”和“主机存储”方式。“OBS存储”方式是将O