检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本节实验不再将训练集均匀划分到两个参与方,而是以不同的比例进行划分,从而探究当参与方数据量不同时,模型性能的变化情况。具体划分如下所示。实验中训练轮数固定为10,迭代次数固定为50。 参与方持有的样本数目信息 Host所持样本占比(%) Host样本数 Guest样本数 0.2
数据、篡改文件和配置、恶意消耗容器资源等场景时,会影响到数据提供方的计算环境安全以及其他学习作业的正常执行。 针对该问题,在边缘节点部署场景中,TICS通过构建Python安全沙箱来单独运行横向联邦作业,做到作业运行的安全隔离。 验证安全沙箱防护能力 接下来模拟篡改文件的恶意行为,来验证安全沙箱防护能力。
支持的数据源类型:CSV或者二进制的本地文件、MySQL、Hive,其中MySQL和Hive的数据集配置可参照管理数据章节。 前提条件 空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择挂载方式和数据目录,参考部署计算节点。 空间成员在计算节点中完成数据发布,参考发布数据。
单击“确定”,根据浏览器提示,保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件,即可查看访问密钥(Access Key Id和Secret Access Key)。 每个用户仅允许新增两个访问密钥。 为保证访问密钥的安全,
单击“确定”,根据浏览器提示,保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件,即可查看访问密钥(Access Key Id和Secret Access Key)。 每个用户仅允许新增两个访问密钥。 为保证访问密钥的安全,
配置CCE集群子账号权限 前提条件 已使用云租户部署计算节点。 操作步骤 以主账号登录CCE管理控制台。 在控制台左侧,单击“权限管理”,在“权限管理”页面,选择需要增加权限的CCE集群,单击右上角“添加权限”,进入添加权限页面。 图1 CCE管理控制台权限管理 在添加权限页面,
指定开放端口 - 计算节点控制台系统的网络端口 部署配置相关参数 部署方式 - 当前版本支持云租户部署和边缘节点部署。 云租户部署:数据上云的用户可以选择“云租户部署”,可信计算节点部署在华为云租户的虚拟私有云VPC中,可信计算节点组件部署在基于华为云CCE服务的容器中。关于CCE集群的更多信息可参考CCE。
指定开放端口 - 计算节点控制台系统的网络端口 部署配置相关参数 部署方式 - 当前版本支持云租户部署和边缘节点部署。 云租户部署:数据上云的用户可以选择“云租户部署”,可信计算节点部署在华为云租户的虚拟私有云VPC中,可信计算节点组件部署在基于华为云CCE服务的容器中。关于CCE集群的更多信息可参考CCE。
指定开放端口 - 计算节点控制台系统的网络端口 部署配置相关参数 部署方式 - 当前版本支持云租户部署和边缘节点部署。 云租户部署:数据上云的用户可以选择“云租户部署”,可信计算节点部署在华为云租户的虚拟私有云VPC中,可信计算节点组件部署在基于华为云CCE服务的容器中。关于CCE集群的更多信息可参考CCE。
空间组建完成,参考组建空间。 空间成员完成计算节点部署,配置参数时选择挂载方式和数据目录,参考部署计算节点。 空间成员在计算节点中完成数据发布,参考发布数据。 参与方的计算节点如果是采用云租户部署,并且使用子账号进行创建的,需要参考配置CCE集群子账号权限给子账号增加权限配置。 约束限制 纵向联邦作业XGBoost算法只支持两方参与训练。
最新作业的模型结果文件路径。 图1 查看模型结果文件的保存位置 前往工作节点上步骤1展示的路径,下载模型文件。由于Logistic Regression模型本质上还是线性模型,因此模型文件result_10为该线性模型的系数加上偏置项。 图2 查看模型结果文件 本地利用测试集评估
数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。
hfl_platform_type String 联邦学习运行平台枚举值。LOCAL,MODEL_ARTS host_agent_id String 发起方agent id,最大32位,由字母和数字组成 host_agent_name String 发起方可信计算节点名称,最大长度128 boot_file_url
概述 基于数据胶囊技术,将用户配置属性嵌入到数据加密策略中,只有匹配属性的用户才能打开文件,达到数据出域后仍然主权可控的目的。 进行数据交换的角色分为用数方和供数方,用数方通过发送申请传递数据使用需求;供数方确认使用需求后,创建合约发送到供数方进行签署,一旦合约生效,数据交换作业就可以执行。
参考准备本地横向联邦数据资源 -> 上传数据集文件,将该文件上传到计算节点的挂载路径下,即完成多方安全计算数据集配置。 如果数据集文件不含有csv文件表头,需要用户提供额外的配置文件用来说明数据集每一列的信息。以上述标签方数据集为例,没有表头的数据集文件和数据配置文件的格式如下: 491915,tony
csv文件分隔符 is_header_exist 是 Boolean 数据文件是否包含表头 data_file_path 是 String 数据文件地址 id_file_path 否 String id文件地址 config_file_path 否 String 配置文件地址 auto_generate_data
league_server_snat_ip String 空间server组件的ip,为server的snatip,设置代理节点的入方向安全组规则 nat_eip String 可信节点绑定的网关的ip,CCE部署时会返回该值 nat_eip_id String 可信节点绑定的网关的ip的Id,CCE部署时会返回该值
hfl_platform_type 是 String 联邦学习运行平台枚举值。LOCAL,MODEL_ARTS host_agent_id 是 String 发起方agent id,最大长度32 host_agent_name 是 String 发起方agent别名,最大长度128 boot_file_url
String csv文件分隔符 is_header_exist Boolean 数据文件是否包含表头 data_file_path String 数据文件地址 id_file_path String id文件地址 config_file_path String 配置文件地址 auto_generate_data
定向精准营销,缩小营销广告的投放范围,减少了营销的成本。 当两方都提供特征时,预测结果分为对齐id文件(只有一列id)和预测结果文件(包括预测结果标签、0的概率、1的概率),两个文件的行数相等且每一行相互对应。 至此,企业A完成了整个TICS联邦建模的流程,并将模型应用到了营销业