检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
项目id,最大32位,字母和数字组成 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户凭证 Content-Type 是 String 消息体的类型(格式) 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型
数据集注册管理 数据集列表展示 创建或更新数据集 批量删除数据集 发布数据集到空间 获取数据详情 父主题: 计算节点API
在弹出的界面配置执行参数,配置执行参数可选择常规配置与自定义配置。 常规配置:通过界面点选算法使用的常规参数,具体支持的参数请参考表1。 表1 常规配置参数 算法类型 参数名 参数描述 XGBoost 学习率 控制权重更新的幅度,以及训练的速度和精度。取值范围为0~1的小数。
创建作业 在弹出的对话框中编辑“作业名称”,选择“算法类型”。 选择“算法类型”之后,勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,再勾选”选择数据集”列表中参与方预测要用的某一数据集,最后单击“保存并提交审批”按钮完成作业创建。等审批方审批完后,就可以执行任务。
开发环境简介 在进行多方安全计算应用开发时,要准备的环境如表1所示。 同时需要准备运行调测的Linux环境,用于验证应用程序运行正常。 表1 准备项 准备项 说明 购买TICS服务 在TICS控制台通过下单建立数据空间,或者将租户加入已有的数据空间。 部署计算节点 在TICS控制
ublish 表1 路径参数 参数 是否必选 参数类型 描述 agent_id 是 String 可信计算节点id。 支持数字,英文字母,下划线,长度32。 dataset_id 是 String 数据集id。 支持数字,英文字母,下划线,长度32。 请求参数 表2 请求Header参数
感的唯一标识字段。 创建作业 用户登录进入计算节点页面。 在左侧导航树上依次选择“作业管理 > 隐私求交”,打开隐私求交作业列表页面。 在隐私求交作业列表页面,单击“创建”。 图1 创建隐私求交作业 在创建页面填写如下信息: 作业名称。 作业描述可按需填写。 勾选参与双方的数据集
数据集管理 获取字段隐私详情 数据集列表 父主题: 计算节点API
数据集管理 查询空间已注册数据集列表 父主题: 空间API
本接口用于批量删除数据集。 调用方法 请参见如何调用API。 URI POST /v1/agents/datasets/batch-delete 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 [数组元素] 是 Array of strings 数据集id数组 响应参数 无 请求示例
URI PUT /v1/{project_id}/leagues/{league_id}/fl-vertical-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,最大32位,由字母和数字组成 league_id
URI GET /v1/{project_id}/leagues/{league_id}/fl-vertical-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,最大32位,由字母和数字组成 league_id
atasets-statistics 表1 路径参数 参数 是否必选 参数类型 描述 league_id 是 String 空间id,最大32位,字母和数字组成 project_id 是 String 项目id,最大32位,字母和数字组成 表2 Query参数 参数 是否必选 参数类型
MIIDkgYJKoZIhvcNAQcCoIIDgzCCA38CAQExDTALBglghkgBZQMEAgEwgXXXXX... 获取空间列表 1.调用获取空间列表API获取空间列表信息: curl -X GET -H 'Content-Type:application/json;charset=utf-8'
两个配额参数的值为创建新容器的CPU核数和内存大小,默认CPU核数为1,内存大小512M。 然后勾选“选择训练作业”列表中的某一训练作业,然后勾选“选择模型”列表中对应模型,最后单击“确定”按钮完成作业创建。 参数配置完成后,单击确认,完成批量预测任务的创建。 父主题: 批量预测
服务、授权IAM用户使用TICS、准备数据、启用区块链审计服务(可选)等一系列操作后,可以根据自身的业务需求使用TICS提供的常用实践。 表1 常用最佳实践 实践 描述 基于TICS实现端到端的企业积分查询作业 本最佳实践提供了通过统一制定隐私规则,使用TICS进行安全计算,避免真实数据被窃取的使用案例。
估横向联邦学习得到的模型准确率。此外由于原始的数据集较小,采用了Imbalanced-Learn中的SMOTE算法,进行了数据集的扩充。下表为扩充过后的数据集统计信息。 乳腺癌数据集统计信息。 统计量 取值 特征数目 30 xx医院的训练样本数目 7366 其他机构的训练样本数目
首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 label
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float 企业A数据特征 industry_predict
065 98.140 98.415 测试集AUC 0.995 0.996 0.997 训练时长 (秒) 166 167 216 从上面两张表可以看出: (1)训练轮数对于联邦学习模型的性能影响不大,这主要是由于乳腺癌数据集的分类相对简单,且数据集经过了扩充导致的; (2)增大每个