检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数类型 描述 dataset_type 是 String 数据集类型,按照传入枚举类型,返回所属作业类型的数据集。例如:传入MYSQL,返回分析作业可用的数据集;传入LOCAL_CSV,返回学习作业可用数据集 agent_id 否 String 可信计算节点id,最大32位,由字母和数字组成
该页面描述了字段的属性,如字段名称和分布类型。另外可以通过列表下方的“描述性统计”按键来统计字段的统计量,包括缺失值数量、最大值、最小值及数据分布图。还可以通过为字段添加预处理方法。 图3 作业开发页面 进行字段描述性统计。单击列表下方的“描述性统计”按键,会对该数据集的选定字
作业id,最大长度32 job_name String 作业名称,最大长度128 job_type String 作业类型。作业类型:SQL.联合SQL分析,HFL.横向联邦学习,VFL.纵向联邦学习,PREDICT.预测 creatorName String 创建人名称,最大值128 create_time
则会影响部分功能使用。 资源分配策略 CPU(Cores) - 用户可根据返回资源剩余规格,按照分析与学习需求,灵活分配核数。 内存(GiB) - 用户可根据返回资源剩余规格,按照分析与学习需求,灵活分配内存。容器预留部分管理资源,作业可用内存最大值设置为内存数值的0.6倍,且向下取整。
删除依赖资源确认弹窗 查看计算节点操作记录 用户可在操作记录页面查看计算节点版本创建、升级、删除及回滚操作详情。在详情中,操作进程以可视化的方式展示,清晰展示计算节点的部署、升级、回滚、删除步骤,在出现问题时便于分析排查。 用户登录TICS控制台。 进入TICS控制台。单击页面左侧“计算节点管理”,进入“计算节点管理”页面。
审批意见,记录审批不通过原因等 field_detail String 字段使用详情 privacy_detail String 隐私规则分析详情 converge_detail String 收敛检测详情 approval_status String 审批状态:NEW新建;AP
敏感级别:包含敏感、非敏感两个选项。 敏感:涉及隐私的数据, 例如薪水、 消费金额等。 非敏感:不涉及隐私的数据, 例如所处城市、公司类型等。 脱敏:勾选后,该字段内容将在分析结果中加密呈现,否则明文呈现。默认不勾选(作业发起方所属字段不做脱敏)。 分布类型:包括连续、离散、MULTIHOT三种特征类型,联邦学习时可能会使用到该信息。
is_single_predict Boolean 单方还是双方预测 job_instance_type String 作业类型。HFL横向联邦,SQL联邦分析,VFL_EVALUATE联邦评估,VFL_FEATURE_SELECTION特征选择,VFL_ID_TRUNCATIONId截断,VFL
job_id String 作业id job_name String 作业名称 job_type String 作业类型。SQL联合SQL分析,HFL横向联邦学习,VFL纵向联邦学习,PREDICT预测,DATA_EXCHANGE数据交换 learning_task_type String
基本概念 账号 用户的账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。
privacy_policy_ext String 隐私策略描述 sacle Integer 精度 sql_col_privacy_type String 分析数据集字段隐私类别。NON_SENSITIVE非敏感,SENSITIVE敏感,UNIQUE_ID唯一主键 状态码: 401 表7 响应Body参数
筛选特征 样本对齐执行完成后单击下一步进入“特征选择”页面,这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。 企业A可以选择特征及标签后“启动分箱和IV计算”,通过联邦的统计算法计算出所选特征的iv值,一般而言iv值较高的特征更有区分性,应该作为首选的训练
创建并运行隐私求交作业 企业A单击“作业管理 > 隐私求交 > 创建”,依次填写作业名称、选择需要求交的数据集和对应的求交列、选择算法协议及各种参数,再单击“保存并执行”即可发起一次隐私求交查询。 父主题: 隐私求交黑名单共享场景
共有的数据交集,作为后续步骤的输入。企业A需要选择双方的样本对齐字段,并单击“对齐”按钮执行样本对齐。执行完成后会在下方展示对齐后的数据量及对齐结果路径。 父主题: 使用TICS可信联邦学习进行联邦建模
查询租户下统计信息 功能介绍 查询当前租户的空间及代理统计数量 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/overview/statistics 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,最大32位,字母和数字组成
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串
hfl作业类型枚举。TRAIN训练,EVALUATE评估 job_name String 作业名称 job_type String 作业类型。HFL横向联邦,SQL联邦分析,VFL_EVALUATE联邦评估,VFL_FEATURE_SELECTION特征选择,VFL_ID_TRUNCATIONId截断,VFL
业文件。如果不填写,用户在访问截至时间前无限次访问。 图2 设置使用的字段及访问的需求 单击保存或者保存并提交审批。 在“可信数据交换 > 数据申请 > 我创建的”的页签下可以查看、编辑、删除已创建的申请及对应的状态。 图3 已创建的申请 父主题: 可信数据交换场景
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。 表1 企业A的数据 字段名称 字段类型 描述 id string hash过后的手机号字符串 col0-col4 float
训练型横向联邦作业流程 联邦学习分为横向联邦及纵向联邦。相同行业间,特征一致,数据主体不同,采用横向联邦。不同行业间,数据主体一致,特征不同,采用纵向联邦。xx医院的应用场景为不同主体的相同特征建模,因此选用横向联邦。 创建训练型横向联邦学习作业。 图1 创建训练型横向联邦学习作业