检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Integer 预分区个数。默认推荐预分区8个。 index_region_num 否 Integer 索引表预分区个数。近线策略中只有基于用户数据更新用户画像和基于物品数据更新物品画像需要设置索引表预分区个数,其他近线策略则不需要。 响应消息 响应参数请参见表16。 表16 响应参数说明 参数名称
用户操作行为表USER_BEHAVIOR 通用格式GENERAL_FORMAT 数据格式请参见推荐系统离线数据源。 data_source_url 是 String 数据源路径,最大长度1000字符。 data_format 是 String 数据格式,可选值:csv、parquet、json、orc。
实时日志 RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。用户发送到DIS上的数据具体如下: 实时行为日志 实时行为日志的作用包括: 更新用户的兴趣标签。 记录所选行为类型的历史记录。 更新用户的上下文信息。 召回候选集。 表1 实时行为日志字段描述 字段名
String 项目id,获取方式请参见获取项目ID resource_id 是 String 资源id(数据源id或场景id) workspace_id 是 String 工作空间id 表2 Query参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String
训练集测试集划分方式: TIME,时间比例 RAMDOM,个数比例 train_rate Double 训练数据占比。 最小值:0.01 最大值:1 test_rate Double 测试数据占比。 最小值:0.01 最大值:1 表21 DeepLearingParam 参数 参数类型 描述
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
String 项目id,获取方式请参见获取项目ID。 resource_id 是 String 资源id,可以为数据源id或场景id。 workspace_id 是 String 工作空间id。 表2 Query参数 参数 是否必选 参数类型 描述 action 否 String 动作类型:
用于存放经过特征工程处理的宽表,又名通用格式数据。 │ obs-pretrain-data 用于存放排序预处理任务生成的预训练数据。 │ obs-error-data 用于存放异常数据输出路径,来源于近线策略。 │ obs-nearline-data 用于存放近线任务结果数据,宽表形式。
String 项目id,获取方式请参见获取项目ID。 resource_id 是 String 资源id,可以为数据源id或场景id。 workspace_id 是 String 工作空间id。 表2 Query参数 参数 是否必选 参数类型 描述 action 否 String 动作类型:
产品功能 数据源 数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐
Service,简称OBS)进行数据源以及黑白名单和用户数据的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白
personalization,猜你喜欢 datasource_id 是 String 数据源id,字母、数字、下划线、减号组合32位。 ds_config 是 ds_config object 数据源配置。 scene_name 是 String 场景名称,1-64位的字母、数字、下划线、中划线组合。
训练集测试集划分方式: TIME,时间比例 RAMDOM,个数比例 train_rate 否 Double 训练数据占比。 最小值:0.01 最大值:1 test_rate 否 Double 测试数据占比。 最小值:0.01 最大值:1 表19 DeepLearingParam 参数 是否必选 参数类型
提交特征工程作业 提交排序作业 提交实时流近线作业 提交流式训练作业 提交数据质量作业 策略参数说明 停止算子作业 查询作业列表 查询作业详情 重新执行作业 删除作业 提交效果评估任务 查询效果指标 编辑修改作业 更新索引结构 父主题: API(V1不推荐)
训练集测试集划分方式: TIME,时间比例 RAMDOM,个数比例 train_rate 否 Double 训练数据占比。 最小值:0.01 最大值:1 test_rate 否 Double 测试数据占比。 最小值:0.01 最大值:1 表19 DeepLearingParam 参数 是否必选 参数类型
训练集测试集划分方式: TIME,时间比例 RAMDOM,个数比例 train_rate 否 Double 训练数据占比。 最小值:0.01 最大值:1 test_rate 否 Double 测试数据占比。 最小值:0.01 最大值:1 表20 DeepLearingParam 参数 是否必选 参数类型
训练集测试集划分方式: TIME,时间比例 RAMDOM,个数比例 train_rate 否 Double 训练数据占比。 最小值:0.01 最大值:1 test_rate 否 Double 测试数据占比。 最小值:0.01 最大值:1 表19 DeepLearingParam 参数 是否必选 参数类型
训练集测试集划分方式: TIME,时间比例 RAMDOM,个数比例 train_rate Double 训练数据占比。 最小值:0.01 最大值:1 test_rate Double 测试数据占比。 最小值:0.01 最大值:1 表21 DeepLearingParam 参数 参数类型 描述
训练数据在输入数据中的占比。divide_by_time_or_rate为RATE时必填。取值范围[0,1]。 测试数据占比 (test_data_rate) 否 Double 测试数据在输入数据中的占比。divide_by_time_or_rate为RATE时必填。取值范围[0,1]。 待提取用户特征
请求消息 请求参数请参见表2。 表2 请求参数说明 参数名称 是否必选 参数类型 说明 workspace_id 否 String 工作空间ID,默认为0。 job_name 是 String 训练作业名称,最大长度为20。 job_description 否 String 训练作业描述,最大长度为256。