检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DeepLearingParam object 排序作业通用参数(LR、DEEPFM、AutoGroup需要提供此参数)。 algorithm_specify_parameters 否 AlgorithmSpecifyParameters object 排序算法特定参数(LR、DEEPFM、AutoGroup需要提供此参数)。
DeepLearingParam object 排序作业通用参数(LR、DEEPFM、AutoGroup需要提供此参数)。 algorithm_specify_parameters 否 AlgorithmSpecifyParameters object 排序算法特定参数(LR、DEEPFM、AutoGroup需要提供此参数)。
object 综合排序信息。 bloom_filter_conf BloomFilterConf object 布隆过滤器配置。 group_attr String 分组打散属性。 pre_deal Boolean 在排序前去重。 rank_setting String 排序配置信息。 rules
数据导入 数据导入介绍 数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。
据类型信息组成的数据格式的列表,其中属性值或属性权重可以不提供,权重信息不提供的场景下采用默认值“0.01”。需要在部署服务时与属性匹配重排序配合使用。格式如下:[{"name":"age","value":"中年","item_data_type":"strArray"},{"name":"sex"
ATE_USER_PORTRAIT,则此字段必填。 rank_type 否 String 候选集结果排序方式。提供HOT(热度排序)、RANDOM(随机排序)、TIME(时间排序)三种方式。若algorithm_type为NEARLINE_UPDATE_USER_CANDIDATE_SET,则此字段必填。
strategy参数说明 参数名称 是否必选 参数类型 说明 strategy_type 是 String 策略类型(可选值) 召回策略:recall 排序策略:sorting name 是 String 策略别名,最大长度60字符。 algorithm_type 是 String 算法类型。
数据源 创建数据源 查询数据源列表 查询数据源详情 修改数据源内容 修改数据源特征 删除数据源 查询数据源任务结果 父主题: API
数据源 RES的离线数据源包括什么? 如何上传数据至OBS 如何上传实时数据? 离线数据和近线实时数据如何配合使用? 数据探索是什么?近线实时数据如何在数据探索中的报告体现? 如何确定近线数据源导入实时数据成功? 实时数据能否立即应用到推荐场景?
数据结构 当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中
更新工作空间信息, 只允许更新描述信息。 删除工作空间 删除指定工作空间。 查询规格 查询训练规格 查询当前推荐系统所提供的离线计算规格,实时计算规格和排序模型训练规格。在创建数据源和场景时,需要提供此信息。 数据源 创建数据源 在指定的工作空间下面创建一个新的数据源。 查询数据源列表 查询当前工作空间下的数据源列表。
UU,基于用户推荐用户 II,基于物品推荐物品 IU,基于物品推荐用户 service_type 是 String 服务类型: rank,排序服务 rec,推荐服务 表4 ds_config 参数 是否必选 参数类型 描述 time_interval 否 Integer 数据选择(天)。
创建数据源 功能介绍 在指定的工作空间下面创建一个新的数据源。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/data-sources 表1 路径参数 参数 是否必选
离线数据源 调用RES之前,您需要准备3种基础数据包并上传至OBS,离线数据源目前支持CSV和JSON。具体数据包请参见表1 基础数据表。 表1 基础数据表 数据类型 表名 用户类数据 用户属性表 物品类数据 物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。
数据源管理 数据源管理简介 准备离线数据源 上传离线数据源至OBS 上传实时数据 创建离线数据源 导入近线数据源 数据质量管理 修改或删除数据源
数据格式规范 推荐系统OBS文件夹规范 离线数据源 实时日志 全局特征信息文件 父主题: 用户指南(旧版)
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据
个数据源中的用户和物品总条目数不超过100W条,则按照100W条计费,如果超过一百万条,每一百万条为一个计算周期。 计算资源 应用于召回、排序等作业运行时CPU/GPU计算,包含RES的数据源、推荐场景的离线作业计算计费。 如果选取4CU计算规格执行一小时作业运行,则按需消耗为0
UU,基于用户推荐用户 II,基于物品推荐物品 IU,基于物品推荐用户 service_type 是 String 服务类型: rank,排序服务 rec,推荐服务 表5 ds_config 参数 是否必选 参数类型 描述 time_interval 否 Integer 数据选择(天)。
提交数据质量作业 提交数据质量作业API 查询全局特征配置 父主题: 作业相关API