检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
计算引擎信息,选择指定服务名、集群名称、任务配置地址、资源名等信息。 数据源 数据源类型有初始格式和通用格式可以选择。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户
对第一次训练无影响,仅影响任务重跑。 “是”:清空上一轮的模型结果后重新开始训练。 “否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 AutoGroup
图4 创建离线数据源 数据路径选择完成后单击“立即创建”。 离线数据源创建完成后,在数据源列表页面单击目标数据源名称进行数据质量管理,具体操作请参见推荐系统用户指南>数据源质量管理,完成数据探索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建自定义场景 在RES管理控制台,在左侧导航栏中选择“推荐业务
组合作业详情 参数名称 详情信息 资源信息 资源信息包括: 计算引擎:服务名、集群名称、任务配置地址、资源名信息、 存储平台:服务名、集群名称、表名。 数据源:数据表类型、数据源、数据格式。 召回策略信息 该离线作业设置的召回策略详情,召回策略信息包括: 策略别名,策略显示的名称。 OBS
load_widetable 否 Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
AutoGroup,AutoGroup作业 StreamRank,在线训练作业 DataStruct,识别数据结构作业 DataExploration,数据探索作业 DataImport,离线数据导入作业 Evaluate,效果评估作业 schedule 否 String 调度参数 表4 jobConfig
load_widetable 否 Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
AutoGroup,AutoGroup作业 StreamRank,在线训练作业 DataStruct,识别数据结构作业 DataExploration,数据探索作业 DataImport,离线数据导入作业 Evaluate,效果评估作业 schedule 否 String 调度参数 表4 jobConfig
该功能使用涉及两部分:实时行为数据的接入和在线服务配置行为过滤。当数据源部分开启近线行为实时接入之后,并且用户通过上传实时行为数据,系统才具备根据实时行为进行曝光过滤的功能,该部分可参考上传实时数据进行配置和对接。 本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果
图4 创建离线数据源 数据路径选择完成后单击“立即创建”。 离线数据源创建完成后,在数据源列表页面单击目标数据源名称进行数据质量管理,具体操作请参见推荐系统用户指南>数据源质量管理,完成数据探索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建智能场景 登录RES管
load_widetable Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
data_source 是 List 算法数据源配置 INITIAL_PROFILES_GENERATION,数据源选择通用模板数据, BUILD_RANK_UNIFORM_DATA_FROM_JSON,数据源选择通用格式。 storage 是 JSON 请参见表6,存储平台。 offline_platform
le的数据源,提高读写性能。 创建跨源连接 开启公共终端节点 推荐系统在需要使用CloudTable集群进行数据存储,需开启公共终端节点之后推荐才能正常使用CloudTable集群。 开启公共终端节点 上传数据 准备离线数据源 需要您准备包含用户类数据,物品类数据,行为数据以及推
"ITEM_META", "data_format": "csv", "data_source_url": "<数据源存储路径>", "data_param": { "header": false,
"table_type_id": "ITEM_META", "data_format": "csv", "data_source_url": "<数据源存储路径>", "data_param": { "header": "false", "delimiter": ","
"error_msg": "The content for the request is invalid." } 状态码 状态码请参见状态码。 父主题: 提交数据质量作业
用户操作行为表USER_BEHAVIOR 通用格式GENERAL_FORMAT 数据格式请参见推荐系统离线数据源。 data_source_url 是 String 数据源路径,最大长度1000字符。 data_format 是 String 数据格式,可选值:csv、parquet、json、orc。
是否必选 参数类型 说明 data_source 是 JSON 请参见表10,数据源参数。 实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表12,数据源参数配置。 algorithm_config 是 JSON 请参见表13,算法参数配置。
可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用
该值越小筛选相似项条件越严格。 4 用户画像存储 该数据来源于基于用户数据更新用户画像更新后的用户画像数据或者初始用户画像-物品画像-标准宽表生成的用户画像。 - 物品画像存储 该数据来源于基于物品数据更新物品画像更新后的物品画像数据或者初始用户画像-物品画像-标准宽表生成的物品画像。