检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表2 请求参数说明 参数名称 是否必选 参数类型 说明 workspace_id 否 String 工作空间ID,默认为0 job_name 是 String 训练作业名称,最大长度为20字符。必须以DataQuality-开头。
表2 请求参数说明 参数名称 是否必选 参数类型 说明 workspace_id 否 String 工作空间ID,默认为0 job_name 是 String 作业名称,只能由字母、数字、中划线和下划线组成,并且长度为1~20个字符。
云容器引擎-成长地图 | 华为云 推荐系统 推荐系统(Recommender System),基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。 免费体验 图说ECS 售前咨询 立即使用 成长地图 由浅入深
创建资源 用户在使用RES时需要先创建并绑定计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关资源。 背景信息 使用RES需要消耗其他服务资源,需要收费。根据您选择的资源不同,收费标准不同,针对不同类型资源的价格,详情请参见产品价格详情。 已开通计算引擎DLI、存储平台
表2 请求参数说明 参数名称 是否必选 参数类型 描述信息 workspace_id 否 String 工作空间ID,默认为0。 job_name 是 String 训练作业名称,最大长度为20字符。
近线作业 近线作业简介 近线作业为推荐系统提供实时计算能力。近线作业以数据接入服务DIS中的数据为数据源,实时计算并更新用户画像、物品画像和推荐候选集等数据。使用近线作业,用户需先将业务系统埋点日志转换成实时日志指定格式,并实时写入DIS相应通道。近线作业具体实现请参见图1。 图1
数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下
排序策略 排序策略简介 排序策略用于训练排序模型,该模型将被用于对召回策略召回的候选集进行排序,以将推荐物品顺序调整到最优。排序模型可对LR、FM、FFM、DeepFM和PIN等模型进行训练,具体包括如下内容: 逻辑斯蒂回归-LR 因子分解机-FM 域感知因子分解机-FFM 深度网络因子分解机
离线作业简介 RES提供了离线作业训练的功能,方便您根据业务需求查看作业结果并不断调整您的作业参数。您还可以基于离线作业得到的推荐候选集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。 用户通过数据质量作业对离线数据进行质量检测
创建跨源连接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。 前提条件 已开通计算引擎DLI服务,创建集群并完成资源绑定。 创建跨源链接 DLI集群绑定完成后,创建跨源链接。步骤如下: 登录RES管理控制台,在“资源中心
服务总览信息 您可以在RES管理控制台的总览页查看服务的最新动态、了解作业状态、快捷创建服务。 登录RES管理控制台,单击左侧导航栏上的“总览”,进入总览页面。 总览界面包括“最新动态”、“视频教程”和“常用链接”,如图1所示。其中,在最新动态可查看所创建“离线作业”、“近线作业”
RES操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 准备资源 开通相关资源 基于您的业务需求,您需要开通RES相关服务,包括: 计算引擎DLI、ModelArts
实时日志 RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。用户发送到DIS上的数据具体如下: 实时行为日志 实时行为日志的作用包括: 更新用户的兴趣标签。 记录所选行为类型的历史记录。 更新用户的上下文信息。 召回候选集。 表1 实时行为日志字段描述 字段名
删除离线作业 删除离线作业即清理离线作业产生的数据,数据清理完成后删除元数据。操作必须确保流程中没有使用该作业产生的UUID,可以参考以下操作完成。 删除离线作业 您可以对“计算成功”、“计算失败”等状态的作业进行删除,“启动中”、“计算中”状态的作业不支持删除操作。 登录RES管理控制台
过滤规则 过滤规则用于配置候选集的过滤方式,使之不进入候选集。过滤规则说明请参见图1。 图1 过滤规则 创建过滤规则 在“创建过滤规则”页面,用户可以对目标数据选择不同策略进行离线计算,得到合适的候选集。 创建过滤规则操作步骤如下: 在“离线作业”下,单击“过滤规则”页签,单击该页面做上方
特征工程 特征工程可对推荐系统的离线数据进行处理,它包含两个功能: 从离线数据中提取用户、物品画像和RES内部通用格式数据; 把RES内部通用格式数据处理成训练排序模型所需的训练数据、测试数据等。 与功能对应,特征工程的两个任务分别是: 初始用户画像-物品画像-标准宽表生成 排序样本预处理
管理离线作业 您可以对各离线作业进行“复制”、“编辑”、“终止”、“重新执行”、“删除”等操作。您也可以通过查看服务的详细信息判读作业训练状态和查询训练结果。 复制离线作业 用户可以通过复制组合作业再次创建新的作业进行离线计算。生成的数据和原来的作业生成的数据相互独立,复制的离线作业会生成新的线上指定的
效果评估 创建效果评估可以对线上服务设置指标,查看推荐效果的反馈,可以根据系统提供的指标添加。 创建效果评估 创建效果评估步骤如下: 在“离线作业”的“效果评估”页签,单击左上方“创建”,进入“创建效果评估”页面。 在“创建效果评估”页面,填写特征工程“名称”、“场景”和“描述”。
管理属性配置 属性配置以键值对的方式进行存储,配置后的配置项可以用于整个服务。该配置项的值为用户指定的OBS路径,OBS相关操作请参见创建OBS桶。 前提条件 已开通OBS服务,并按照推荐系统OBS文件夹规范建议格式创建文件夹。 已上传离线数据。 创建场景 您可以根据自己的业务创建场景进行配置
创建在线服务 在线服务负责分析结果的应用过程,泛指部署线上服务后提供的推理服务,对外提供API接口。在推荐系统中,包含推荐引擎、文本标签、排序三种在线服务,具体说明如下: 推荐引擎 推荐引擎用于对RES召回策略跑出来的候选集结果进行融合过滤和排序。 文本标签 文本标签服务为用户提供自然语言处理工具