检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品功能 数据源 数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐系统。
在“创建数据质量”页面,单击“添加数据质量算子”选择“数据质量检测算子”。 填写基本信息并选择计算引擎。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。 填写参数配置,参数说明请参见表1。 图1 创建数据质量检测作业 表1 数据质量检测算子参数说明 参数名称 说明
离线数据和近线实时数据如何配合使用? 在推荐系统初始化阶段,需要用户提供批量的离线数据源并按照推荐系统要求的数据格式上传至OBS,完成数据的检测和导入。 近线实时数据源推荐使用RES SDK上传,此操作所有的数据更新都是实时生效的。 父主题: 数据源
选集。 用户通过数据质量作业对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线作业的数据。通过上述离线作业训练出可用于在线服务的推荐候选集。当在线服务运行完成,您可以通过效果评估检测推荐结果。 离线作业功能说明 表1 功能说明 离线作业
查询数据源任务结果 功能介绍 查询指定数据源下离线任务的结果。其中包括数据格式,数据检测、数据探索及效果评估的内容。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.0/{project_id}/workspaces/{workspace_id}/d
近线作业 近线作业简介 近线作业为推荐系统提供实时计算能力。近线作业以数据接入服务DIS中的数据为数据源,实时计算并更新用户画像、物品画像和推荐候选集等数据。使用近线作业,用户需先将业务系统埋点日志转换成实时日志指定格式,并实时写入DIS相应通道。近线作业具体实现请参见图1。 图1
当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。
产品价格详情 03 使用 推荐系统对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线策略的数据。通过上述作业训练出可用于在线服务的推荐候选集。当在线作业运行完成,您可以通过效果评估检测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作
对第一个节点进行查询作业详情的配置。查询作业详情参数请参见查询作业详情API。 对第二节点进行重新执行作业的配置。重新执行作业详情参数请参见重新执行作业的API。 当检测到近线任务(实时流任务)失败时,才会进行第二个节点的作业。 单击“保存”后,进行“测试运行”。确保功能正常。 在页面右侧,单击“调度配置”
传至OBS。 只有在数据源数据结构特征抽取人工复核确认之前才允许修改数据源。 注意事项 修改编辑之后的离线数据源需要重新进行数据结构抽取和检测、探索等操作。 操作步骤 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入数据源列表页面。 在数据源列表单击目标数据源名称,进入数据源详情页面。
修改数据源特征 修改数据源中的特征。 删除数据源 删除数据源。 查询数据源任务结果 查询指定数据源下离线任务的结果。其中包括数据格式,数据检测、数据探索及效果评估的内容。 场景 创建自定义场景 在指定工作空间下面创建自定义场景。 创建智能场景 在指定工作空间下面创建智能场景。 查询场景详情
RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。 实时日志 运行推荐策略 创建离线作业 创建离线作业包括进行数据质量检测、创建组合作业、特征工程、召回策略、排序策略、过滤规则等作业。 运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配
查询效果指标 功能介绍 该接口用于查询推荐效果指标。 URI GET /v1/{project_id}/query-indicators/{job_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用
提交流式训练作业 功能介绍 该接口用于提交流式训练作业。 URI POST /v1/{project_id}/stream-etl-job 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。