检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据源管理流程及功能简介 表1 功能介绍 功能 说明 准备离线数据源 请您按照推荐系统要求的数据格式准备用户数据,物品数据,行为数据。 上传离线数据源至OBS 将准备的离线数据源上传至对象存储服务(OBS)用于推荐系统的离线计算。 创建离线数据源 在使用RES之前,首先您需要创建一个数据源
删除自定义场景 针对不再使用的自定义场景,您可以删除已释放资源。 前提条件 已存在创建成功的自定义场景。 删除自定义场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务 > 自定义场景”,进入自定义场景列表页面。 选择自定义场景列表中的目标场景,单击“操作”列的“删除”。 在
推荐作业有哪几种创建方式? 推荐系统支持如下几种作业创建方式: 通过RES管理控制台创建作业、查看推荐和效果评估结果。详情参见《推荐系统用户指南》。 通过API提交任务并获取结果。详请参见《推荐系统API参考》。 父主题: 基础问题
运营策略提升推荐结果多样性 避免物品重复推荐(曝光过滤) 推荐结果多样性打散
更新工作空间 功能介绍 更新工作空间信息, 只允许更新描述信息。 调试 您可以在API Explorer中调试该接口。 URI PUT /v2.0/{project_id}/workspaces/{workspace_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
删除离线作业 删除离线作业即清理离线作业产生的数据,数据清理完成后删除元数据。操作必须确保流程中没有使用该作业产生的UUID,可以参考以下操作完成。 删除离线作业 您可以对“计算成功”、“计算失败”等状态的作业进行删除,“启动中”、“计算中”状态的作业不支持删除操作。 登录RES
管理离线作业 您可以对各离线作业进行“复制”、“编辑”、“终止”、“重新执行”、“删除”等操作。您也可以通过查看服务的详细信息判读作业训练状态和查询训练结果。 复制离线作业 用户可以通过复制组合作业再次创建新的作业进行离线计算。生成的数据和原来的作业生成的数据相互独立,复制的离线作业会生成新的线上指定的UUID。
上传实时数据 RES通过DIS SDK上传实时数据,用户实时日数据并做近线处理。当前仅支持Java语言的SDK,示例请参见《数据接入服务SDK参考》。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。
数据源如何收费? 数据源的收费包括三项。 “OBS存储”:将离线数据源上传至OBS进行存储,根据存储空间大小进行计费。详见OBS计费详情。 “画像数据”:在数据源导入数据成功后,按每小时每百万条画像进行计费,在删除数据源后,将停止计费。 “训练作业”:在创建离线作业和导入实时数据
ES在华北-北京一区域,在对象存储服务创建桶时,请选择华北-北京一。 通过OBS创建用于存放数据的文件夹 推荐的OBS文件夹结构请参见推荐系统OBS文件夹规范。推荐您按照规范结构创建文件夹并上传至OBS桶中。 父主题: 准备工作
String 用于追踪每个被推荐物品的唯一ID。用于推荐效果的计算。 否 flowId String 用于计算每一个在线服务的效果。flowId由推荐系统的API返回给用户,用户需把flowId写到用户行为日志中。 否 实时行为日志示例 { "userId": "user1", "objectType":
与其他云服务的关系 表1 RES与其他服务的关系 相关服务 交互功能 数据湖探索 数据湖探索(Data Lake Insight,简称DLI)用于推荐系统的离线计算和近线计算。DLI的更多信息请参见《数据湖探索文档》。 对象存储服务 对象存储服务(Object Storage Service
数据结构 当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中
可选择的规格有“4CU”、“8CU”、“16CU”、“32CU”、“64CU”、“128CU”。规格越大,计算越快。 单击“立即创建”。 数据源创建完成后,系统自动跳转至数据源列表页面并提示您数据源创建成功。针对创建好的数据源,您可以进行“删除”操作。您可以在数据源列表页面单击您创建的数据源名称进入数据源详情页面。
排序。 “排序引擎”:排序引擎无需配置召回策略,允许用户提供自己的候选集,使用RES的排序策略进行排序。 数据源 从右侧下拉框中选择RES系统中已有的数据源。当无可用数据源时,此下拉框为空。 数据区间 时间单位 支持天和小时。 数据选择 指定历史行为时间段,选取数据中最靠后的时间
选择”页签。 填写组合作业相关配置参数,请参见表1。 表1 创建组合作业参数说明 模块 参数名称 说明 计算引擎 服务名 计算引擎用于推荐系统的离线计算和近线计算。默认DLI。 集群名称 选择“资源中心”绑定的DLI集群名称。 任务配置地址 在创建作业时, 会自动生成一个JSON
修改在线服务参数 功能介绍 修改指定在线服务的元数据内容。 调试 您可以在API Explorer中调试该接口。 URI PUT /v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/service-instance/{job_id}
新建训练作业 功能介绍 新建训练作业元数据,新建成功之后可手动执行此任务。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/job-instance
管理计算资源 计算资源DLI服务,添加的计算资源需根据实情情况进行合理分配。开通DLI集群大小就是根据业务需求对集群进行扩容缩容,计算资源最多设置5个。计算资源支持的操作包括: 创建计算资源 编辑计算资源 删除计算资源 创建计算资源 登录RES管理控制台,在“全局配置”页面的计算资源区域,单击“创建”添加计算资源。
全局配置API 计算资源配置 新增场景 查询场景 删除场景 全局指标配置 获取全局配置指标 查询配额信息 父主题: API(V1不推荐)