检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据格式规范 推荐系统OBS文件夹规范 离线数据源 实时日志 全局特征信息文件 父主题: 用户指南(旧版)
命名实体识别模型 模型名称 res-default-ner 功能 将待处理的文本中的人名、地名、组织名提取出来。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 text 是 String 待处理的文本。
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
", "feature_value_type":"map" } ] } 父主题: 数据格式规范
数据质量管理 数据结构 数据导入 数据探索 父主题: 数据源管理
预测接口(文本标签) 分词模型 命名实体识别模型 父主题: 在线服务API
数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下:
含用户标识符、行为对象标识符、行为类型和行为时间等信息。 注意事项 每张表的表结构和填充的数据必须符合推荐系统的要求,列名和字段类型需要和规范保持一致。 创建数据源之前您需要自己手工创建整理这些表并存储到OBS,推荐数据目前支持JSON格式。 离线数据为初次对接RES的批量数据,
物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。 每张表的表结构必须符合推荐系统的要求,列名和字段类型需要和规范中保持一致(参考下面的表结构说明)。 每张表中填充的数据,必须符合推荐引擎的要求。 对于业务数据中无法提供的字段可以填NULL。 用户属性表
在对象存储服务创建桶时,请选择华北-北京一。 通过OBS创建用于存放数据的文件夹 推荐的OBS文件夹结构请参见推荐系统OBS文件夹规范。推荐您按照规范结构创建文件夹并上传至OBS桶中。 父主题: 准备工作
"tag4":0.22, "tag5":0.99 } } } 父主题: 数据格式规范
于整个服务。该配置项的值为用户指定的OBS路径,OBS相关操作请参见创建OBS桶。 前提条件 已开通OBS服务,并按照推荐系统OBS文件夹规范建议格式创建文件夹。 已上传离线数据。 创建场景 您可以根据自己的业务创建场景进行配置,最多可以创建10个场景。具体操作如下: 登录RES
RES的离线数据源包括什么? 离线数据包括如下几张表: 用户属性表 物品属性表 用户操作行为表 每张表的字段描述和规范详情请参见《推荐系统用户指南》中准备离线数据源章节。 父主题: 数据源
推荐引擎 推荐引擎用于对RES召回策略跑出来的候选集结果进行融合过滤和排序。 文本标签 文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。 排序 排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。 前提条件 已经有计算成功的离线作业并且已经生成候选集UUID。
导入近线数据源 通过导入近线数据源,达到实时计算并更新用户画像、物品画像,实时更新增量数据的目的。 前提条件 按数据规范准备数据并上传至通道。具体上传方法请参见上传实时数据。 导入近线数据源 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 在数据源列
用户指南(旧版) 准备工作 RES操作流程 管理资源 全局配置 离线作业 近线作业 在线服务 服务总览信息 数据格式规范
兴趣标签,由系统自动更新,默认保留字段。 否 extend Json 扩展字段,由用户指定扩展字段的key和value。其中: key,您可以按照业务需求自行命名。无需按照示例以“extend_”开头,key不能为中文。 value,支持long/float/String/strArray/location格式的数据。
的矩阵分解推荐”为例进行创建,如图2所示。 图2 召回策略 表2 基于交替最小二乘的矩阵分解推荐参数说明 参数 说明 名称 根据业务自定义命名。 描述 根据业务自定义。例如,这是一个测试策略。 隐向量维度 在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。如果离线计算失败,建议调小至10以下。
数据导入 数据导入介绍 数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。
步骤4:发布自定义场景 步骤5:获取预测结果 步骤6:清除相应资源,避免产生费用 步骤1:准备数据 RES在公共OBS桶中提供了猜你喜欢的示例数据集,命名为“test-data”,因此,本文的操作示例使用此数据集进行构建。您需要执行如下操作,将数据集上传至您的OBS目录下,即准备工作中您创建的OBS目录。