检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源信息包括: 计算引擎:服务名、集群名称、任务配置地址、资源名信息、 存储平台:服务名、集群名称、表名。 数据源:数据表类型、数据源、数据格式。 召回策略信息 该离线作业设置的召回策略详情,召回策略信息包括: 策略别名,策略显示的名称。 OBS地址,推荐业务人员可从OBS中选择保存有人工编
性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,用户属性来自于公共配置的全局特征信息文件。如过滤籍贯是广东且性别为男性的用户。 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像
框中,选择数据存储的OBS桶及其文件或文件夹。 如果选取文件夹,该文件夹下面的数据格式需保持一致,避免数据干扰。 物品属性表 从OBS桶中选择数据。在“物品属性表”右侧,单击,从弹出的对话框中,选择数据存储的OBS桶及其文件或文件夹。 如果选取文件夹,该文件夹下面的数据格式需保持一致,避免数据干扰。
如何上传实时数据? 推荐系统支持您通过SDK上传实时数据,具体操作方法如下。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。 子账户无法使用SDK上传数据,需要主账号授权子账号DIS
进入智能场景列表页面。 单击“已完成”状态的目标服务名称进入智能场景详情页面,单击“预测”页签,您可以获取该服务的“API接口地址”。单击,复制接口地址,调用服务。 图3 获取预测接口 调用接口 Mozilla、Google都为REST提供了图形化的浏览器插件,发送处理请求消息。
单击目标服务名称,进入服务详情页面查看服务具体信息。 您可以查看服务的“名称”、“状态”、“描述”、“服务类型”、和“预测接口”。 您也可以通过单击预测接口右侧的,复制接口地址,调用服务。 图1 在线服务详情 您可以在如下页面查看服务相关参数信息,包括“在线流程”、“预测”、“配置更新记录”、“排序模型更新记录”。
在线服务 新建在线服务 查询在线服务详情 修改在线服务参数 删除在线服务 父主题: API
如何上传数据至OBS 使用RES进行推荐时,您需要将数据上传至对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,然后再进行数据的上传。创建OBS桶和上传文件夹的操作指导请参见创建桶和上传对象。 您在创建OBS桶时,需保证您的OBS桶与RES在同一个区域。
列的“保存”。 “任务配置地址”:用于存放创建作业时自动生成的JSON格式的配置源文件存储路径。 “全局特征信息文件”:根据全局特征信息文件规范准备并上传的全局特征信息文件路径。 “通用格式数据”:经过特征工程处理的宽表路径。 “用户属性表”:离线数据用户属性表的OBS路径。 “
物品,如果个数不够,再从item2中取其余的物品填补。 global_features_info_path 是 String 全局特征配置文件路径。 profile_uuid 否 String 特征工程初始用户画像-物品画像-标准宽表算子生成的uuid。 线上预测需要对候选集进行过滤时为必选项。
修改训练作业参数 功能介绍 修改指定作业的元数据信息。 调试 您可以在API Explorer中调试该接口。 URI PUT /v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/job-instance/{job_id}
智能场景 智能场景简介 创建智能场景 发布或终止智能场景 获取推荐结果 效果评估 编辑或删除智能场景
单击目标服务名称前方的查看预测接口,通过单击预测接口右侧的,复制接口地址,调用服务。 图2 获取预测接口 通过在线服务详情页面获取接口 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表页面。 单击目标服务名称进入服务详情页面,通过单击预测接口右侧的,复制接口地址,调用服务。 图3 获取预测接口 调用接口
上传实时数据 RES通过DIS SDK上传实时数据,用户实时日数据并做近线处理。当前仅支持Java语言的SDK,示例请参见《数据接入服务SDK参考》。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。
load_widetable 否 Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
Error 数据源的结构未确定,无法查询 请检查数据源信息是否正确。 400 RES.1201 Datasource Error 数据源正在被使用,无法修改 请检查数据源是否正在被使用。 400 RES.1202 Datasource Error 有作业正在运行,无法修改数据区间 请检查是否有作业正在运行。
任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。
离线数据源 调用RES之前,您需要准备3种基础数据包并上传至OBS,离线数据源目前支持CSV和JSON。具体数据包请参见表1 基础数据表。 表1 基础数据表 数据类型 表名 用户类数据 用户属性表 物品类数据 物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。
String 数据源名称,1-64位字母、数字、下划线、中划线组合。 最小长度:1 最大长度:64 specs_config 是 SpecsConfig object 计算规格配置。 data_config 是 DataConfig object 数据源配置。 表4 SpecsConfig
参数名称 是否必选 参数类型 说明 candidate_id 是 String 候选集ID。 rule_ratio 是 Integer 同优先级数据占比( 0-100 整数 同级别占比和为100)。 priority 是 String 优先级,1-10的整数(1优先级最高),最大长度32。