检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
、数据修改等操作,为智能场景推荐和自定义场景推荐做好数据准备。 数据类型 当前RES支持创建数据源和导入近线数据。创建数据源的数据格式和近线数据导入的格式要求一致,包括用户数据、物品数据和行为数据。 用户数据 用户数据包括数据源中的“用户属性表”和用于近线计算的“用户画像”数据。
训练作业描述,最大长度为256字符。 project_id 是 String 项目编号,用于资源隔离。 user_id 是 String 用户ID。 operating_time 是 Long 操作时间。 request_info 是 Object 请求体。 response_info 是 Object 返回体。 job_status
修改编辑之后的离线数据源需要重新进行数据结构抽取和检测、探索等操作。 操作步骤 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入数据源列表页面。 在数据源列表单击目标数据源名称,进入数据源详情页面。 单击离线数据源右侧的“编辑”,在页面下方单击选择目标文件在OBS中的存储位置。 图1 修改离线数据源
operating_time 是 Long 操作时间。 request_info 是 Object 请求体。 response_info 是 Object 返回体。 job_status 是 String 作业状态。 resource 是 String 资源,现在支持DLI。 is_use 是 int
在“创建召回策略”页面,填写召回策略“名称”、“场景”和“描述”。 召回策略名称:请以“Retrieval-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。 设置计算引擎和信息,指定“服务名”、“集群名称”、“任务配置地址”、“资源规格”等信息。
用户画像表:用户自定义CloudTable集群名称和表名,用于存储生成的用户数据。 物品画像表:用户自定义CloudTable集群名称和表名,用于存储生成的物品数据。 设置数据版本:您可以单击设置数据版本。RES的数据版本有两种,“V1”版本即数据按照原有格式存储,未做过分区处理。“V2”版本则会
全局配置简介 全局配置界面包括密钥认证、属性配置和计算资源三部分,如图1所示。 图1 全局配置界面 全局配置功能说明 表1 功能说明 功能 说明 详细指导 密钥认证 在使用RES之前,需要获取添加访问密钥,用于授权使用OBS、DLI、Cloudtable、ModelArts等服务
说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。 请求消息 请求参数请参见表2所示。 表2 请求参数说明 参数名称 是否必选 参数类型 说明 type 是 String 指标类型。 parameter 是 String 全局配置参数配置。
start_time 是 Long 被统计数据的起始时间戳。 end_time 是 Long 被统计数据的终止时间戳。 interval 是 Double 统计间隔,以天为单位,每隔interval天计算一次指标,大于0。 result_path 是 String 结果保存路径。
智能场景”,进入智能场景列表页面。 选择智能场景列表中的目标场景,单击“操作”列的“删除”。 在“删除场景”页面确认智能场景信息后单击“是”。 删除场景包含删除场景下所有的策略和服务。场景运行存储在OBS中的数据不会被删除,需要您登录OBS进行删除操作。 父主题: 智能场景
通用格式。 storage 是 JSON 请参见表6,存储平台。 offline_platform 是 JSON 请参见表3,离线计算平台信息。 表3 offline_platform参数说明 参数名称 是否必选 参数类型 说明 platform 是 String 平台名称,最大长度64,支持DLI。
用户属性:指定在用户属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,用户属性来自于公共配置的全局特征信息文件。如过滤籍贯是广东且性别为男性的用户。 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即
至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。
nearline_platform 是 JSON 请参见表3,近线计算平台。 strategy 是 JSON 请参见表5,策略信息。 表3 nearline_platform 参数说明 参数名称 是否必选 参数类型 说明 platform 是 String 平台名称,最大长度64字符,支持DLI。
至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时
RES从全局角度计算在线服务获得推荐的调用次数,不区分每次调用的用户。例如A用户调用请求推荐接口是每秒5次,B用户调用请求推荐接口每秒5次,当A用户和B用户同时调用此接口时,总的获得推荐的调用请求为A用户和B用户之和,即5+5=10。 父主题: 自定义场景
说明 portrait_storage 是 JSON 请参见表27,用户画像,物品画像的存储信息。 global_features_information_path 是 String 全局特征信息文件。 match_feature_pairs 是 List 请参见表30,待匹配特征对。
返回的值。 run_path 是 String 训练结果保存根路径,训练完成后,会将模型和日志文件保存在该路径下。不包含中文的文件夹。 training_data_path 是 String 训练数据的OBS路径。 test_data_path 是 String 测试数据的OBS路径。
DeepFM,结合了FM和深度神经网络对于特征表达的学习,同时学习高阶和低阶特征组合,从而达到准确地特征组合学习,进行精准推荐。 表2 深度网络因子分解机参数说明 参数名称 说明 名称 自定义策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。