检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作,如修改数据源、创建自定义推荐,都是基于您创建的数据源进行的。 前提条件 已创建用于存储数据的OBS桶及文件夹,并且数据存储的OBS桶与RES在同一区域。 需要使用的数据已上传至OBS。 创建数据源 登录RES
当不需要该数据时,您单击可以单击目标近线数据右侧的“终止”,对“执行”状态的数据终止导入。 当终止导入后,该数据无法正常使用,请您谨慎操作。 删除近线数据源 当您不需要使用已有的近线数据源时,您可以删除导入数据。 在数据源列表单击目标数据源名称,进入数据源详情页面。 在页面的“近线数据源”页签,在目标数据源右侧单击按
该文件为JSON格式,包含特征名、特征大类、特征值类型。 新的全局特征配置文件(new_global_features_info)包含的特征是在原作业ID(job_id)对应的全局特征配置文件的特征基础上新增的一些特征或者删除一些特征;两份文件重复的特征名对应的特征类型必须保持一致。 响应消息 响应参数请参见表7。
一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 在除中国大陆以外的亚太地区有业务的用户,可以选择“中国-香港”、“亚太-曼谷”或“亚太-新加坡”区域。 在非洲地区有业务的用户,可以选择“非洲-约翰内斯堡”区域。 在欧洲地区有业务的用户,可以选择“欧洲-巴黎”区域。
候选集兴趣宽度(值越大召回的候选集中不同类型的物品越多,值越小则召回的类型越单一)。若algorithm_type为NEARLINE_UPDATE_USER_CANDIDATE_SET,则此字段必填。 time_name 否 String 物品数据中代表时间特征的字段名。若rank_type值为TIME,则此字段必填。
每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 操作步骤 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。单击目标数据源名称进入数据源详情页面。 在“执行步骤”页签,单击“数据
订阅服务 功能介绍 该接口用于订阅共享的服务。 URI POST /v1/{project_id}/infer-services/{service_id}/share 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 参数类型 说明 project_id 是 String
基于物品的协同过滤推荐 基于用户的协同过滤推荐 基于交替最小二乘的矩阵分解推荐 业务规则-基于历史行为记忆生成候选集 业务规则-人工导入 基于特征匹配的召回策略 基于UCB的召回策略 近线召回 基于物品相似度的实时召回 基于用户相似度的实时召回 在“创建自定义场景”页面,进入“召回策略”页签,单击“添
String 作业的ID。 is_success Boolean 请求是否成功。 error_message String 请求失败时的错误信息,请求成功时无此字段。 error_code String 请求失败时的错误码,请求成功时无此字段。 create_time Long 作业的创建时间。
"dataType": "CANDIDATES_SET", "description": "特定行为热度推荐算法生成的候选集" } ], "input_data": [ { "dataType": "USER_BEHAVIOR", "description": "用户操作行为表", "required":
过滤出用户发生过某行为的物品,并保存在此表中。例如,过滤出用户看过的物品,并存储在此表中。指定集群名称和表名用于存储更新后的用户画像。 不涉及。 基于用户的标签搜索候选集 基于用户的标签搜索候选集可以持续为用户召回新的候选集,召回频率可达秒级。以DIS中的实时行为日志为数据源,分析用户喜好,并以此为依据为用户召回候选集。此任务包含两种召回方式:
在购物车场景,使用的召回候选集来自于离线计算基于物品的协同过滤生成的候选集,而为了尽可能保证推荐的匹配度,要求推荐出来的物品尽可能的与用户性别、体质和年龄等属性吻合,所以考虑基于用户性别、体质和年龄等属性用标签索引得到的满足条件物品列表item1, 对离线生成的items2进行如
UserCF算法生成的用户-物品列表候选集。 基于交替最小二乘的矩阵分解推荐 基于交替最小二乘的矩阵分解推荐:基于用户-物品的行为信息作为原始矩阵,利用ALS优化算法对原始矩阵进行矩阵分解,分解之后的用户隐向量矩阵和物品隐向量矩阵可以用来生成预估的新的用户-物品评分矩阵,提取出评分最高的若干个物品作为召回结果。
20个字符。 job_description 否 String 作业描述,最大长度256字符。 online_services 是 List 需要进行效果评估的在线服务; indicators 是 List 请参见表3,需要统计的指标列表及其对应的参数。 start_time 是
JSON 请参见表4,平台参数。 computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 读取配置源路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型 说明 cluster_name
输出流DIS通道名称。该通道用于存放由行为数据和画像库计算生成的排序预处理数据,以供模型训练。通道中的数据属于流式训练作业产生的中间数据,使用者只需指定通道名称,无需往该通道发送或获取数据。 starting_offsets 是 String 读取DIS数据的起始位置,LATEST表示从最新的数据开始读取。 表10 data_source_config
提交模板作业接口,根据选择策略的不同,参数也有不同。 召回策略 parameter中包含的参数,请参见策略参数说明中召回策略(recall)各策略参数说明。 排序策略 parameter中包含的参数有以下几部分: spec_id :参数类型Long,训练作业选择的资源规格ID。 run_
待提取用户特征 (user_features) 是 JSONArray 从全局特征文件提取输入的用户特征,对不同类型的特征进行相应的处理,处理后的数据用于排序模型训练。 特征必须来自用户属性配置表中定义的特征。 [{ "feature_name": "age", "feature_type":
List 每个Flow配置不同流量和候选集的规则,请参见表4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid 否 String 预处理的离线处理生成的uuid。 filter_uuid
数)。 striping Striping object 行条化策略(属性匹配召回作业、物品协同过滤召回作业、用户协同过滤召回作业需要提供此参数)。 match_type String 匹配类型(属性匹配召回作业需提供此参数): UI,基于用户推荐物品 UU,基于用户推荐用户 II,基于物品推荐物品