检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
h 是 String 该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,文件路径为用户在排序数据预处理中输入的结果保存路径参数表示的路径的“fields_feature_size”目录下,文件名称为“part-00000”,需要用户提供文件完整路径。 max_iterations
withRegion("YOUR_REGION") .build(); 其中,各参数说明如下: “YOUR_AK”、“YOUR_SK”即访问密钥,获取方式请参见获取访问密钥。 “YOUR_PROJECT_ID”为项目ID、“YOUR_REGION”为区域ID,获取方式请参见获取项目名称、项目ID、区域ID。
Error 数据库资源模型配置出错 请联系管理员检查数据库模型配置。 400 RES.3005 Basic Error 数据源连接配额不足 您可以构建最多5数据连接。请及时清理连接。 400 RES.3301 Datasource Error 数据源类型错误 请检查数据源信息是否正确。
等。排序预处理算子会将所有特征值规范到统一长度以便后续处理; KV数值型(map):Map[String,Double]型,每一个特征值都是一个不定长的key-value对,例如用户画像、物品画像等特征。排序预处理算子会将所有特征值规范到统一长度以便后续处理。 特征处理参数 (f
在“创建效果评估”页面,填写特征工程“名称”、“场景”和“描述”。 效果评估名称:请以“Evaluate-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。 图1 创建效果评估 配置创建效果评估相关参数,请参见表1。 表1 创建效果评估参数说明
在“创建过滤规则”页面,填写特征工程“名称”、“场景”和“描述”。 特征工程名称:请以“Filter-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。 根据表1设置计算引擎和存储平台相关参数,并根据业务需要在“增加历史行为过滤”,如图2所示。
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
开启时间跨度 不开启取全部数据,开启则指定从数据源中取最近天数或小时数的行为数据计算相似度。 时间单位 开启时间跨度后,支持按照天或者小时为单位从指定从数据源中取行为数据计算相似度。 时间跨度 用于指定从数据源中取最近多少天或者多少小时的行为数据计算热度。默认取全部数据。 开启调度 开启调度,按照指定的调度策略定期执行作业。
【去重】物品属性 属性名从画像算子生成,如“product_color”,则对产品颜色相同的物品进行去重。 【去重】忽略长度 截断物品ID末尾指定长度后的字符串进行去重,如指定长度为2,则SKU_A1234和SKU_A1244只会保留其中一个。 属性过滤规则 指定定制化用户属性以及物品属性
即特征工程“排序样本预处理”结果保存路径下具体的测试文件路径。 特征值数量统计文件 该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,需要用户提供此文件完整路径。文件路径为特征工程中排序样本预处理作业输出数据的结果保存路径的“fields_feature_size”目录下文件名称是part-00000
并且不能以空格开始和结束,长度为1~64个字符。 描述 对于该策略的描述信息。 最大交互阶数 算法探索的最大的特征交互阶数。例如,当设定最大交互阶数为4时,算法会探索2阶、3阶、4阶的特征交互组合。默认3。 各阶隐向量长度 各阶特征交互使用的隐向量长度,数量需对应最大交互阶数。默认10
输出流DIS通道名称。该通道用于存放由行为数据和画像库计算生成的排序预处理数据,以供模型训练。通道中的数据属于流式训练作业产生的中间数据,使用者只需指定通道名称,无需往该通道发送或获取数据。 starting_offsets 是 String 读取DIS数据的起始位置,LATEST表示从最新的数据开始读取。 表10
流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid 否 String 预处理的离线处理生成的uuid。 filter_uuid 否 String 过滤规则生成的uuid。 表4 rules参数说明 参数名称 是否必选 参数类型 说明
能达不到要求,可以增加Cloudtable的RS单元数量提升性能。 排序样本预处理 将内部通用格式数据处理成排序策略所要求的特定格式数据,同时进行离散化,数据编码等特征工程处理。 表2 排序样本预处理输入参数说明 参数名称 说明 全局特征信息文件 用户在使用特征工程之前,需要提供
兴趣标签维护长度 各标签体系下,兴趣标签的最大长度。 20 全局特征信息文件 用户在使用近线策略之前,需要提供全局特征信息文件,该文件为JSON格式,包含特征名、特征大类、特征值类型。当上传的数据中的特征有变化时,需要同步更新该文件。全局特征信息文件示例请参考全局特征信息文件。 - 异常数据输出路径
、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 描述 对于特征工程的描述信息。 待提取用户特征 排序模型需要经特征工程处理后的数据, 选择排序模型需要的用户特征, 未选择的用户特征将不会被处理,即排序模块将忽略这些特征。 说明: 离散的区间个数不能
评估检测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作 创建华为云账号 进行服务授权 数据源 准备离线数据 创建离线数据源 上传实时数据 导入近线数据源 数据质量管理 修改或删除数据源 智能场景 创建智能场景 发布或终止智能场景 获取推荐结果 自定义场景 创建自定义场景 修改自定义场景
由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。 完成该项配置后,单击“下一步”。 资源选择 您在使用RES时需要选择计算引擎、存储平台和数据源。计算引擎对数据进行计算,存储平台将处理的数据进行存储。其选择的服务资源即为“资源中心”绑定的资源。
准备离线数据源 在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。如果使用近线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说明,准备相应的数据。 目前数
table_name 是 String 表名称,最大长度64字符。 cluster_name 否 String 集群名称。 data_version 否 String 数据版本号。V1或者V2。 region_info 否 JSON 预分区信息。如果选择数据版本为V2时,才需要设置预分区信息。V