检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。
隐向量维度 在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。如果离线计算失败,建议调小至10以下。 默认为10。 优化正则化系数 在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。 设置为默认参数0.01。
offline_platform 是 JSON 请参见表3,离线计算平台信息。 storage 是 JSON 请参见表8,信息存储。
数据探索 数据探索介绍 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。
父主题: 平台资源API
父主题: 平台资源API
父主题: 平台资源API
父主题: 平台资源API
父主题: 平台资源API
data_source 是 List 算法数据源配置 DATA_QUALITY_INSPECTION,数据源选择通用模板数据,请参见表5。 offline_platform 是 JSON 请参见表3,离线计算平台信息。
离线数据为初次对接RES的批量数据,供场景中的召回算法和排序算法进行计算。近线数据可实时更新、增加用户和物品表数据,同时实时行为数据,可作为后续近线召回计算,这些近线行为数据也会和离线行为数据进行汇总存储,供离线计算。
父主题: 平台资源API
父主题: 平台资源API
offline_platform 是 List 请参见表3,离线计算平台信息。 data_source 是 List 请参见表5数据源。 storage 是 List 请参见表8,信息存储。 algorithm_setting 是 JSON 请参见表10,算法配置。
algorithm_config 是 JSON 请参见表11,算法参数配置。 表7 data_source 参数说明 参数名称 是否必选 参数类型 说明 platform 是 String 平台名称,现在只支持DIS。
优化器类型 grad:梯度下降算法 学习率:优化算法的参数,决定优化器在最优方向上前进步长的参数。默认0.001。
因子分解机算法是一种基于矩阵分解的机器学习算法,能够自动进行二阶特征组合、学习特征之间的关系,无需人工经验干预,同时能够解决组合特征稀疏的问题。FM算法参数请参见因子分解机。
algorithm_type 是 String 算法类型 UPDATE_INDEX_SCHEMA algorithm_parameters 是 JSON 算法参数。 UPDATE_INDEX_SCHEMA,请参见表6。 storage 是 JSON 请参见表5,存储平台。
数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略 召回策略用于生成推荐的候选集,在原始数据中通过算法和规则匹配用户的候选集。
云容器引擎-成长地图 | 华为云 推荐系统 推荐系统(Recommender System),基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。