检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
“通用格式”:通用格式数据为经过特征工程作业生成的数据。 (可选)单击页面右侧“删除”,可以删除该算子。 设置完成后,单击“确定”。数据质量检测作业一般需要运行一段时间,请您耐心等待。您可以前往数据质量作业列表,查看作业的基本情况。在作业列表中,刚创建的离线作业“状态”为“计算中”,当离线
导入宽表 选择是否导入宽表。 宽表为推荐系统内部格式, 以行为数据为主, 将行为数据中涉及到的用户数据和物品数据整合成一条数据。 保留已有宽表 选择对已有宽表是否保留。目前支持覆盖、是、否。 开启调度 开启调度,可按照您所设置的时间周期性的提交任务。 “调度周期”:调度周期可选“天”或“周”。
该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 保留已有宽表 对结果保存路径中已有宽表数据的保留方式: 否,不保留任何已有的数据。 是,保留全部已有的数据。 覆盖,将相同日期下的数据覆盖掉,保留不同日期下的数据。 结果保存路径 行为-用户-物品(通用格式)的保存路径。
save_mode 否 String 对结果保存路径中已有宽表数据的保留方式: new(否,不保留任何已有的数据) append(是,保留全部已有的数据) overwrite(覆盖,将相同日期下的数据覆盖掉,保留不同日期下的数据) 表11 rank_etl_parameters参
面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。 用户 推荐系统被推荐的对象,一般是指使用业务系统的客户。例如,某电商的客户。 物品 被推荐的内容,一般是指业务系统提供的给其用户的商品。例如,某视频网站的视频。 召回策略 召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。
物品进行去重。 【去重】忽略长度 截断物品ID末尾指定长度后的字符串进行去重,如指定长度为2,则SKU_A1234和SKU_A1244只会保留其中一个。 属性过滤规则 指定定制化用户属性以及物品属性过滤规则,属性过滤规则用于过滤最终用户的推荐结果。例如,对于一线城市的用户过滤敏感
过滤(白名单) 属性值保留 指定定制化用户属性、物品属性和应用于某个召回策略属性过滤规则,保留该选定的属性值,使之进入候选集。例如,对于保留一线城市的用户物品信息物品。单击增加属性值保留。 “用户属性”:指定在用户属性中需要过滤的字段,包含属性名和属性值。如保留籍贯是广东且性别为男性的用户。
优先)和按时间去重(每天、每星期、每个月保留一条数据)。 “权重绝对值”:保留行为权重绝对值最高的一条数据。 “日期”:按照"时间类型", 保留指定区间的一条最新数据。 时间类型 将行为数据中某个用户对某个物品的多条记录进行去重, 只保留每个时间区间内的一条最新数据。您可以根据数
String 选择功能,该功能指定为"sorted-keywords"。 topn 是 String 设置最多保留前n个词(如不足n个则全保留),注意是String类型,如保留前10个词,则 "topn":"10"。 响应消息 响应参数请参见表4。 表4 响应参数说明 参数名称 是否必选
为过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 过滤规则 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 排序策略-离线特征工程 排序策略 排序策略根据不同的算法模型对召回策略或者近线策略生成的候选集进行重排序,得到推荐候选集列表。
数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略 召回策略用于生成推荐的候选集,在原始数据中通过算法和规则匹配用户的候选集。 召回策略 排序策略
入“场景列表”页面。 单击目标场景操作列的“删除”,即完成场景删除。 场景删除操作无法恢复,请谨慎操作。场景删除后,OBS路径下的文件依旧保留。 默认场景不支持删除。 父主题: 全局配置
- 候选集 是否维护维新入库物品候选集。 时间特征名称:特征值为10位时间戳的特征名称。 候选集最大长度:维护的候选集的最大长度。 保留天数:保留时间为最近N天的候选集。 false 物品画像存储 指定存储物品画像的存储平台信息: 服务名:默认CloudTable,用于存储更新后的物品画像。
激活函数 神经网络中的激活函数,将一个(或一组)神经元的值映射为一个输出值。 relu tanh sigmoid 神经元值保留概率 神经网络前向传播过程中以该概率保留神经元的值。默认0.8。 保存根路径 单击选择训练结果在OBS中的保存根路径,训练完成后,会将模型和日志文件保存在该路径下。该路径不能包含中文。
您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。 如何选择区域? 选择区域时,您需要考虑以下几个因素: 地理位置 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 在除中国大陆以外的亚太地区有业务的用户,可以选择“
点数不大于5000,神经网络层数不大于10。默认为400,400,400。 神经元值保留概率 (value_keep_probability) 是 Double 神经网络前向传播过程中以该概率保留神经元的值。取值范围(0,1],默认0.8。 激活函数 (active_function)
“过滤字段”:发布时间(publishTime)或过期时间(expireTime)。 “保留期”:单位(天)。最小值1,最大值15。 召回结果中,仅保留符合 ((当前时间-过滤字段的值)< 保留期)的召回结果。 召回字段 召回字段即在召回时,仅利用选择的召回字段进行召回。 数据结构
照配置的TPS进行计费,即有效TPS为配置TPS和真实TPS的最大值。 例如:当系统DAU为10W,并且推荐接口在登录首页时触发,在线服务一般可配置为10TPS。 计费模式 RES目前提供按需、预付套餐包共2种计费方式。 按需购买:这种购买方式比较灵活,可以即开即停。 预付套餐包
导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否 overwirte,覆盖 indicators 否 Array
激活函数 神经网络中的激活函数,将一个(或一组)神经元的值映射为一个输出值。 relu tanh sigmoid 神经元值保留概率 神经网络前向传播过程中以该概率保留神经元的值。默认0.8。 重新训练 对第一次训练无影响,仅影响任务重跑。 “是”:清空上一轮的模型结果后重新开始训练。