检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略
文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。 排序 排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。 前提条件 已经有计算成功的离线作业并且已经生成候选集UUID。 您可以部署10个在线服务,每个在线服务可以创建2个在线流程 ,如需增加配额请您提工单处理。
其中排除行为过滤是指将有此行为类型的物品排除掉,不对其进行过滤。 例如,对于用户过去3天内有过曝光行为的物品过滤,但是可以对曝光过但是有购买行为的物品进行排除,不对其进行过滤。 开启调度 开启调度,按照指定的调度策略定期执行作业。 “调度周期”:调度周期可选“天”或“周”。 “调度类型”:包括自定义和间隔调度。
路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,获取方式请参见获取项目ID。 resource_id 是 String 资源id。 workspace_id 是 String 工作空间id。 表2 Query参数 参数 是否必选 参数类型
Query参数 参数 是否必选 参数类型 描述 category 是 String 类别: RECALL,召回作业 DATASOURCE,数据源作业 FILTER,过滤作业 SORTING,排序作业 EVALUATE,效果评估作业 请求参数 表3 请求Header参数 参数 是否必选 参数类型
数据区间 时间单位 支持天和小时。 数据选择 指定历史行为时间段,选取数据中最靠后的时间往前N天或N小时的行为数据计算用户偏好。 物品类别 是否需要根据category值对原始数据进行过滤。如新闻网站,category取值可能为娱乐、体育、时事等。 设置黑名单 设置黑名单列表。后续
0/{project_id}/workspaces/{workspace_id}/data-sources/{datasource_id} 表1 路径参数 参数 是否必选 参数类型 描述 datasource_id 是 String 数据源id。 project_id 是 String 项目id,获取方式请参见获取项目ID。
训练一个子数据集。 融合多值特征 将多值特征的多个embedding融合成一个embedding。 融合线性部分 是否使用模型架构中的线性部分。 固定哈希结构 是否固定结构参数。默认值为“否”,非特殊情况建议使用默认值。 父主题: 算法介绍及参数说明
只保留每个时间区间内的一条最新数据。您可以根据数据实际情况选择去重的时间周期,可选天、周、月。默认为“天”。 周一是第一天:行为数据按周去重,是否周一是第一天。 如果选择否, 则认为周日是第一天,保留每个时间区间内的一条最新数据。 训练集测试集划分方式 数据划分方式按时间比例或个数比例划分训练集测试集。
神经网络前向传播过程中以该概率保留神经元的值。默认0.8。 子网络结构 特征向量之间使用神经网络核来计算相互关系时,该神经网络的结构。默认40,5。 是否移除因子分解机 是否移除模型架构中的因子分解机部分,值为true则蜕变为带有核函数的DNN。默认关闭。 保存根路径 单击选择训练结果在OBS中的保存