检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。 选择已经创建的自定义场景,单击名称,进入到自定义场景详情页。 单击已经创建的在线服务名称下面的“编辑”,进入编辑页面。 图1 修改在线服务参数 打开高级选项,进行打散功能的配置,选取相应的属性即可完成配置。 “高级类型”:选择“打散”。
参考数据源管理进行创建。 配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。 选择已经创建的自定义场景,单击名称,进入到自定义场景详情页。 单击已经创建的在线服务名称下面的“编辑”,进入编辑页面。 图1 修改在线服务参数 修改“过滤(黑名单)”下面的参数。
召回策略成功,继续单击“下一步”,跳过可选步骤过滤策略和排序策略,进入“在线服务”页面,进行在线服务的配置。 在“在线服务”配置页面,进行在线流程配置,配置完成后单击“创建并完成”。 “在线流程”:自定义在线流程名称,此样例命名为“hot-flow”。 “推荐候选集”:选择步骤3
排序策略-近线排序策略 近线排序策略用于对在线实时数据排序。如果使用在线排序模型,需在排序策略-近线特征工程中创建完成后才可以正常使用排序策略。 在“创建自定义场景”页面,进入“排序策略”页签,单击“添加近线排序策略”。 进行在线学习参数配置。 名称:自定义在线排序策略名称。 离线排序策略:
过滤规则用于生成推荐的过滤集,包含黑白名单、 特征过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 特征工程 特征工程常用于对原始数据进行特征挖掘的处理,形成的结果用于排序策略的训练。 排序策略 排序策略利用CTR预估或综合性计算的算法给候选集做打分。 在线服务 在线服务应用于做线上推荐,每个服务之间是
推荐系统对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线策略的数据。通过上述作业训练出可用于在线服务的推荐候选集。当在线作业运行完成,您可以通过效果评估检测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作 创建华为云账号 进行服务授权 数据源 准备离线数据
、CloudTable开启IAM认证的集群和DIS通道供用户选择进行绑定或解绑。 背景信息 绑定资源之后,将该资源应用于RES的作业训练及在线作业获取推荐结果。 解绑资源完成资源释放,已经解绑的资源不再应用于RES的相关计算。 已开通计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关服务。
式。 数据时间范围 被统计数据的起始时间和终止时间。 统计间隔(天) 统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。 结果保存路径 效果评估结果在OBS的文件输出路径。 指标 推荐服务效果评估指标,通过指标后的下拉框选
Logistic Regression (LR) LR算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。LR算法通过在线性回归的基础上叠加一个sigmoid激活函数将输出值映射到[0,1]之间,是机器学习领域里常用的二分类算法。 表1 逻辑斯蒂回归参数说明 参数名称
RES服务配额 资源 限制条件 建议 推荐引擎预测接口中最多请求结果数量 20 可提工单支持更高规格。 单份画像数据中最多支持的特征数量 30 单场景在线服务最多支持每秒请求的次数(TPS) 200 数据源个数 5 场景个数 10 单场景下推荐预测返回的结果集个数 20 如果当前资源配额限制
窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10s。 算子参数 在线服务名:使用的在线服务的名称。该在线服务需满足前提条件的要求。 流程名:在线服务对应的在线流程名称。 异常数据输出路径:单击右侧的按钮,选择数据在OBS中的存放路径,此路径下会记录不符合任务要求的输入数据。
工作空间简介 RES工作空间帮您实现离线作业、近线作业和在线服务隔离的功能,达到不同角色用户信息隔离管理的目的。 如果您未开通企业项目管理服务的权限,您可以在RES创建自己独立的工作空间。 如果你开通了企业项目管理服务的权限,可以在创建工作空间的时候绑定企业项目,并在企业项目下添
online_job_uuid 是 String 关联的在线服务的uuid。 flow_name 是 String 关联在线服务的其中一个在线流程的名称。流式训练作业所需的行为参数、模型文件路径、数据预处理信息等参数会从指定的在线服务的在线流程中获取。 online_training_config
读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。 集群名称,选择“资源中心”绑定的CloudTable集群名称。 表名,存储的表格名称。 过滤规则别名 自定义过滤
列表页面和自定义场景详情页面进行操作。 发布或终止自定义场景默认对该场景下的所有作业执行发布或终止操作,包括召回策略、过滤规则、排序策略和在线服务等作业。 前提条件 已存在创建成功的自定义场景。 发布自定义场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务” > “自定义场景”,进入自定义场景列表页面。
删除训练作业信息。 在线服务 新建在线服务 新建在线服务元数据,新建成功之后可手动发布此服务。 查询在线服务详情 根据给定的workspace_id和resource_id及category查询在线服务。 修改在线服务参数 修改指定在线服务的元数据内容。 删除在线服务 删除在线服务实例。 调度
作者,一个作者一个元素,信息流推荐场景建议填写。 否 content String 物品的内容描述信息,例如简介/摘要/正文关键片段,最长支持5000个中英文字符,超过则截断处理。 否 tags List[String] 描述物品的标签,每个标签为独立的一个元素。 否 location Json
自定义场景 推荐引擎和排序引擎有什么区别? RES支持哪些自定义策略? 重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 在线服务获得推荐的调用次数如何计算? 自定义场景关闭后,为什么会自动启动?
Studio管理控制台,在控制台的左侧导航栏,选择“数据开发 > 作业开发”。 在“工作区”页面的右侧,单击“新建作业”。 作业名称修改为您可以识别的名称。只能包含英文字母、数字、中文、“-”、“_”、“.”,且长度为1~128个字符。 作业类型、创建方式、选择目录、作业责任人、作业优先级、日志路径均选择默认参数。