检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
源详情页面。 在“执行步骤”页签,单击“数据结构”下的“开始识别”,进入“识别”页面,确认页面信息后单击“是”进行特征抽取。 当执行完成“识别”状态为“已完成”时,进行“人工复核”确认操作。 在“特征抽取”页签确认识别出的数据信息。 如果复核抽取的数据信息无误,单击“确认”,在“
可查看所创建“离线作业”、“近线作业”和“在线服务”的名称、状态和创建时间。 图1 总览 单击作业或服务名称,进入该详情页面,可以查看资源信息、策略信息和日志信息。您也可以通过页面快速创建作业或服务。单击“创建在线服务”,快速进入创建在线服务页面。 父主题: 用户指南(旧版)
组合作业 创建组合作业 通过创建组合作业,用户可以根据配置的策略规则进行离线计算得到不同策略的候选集ID,来进行在线流程计算,得到用户满意的推荐结果。组合作业具体实现请参见图1。 图1 组合作业 创建组合作业主要包括如下设置: 基本配置 资源选择 召回策略 过滤规则 排序策略 预览配置
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。 选择已经创建的自定义场景,单击名称,进入到自定义场景详情页。 单击已经创建的在线服务名称下面的“编辑”,进入编辑页面。 图1 修改在线服务参数 打开高级选项,进行打散功能的配置,选取相应的属性即可完成配置。 “高级类型”:选择“打散”。
参考数据源管理进行创建。 配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。 选择已经创建的自定义场景,单击名称,进入到自定义场景详情页。 单击已经创建的在线服务名称下面的“编辑”,进入编辑页面。 图1 修改在线服务参数 修改“过滤(黑名单)”下面的参数。
略生成的候选集进行重排序,得到推荐候选集列表。 排序策略-离线排序模型 在线服务 在线服务用来做线上推荐时的应用,每个服务之间是独立的。即根据不同的离线计算得到的候选集以及相关参数,提供不同的推荐服务。 在线服务 效果评估 指用于通过推荐系统推荐出去的结果集并利用trace_id
召回策略成功,继续单击“下一步”,跳过可选步骤过滤策略和排序策略,进入“在线服务”页面,进行在线服务的配置。 在“在线服务”配置页面,进行在线流程配置,配置完成后单击“创建并完成”。 “在线流程”:自定义在线流程名称,此样例命名为“hot-flow”。 “推荐候选集”:选择步骤3
排序策略-近线排序策略 近线排序策略用于对在线实时数据排序。如果使用在线排序模型,需在排序策略-近线特征工程中创建完成后才可以正常使用排序策略。 在“创建自定义场景”页面,进入“排序策略”页签,单击“添加近线排序策略”。 进行在线学习参数配置。 名称:自定义在线排序策略名称。 离线排序策略:
推荐系统对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线策略的数据。通过上述作业训练出可用于在线服务的推荐候选集。当在线作业运行完成,您可以通过效果评估检测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作 创建华为云账号 进行服务授权 数据源 准备离线数据
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval 否 Integer 更新周期(在线训练任务需要提供此参数)。 optimizer 否 Optimizer object 优化器(在线训练任务需要提供此参数)。 flows 否 Flow object 在线流程(在线训练任务需要提供此参数)。
、CloudTable开启IAM认证的集群和DIS通道供用户选择进行绑定或解绑。 背景信息 绑定资源之后,将该资源应用于RES的作业训练及在线作业获取推荐结果。 解绑资源完成资源释放,已经解绑的资源不再应用于RES的相关计算。 已开通计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关服务。
集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。 用户通过数据质量作业对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线作业的数据。通过上述离线作业训练出可用于在线服务的推
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval 否 Integer 更新周期(在线训练任务需要提供此参数)。 optimizer 否 Optimizer object 优化器(在线训练任务需要提供此参数)。 flows 否 Flow object 在线流程(在线训练任务需要提供此参数)。
Logistic Regression (LR) LR算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。LR算法通过在线性回归的基础上叠加一个sigmoid激活函数将输出值映射到[0,1]之间,是机器学习领域里常用的二分类算法。 表1 逻辑斯蒂回归参数说明 参数名称
RES服务配额 资源 限制条件 建议 推荐引擎预测接口中最多请求结果数量 20 可提工单支持更高规格。 单份画像数据中最多支持的特征数量 30 单场景在线服务最多支持每秒请求的次数(TPS) 200 数据源个数 5 场景个数 10 单场景下推荐预测返回的结果集个数 20 如果当前资源配额限制
工作空间简介 RES工作空间帮您实现离线作业、近线作业和在线服务隔离的功能,达到不同角色用户信息隔离管理的目的。 如果您未开通企业项目管理服务的权限,您可以在RES创建自己独立的工作空间。 如果你开通了企业项目管理服务的权限,可以在创建工作空间的时候绑定企业项目,并在企业项目下添
如果同一用户或物品有多条记录,将会按照用户ID或者物品ID去重。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 已完成数据结构识别和人工复核确认。 操作步骤 在“执行步骤”页签,单击数据导入下的“执行”。进入“导入”页面,确认页面信息后单击“确认”,允许推荐系统读取您
作者,一个作者一个元素,信息流推荐场景建议填写。 否 content String 物品的内容描述信息,例如简介/摘要/正文关键片段,最长支持5000个中英文字符,超过则截断处理。 否 tags List[String] 描述物品的标签,每个标签为独立的一个元素。 否 location Json
窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10s。 算子参数 在线服务名:使用的在线服务的名称。该在线服务需满足前提条件的要求。 流程名:在线服务对应的在线流程名称。 异常数据输出路径:单击右侧的按钮,选择数据在OBS中的存放路径,此路径下会记录不符合任务要求的输入数据。