检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据探索 数据探索介绍 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。
实时行为日志会被“基于行为数据的用户画像更新”和“基于用户的标签搜索候选集”使用; 实时用户日志会被“基于用户数据更新用户画像”使用; 实时物品日志会被“基于物品数据更新物品画像”使用。 创建近线作业 创建近线作业操作步骤如下: 登录RES管理控制台,在左侧导航栏单击进入“近线作业”页面。 在页
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
算法,使用户能够快速够获取到时下最流行的信息。 开始使用样例前,请仔细阅读准备工作罗列的要求,提前完成准备工作。 准备工作 已注册华为帐号并开通华为云,且在使用RES前检查账号状态,账号不能处于欠费或冻结状态。 已在OBS服务中创建桶和文件夹,用于存放样例数据。确保您使用的OBS目录与RES在同一区域。
Admin策略的用户,每个主账号最多可以创建100个企业项目。在使用工作空间绑定企业项目时,您需要在IAM中创建用户组、创建自定义策略、创建企业项目并添加用户组设置策略。 前提条件 如果您需要使用企业项目相关功能,请确保您已开通企业管理权限,如果还没有开通,请先登录管理控制台,单击页面右上方的“企业”。开通方法请参见:开通企业项目。
果并不断调整您的作业参数。您还可以基于离线作业得到的推荐候选集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。 用户通过数据质量作业对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策
填写业务相关配置,详请参见过滤规则。 过滤规则设置完成后,单击“下一步”。 排序策略 排序策略是用于对召回策略生成的候选集进行二次排序。如果使用排序策略,需在特征工程中提交排序样本预处理,创建完成后才可以正常使用排序策略。 各个策略的详细参数设置和输入输出请单击下方链接查看。 逻辑斯蒂回归-LR 因子分解机-FM 域感知因子分解机-FFM
托授权。IAM的更多信息请参见《统一身份认证服务文档》。 ModelArts ModelArts是面向AI开发者的一站式开发平台,排序策略使用Modelarts的深度学习计算能力训练得到排序模型。ModelArts的更多信息请参见《ModelArts服务文档》。 父主题: 基础问题
数据源 RES的离线数据源包括什么? 如何上传数据至OBS 如何上传实时数据? 离线数据和近线实时数据如何配合使用? 数据探索是什么?近线实时数据如何在数据探索中的报告体现? 如何确定近线数据源导入实时数据成功? 实时数据能否立即应用到推荐场景?
托授权。IAM的更多信息请参见《统一身份认证服务文档》。 ModelArts ModelArts是面向AI开发者的一站式开发平台,排序策略使用Modelarts的深度学习计算能力训练得到排序模型。ModelArts的更多信息请参见《ModelArts服务文档》。
进行服务授权 当您选择开通推荐系统,首次登录RES管理控制台系统会自动弹出“RES服务权限委托”的对话框,提示服务进行委托授权,即授权RES服务请求获取访问您在其他云产品中的资源,未授权将不能使用RES的完整功能。 图1 权限委托 单击“同意授权”系统会自动创建委托。由于RES与
基础问题 什么是RES? 与其他云服务的关系 如何开始使用RES? 获取访问密钥(AK/SK) 推荐作业有哪几种创建方式? 创建的场景是否会立即发布? 最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 是否有样例数据支撑我进一步了解RES? 什么是区域、可用区? API查询列表的接口返回结果是否支持分页?
创建工作空间 前提条件 使用RES工作空间您需要具备如下权限: 请确保您已开通RES并完成密钥认证。 已经开通相关资源并进行全局配置。 创建工作空间 登录RES管理控制台。 您可以通过两种方式创建工作空间,进入“创建工作空间”页面,填写工作空间参数信息。详请参见表1。 在左侧导航
什么是区域、可用区? 什么是区域、可用区? 使用用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region
为账号充值 当您使用RES时,建议您先为您的账号充值,确保账号有足够余额可以正常使用RES,具体操作请参见如何给华为云帐户充值。如果您账号里有足够的余额,可略过此部分内容。 父主题: 准备工作
“不离散”:(默认)不做归一化,不对数据做处理。 自定义行为类型 如果开启“自定义行为类型”, 算法则按用户设置的行为类型及权重进行排序预处理任务,否则默认使用数据源中的行为类型及权重进行任务。 “正向行为类型”:设置正向行为的类型及权重值。 “负向行为类型”:设置负向行为的类型及权重值。 行为去重方式
您可以对创建的工作空间进行修改操作,具体操作如下: 登录RES管理控制台,在左侧导航栏单击进入“工作空间”页面。 单击目标工作空间“操作”列的“编辑”,在“编辑工作空间”页面修改工作空间的名称或者描述信息。 单击“是”完成修改。 “状态正常”的工作空间修改时不影响该空间用户正常使用。 “删除中”状态和默认生
征中每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 操作步骤 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。单击目标数据源名称进入数据源详情页面。 在“执行步骤”页签,单击“
consume:消费 use:观看视频/听音乐/阅读。 您可以单击“增加行为权重”,新增一个行为权重。通过和来自定义权重大小。 单击可以删除对应行的行为权重。 物品曝光;1.0 物品最近邻域数 在ItemCF算法中使用,指定某个物品的若干个最近邻物品,构成该物品近邻集合。 50 相似性度量方式
自定义场景简介 RES面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。您可以基于RES提供的多种推荐训练作业得到推荐候选集,用于在线服务计算得到推荐结果。 自定义场景功能说明 表1 功能说明 功能 说明 详细指导 创建自定义场景