检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据质量管理 数据结构 数据导入 数据探索 父主题: 数据源管理
FullAccess 推荐系统服务管理员权限,拥有该权限的用户可以操作并使用所有推荐系统服务。 系统策略 RES ReadOnlyAccess 推荐系统服务只读权限,拥有该权限的用户仅能查看推荐系统服务数据。 系统策略 RES常用操作与系统策略的授权关系如表2所示,您可以参照该表选择合适的系统策略。
权限管理 创建用户并授权使用RES RES自定义策略
管理资源 创建资源 绑定或解绑资源 创建跨源连接 开启公共终端节点 父主题: 用户指南(旧版)
数据源管理 数据源管理简介 准备离线数据源 上传离线数据源至OBS 上传实时数据 创建离线数据源 导入近线数据源 数据质量管理 修改或删除数据源
独立的基于CTR预估的排序打分模块,支持个性化排序能力。 如何访问RES 您可以通过以下任何一种方式访问RES。 管理控制台 管理控制台是基于浏览器的可视化界面。通过管理控制台,您可以使用直观的界面进行相应的操作。使用方式请参见《推荐系统用户指南》。 REST API RES提供REST形式的访问接口,您能够非常容
您可以对处于“运行中”状态的服务进行“停止”操作。 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表。 在“在线服务”页面,单击目标服务操作列的“停止”结束作业的启动或计算。 删除服务 删除服务即清理服务产生的数据,完成资源释放。 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表。
管理离线作业 您可以对各离线作业进行“复制”、“编辑”、“终止”、“重新执行”、“删除”等操作。您也可以通过查看服务的详细信息判读作业训练状态和查询训练结果。 复制离线作业 用户可以通过复制组合作业再次创建新的作业进行离线计算。生成的数据和原来的作业生成的数据相互独立,复制的离线作业会生成新的线上指定的UUID。
管理属性配置 属性配置以键值对的方式进行存储,配置后的配置项可以用于整个服务。该配置项的值为用户指定的OBS路径,OBS相关操作请参见创建OBS桶。 前提条件 已开通OBS服务,并按照推荐系统OBS文件夹规范建议格式创建文件夹。 已上传离线数据。 创建场景 您可以根据自己的业务创
RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 修改或删除数据源 对您已经创建的数据源进行修改,对不需要的数据源进行删除。 父主题: 数据源管理
管理计算资源 计算资源DLI服务,添加的计算资源需根据实情情况进行合理分配。开通DLI集群大小就是根据业务需求对集群进行扩容缩容,计算资源最多设置5个。计算资源支持的操作包括: 创建计算资源 编辑计算资源 删除计算资源 创建计算资源 登录RES管理控制台,在“全局配置”页面的计算资源区域,单击“创建”添加计算资源。
数据结构 当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中
行为报表:行为报表展示各种行为类型以及该数据中此行为出现的次数。 画像查询:可以查询指定的用户或物品画像信息,包括静态和动态。 父主题: 数据质量管理
数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。
RES自定义策略 如果系统预置的RES权限不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参考策略支持的授权项。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。
合实际需求进行选择,RES支持的系统权限,请参见:RES系统权限。如果您需要对除RES之外的其它服务授权,IAM支持服务的所有权限请参见权限策略。 示例流程 图1 给用户授权RES权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予推荐系统服务只读权限“RES ReadOnlyAccess”。
资源DIS相关服务。 创建资源 登录RES管理控制台,在左侧菜单栏中选择“资源中心”下的目标服务,单击页面上方“ 去创建”,跳转到对应服务管理控制台。 DLI创建集群操作详请参见数据湖探索用户指南>Spark作业控制台>Spark集群管理>创建集群章节。 CloudTable创建集群操作详请参见表格存储服务用户指南>
创建跨源连接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。 前提条件 已开通计算引擎DLI服务,创建集群并完成资源绑定。 创建跨源链接 DLI集群绑定完成后,创建跨源链接。步骤如下: 登录RES管理控制台,在“资源中心”页面,选择计算引擎DLI进入列表。
SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。 子账户无法使用SDK上传数据,需要主账号授权子账号DIS USER权限。详细请参考权限管理。 下载SDK之后,需要修改pom文件中的依赖,对SDK进行升级,最新版本可升级至1.3.12。 上传实时数据至RES 初始化DIS客户端,使用代码初始化DIS
算越快。 单击“立即创建”。 数据源创建完成后,系统自动跳转至数据源列表页面并提示您数据源创建成功。针对创建好的数据源,您可以进行“删除”操作。您可以在数据源列表页面单击您创建的数据源名称进入数据源详情页面。 父主题: 数据源管理