检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取访问密钥(AK/SK) 由于使用RES时,上传数据、进行计算等需要依赖其他服务,若没有添加访问密钥则无法使用其他服务。 获取访问密钥 登录华为云,在页面右上方单击“控制台”,进入华为云管理控制台。
添加密钥 登录RES管理控制台,在左侧导航栏单击“全局配置”,进入“全局配置”页面。 单击“添加密钥””,填写获取的访问密钥。 访问密钥(AK):输入密钥文件中的Access Key Id字段内容。
数据导入 数据导入介绍 数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。
子账户无法使用SDK上传数据,需要主账号授权子账号DIS USER权限。详细请参考权限管理。 下载SDK之后,需要修改pom文件中的依赖,对SDK进行升级,最新版本可升级至1.3.12。
AK(Access Key ID):访问密钥ID。与私有访问密钥关联的唯一标识符;访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访问密钥ID结合使用的密钥,对请求进行加密签名,可标识发送方,并防止请求被修改。
提交特征工程作业 功能介绍 该接口用于特征工程处理,包含数据预处理,特征提取和排序训练样本生成等。 URI POST /v1/{project_id}/etl-job 参数说明请参见表1。
通过DLF重新执行作业 推荐系统提供了重新执行作业的API,用来将任务以相同的配置重新执行一次,实现对离线任务生成结果的更新。以固定的周期定时调用此API,可保持结果处于一个较新的状态,以获得更好的推荐结果。
下载SDK之后,需要修改pom文件中的依赖,对SDK进行升级,最新版本可升级至1.3.12。 上传实时数据至RES 初始化DIS客户端,使用代码初始化DIS SDK客户端实例,代码样例如下。具体方式请参见初始化DIS客户端。
说明: 使用初始用户画像-物品画像-标准宽表生成的数据时,其路径具体到文件夹即可。 结果存储平台 存储类型有用户画像表和物品画像表两种。 用户画像表:用户自定义CloudTable集群名称和表名,用于存储生成的用户数据。
管理属性配置 计算资源 计算资源包括DLI服务,添加的计算资源需根据业务数据情况进行合理分配。 管理计算资源 父主题: 全局配置
生成的数据会覆盖原来的离线作业生成的数据,编辑并运行之后的离线作业会生成新的线上指定的UUID。 “启动中”、“计算中”状态的作业不支持编辑。 登录RES管理控制台,在左侧菜单栏中选择“离线作业”下的目标推荐作业,进入作业列表。
OBS地址 用户可从此OBS地址中选择自定义物品列表的csv文件。单击,从弹出的对话框中,选择数据存储的OBS桶及其文件夹。 导入候选集类型 选择导入候选集类型,目前支持以下三种。 物品-分数候选集:物品-分数候选集可以用于在线服务的推荐候选集。
生成的数据会覆盖原来的在线服务计算生成的数据。“部署中”的在线服务不支持编辑。操作步骤如下: 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表。 在“在线服务”页面,您可以单击目标服务操作列的“编辑”,进入“编辑在线服务”页面。
对于每个需要过滤的行为,生成用户具有该行为的物品的列表。再对同用户的每种行为的物品列表进行“与”或者“或”的关系,最终生成用户-物品过滤表。 表1 过滤规则参数说明 参数名称 说明 名称 自定义过滤规则名称。
产品功能 数据源 数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。
创建工作空间 前提条件 使用RES工作空间您需要具备如下权限: 请确保您已开通RES并完成密钥认证。 已经开通相关资源并进行全局配置。 创建工作空间 登录RES管理控制台。 您可以通过两种方式创建工作空间,进入“创建工作空间”页面,填写工作空间参数信息。详请参见表1。
前提条件 请您按推荐系统要求准备离线数据源。 开通OBS服务,确保您使用的OBS目录与RES在同一区域。 已经获取访问密钥(AK/SK)。 通过OBS管理上传数据 本文档中,采用管理控制台上传数据至OBS。 执行如下操作,将数据导入到您的数据集中,以便用于模型训练和构建。
│ obs-pretrain-data 用于存放排序预处理任务生成的预训练数据。 │ obs-error-data 用于存放异常数据输出路径,来源于近线策略。 │ obs-nearline-data 用于存放近线任务结果数据,宽表形式。
数据结构 当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。
推荐引擎 推荐引擎是以推荐为业务逻辑的引擎,即系统根据配置生成召回集作为起点,输出推荐结果集为终点的引擎。 排序引擎 排序引擎是以排序为业务逻辑的引擎,即用户提供排序集为输入,系统根据排序算法输出排序结果的引擎。 父主题: 自定义场景