检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
项目并添加用户组设置策略。 前提条件 如果您需要使用企业项目相关功能,请确保您已开通企业管理权限,如果还没有开通,请先登录管理控制台,单击页面右上方的“企业”。开通方法请参见:开通企业项目。 如果您需要使用权限控制相关功能,请确保您已开通细粒度授权功能。 创建企业项目并添加用户组
建独立的IAM用户,您可以跳过本章节,不影响您使用RES服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的RES权限,并结合实际需求进行选择,RES支持的系统权限,请参见:RES系统权限。如果您需要对除RE
创建数据源 功能介绍 在指定的工作空间下面创建一个新的数据源。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/data-sources 表1 路径参数 参数 是否必选
用于在线服务计算得到推荐结果。 自定义场景功能说明 表1 功能说明 功能 说明 详细指导 创建自定义场景 自定义场景作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 创建自定义场景 召回策略 召回策略通过大数据计算或深度训练生成推荐候选集。 召回策略 过滤规则
效果评估 创建效果评估可以对线上服务设置指标,查看推荐效果的反馈,可以根据系统提供的指标添加。 创建效果评估 创建效果评估步骤如下: 在“离线作业”的“效果评估”页签,单击左上方“创建”,进入“创建效果评估”页面。 在“创建效果评估”页面,填写特征工程“名称”、“场景”和“描述”。
成,您可以通过效果评估检测推荐结果。 离线作业功能说明 表1 功能说明 离线作业 说明 详细指导 组合作业 组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。
设置计算引擎和信息,指定“服务名”、“集群名称”、“任务配置地址”、“资源规格”等信息。 单击“添加召回策略”,根据业务需要在下拉框中选择一个合适的策略。具体策略参数说明请单击上方策略名称查看。 图2 添加召回策略 (可选)在目标召回策略右侧,单击“查看输入输出”,可以查看输入数据和输出数据。
和终端节点中查询所有服务的终端节点。 推荐系统的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 表1 推荐系统的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四 cn-north-4 res.cn-north-4.myhuaweicloud.com
效果评估 创建效果评估可以对线上服务设置指标,查看推荐效果的反馈,可以根据系统提供的指标添加。 表1 效果评估参数说明 参数名称 说明 名称 自定义名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 描述 对于该效果评估作业的描述信息。
操作:可以单击操作列下面的进行删除某个匹配特征对。 您可以单击进入“添加匹配特征对”页面进行配置。设置特征对的用户特征名、物品特征名和权重。 最近邻域数 机器学习中的概念, 例如协同过滤计算中,需要计算物品之间,用户之间的相似度。最近邻域数是x,就是一个物品/用户找出x个和他相似的物品/用户。默认为100。
推荐系统提供了重新执行作业的API,用来将任务以相同的配置重新执行一次,实现对离线任务生成结果的更新。以固定的周期定时调用此API,可保持结果处于一个较新的状态,以获得更好的推荐结果。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下:
的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 操作步骤 登录RES
产品。如果物品项有多个,需要用英文逗号隔开。 图1 代码预测 表单:输入“ID”,并设置“最大推荐个数”。其中ID可以为用户ID或者物品ID,单击“预测”后显示预测结果,如图2所示。如果是关联推荐,则需要配置“物品项”,即推荐与物品项相关的产品。如果物品项有多个,需要用英文逗号隔开。
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 父主题: 数据源
的可能失败原因及解决方法请参见表1。 表1 部署失败解决方法 报错 失败原因 解决方法 Failed to deploy service(A maximum of (5) real-time service instances are allowed. 一个服务允许选择的节点个数不能超过5个。
购买套餐包 套餐包说明 RES服务支持按需和购买套餐包,根据用户选择使用的资源进行收费。一个完整的推荐场景需要下面三种资源,均为必选项。套餐的数量可以根据实际业务按需购买。 计算资源:用于推荐作业的计算规格。涉及计费功能包含:数据源、自定义场景、智能场景中的离线计算和模型训练。
件夹,然后再进行数据的上传。创建OBS桶和上传文件夹的操作指导请参见创建桶和上传对象。 您在创建OBS桶时,需保证您的OBS桶与RES在同一个区域。 父主题: 数据源
调用说明 推荐系统提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 父主题: 使用前必读
模型训练的最大迭代轮数,默认50。 提前终止训练轮数 在测试集上连续N轮迭代AUC无提高时,迭代停止,训练提前结束,默认5。 初始化方法 模型参数的初始化方法。 normal:正态分布 平均值:默认0 标准差:0.001 uniform :均匀分布 最小值:默认-0.001,均匀分布的最小值,必须小于最大值。
选择功能,该功能指定为"keywords"。 响应消息 响应参数请参见表2。 表2 响应参数说明 参数名称 是否必选 参数类型 说明 result 是 String 一个由抽取出来的无序的关键词集合生成的字符串,以空格连接。 示例 请求示例 { "mode":"keywords", "title":[