检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
属性对。 表30 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表31 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
查询训练作业 功能介绍 查询resource_id(数据源id或场景id)下的指定类型的作业。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.0/{project_id}/workspaces/{workspace_id}/resources/{r
属性对。 表30 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表31 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
topK 用户最感兴趣的排序在前K个的物品。 行为 行为类型:用户感兴趣的行为类型。 权重值:行为的初始权重。 衰减系数:用于衰减行为初始权重的系数。 有效时间:用户配置的行为发生时间与当前时间的间隔,以小时为单位。系统只处理在该时间范围内的行为记录。 基于用户相似度的实时召回 基于用
推荐系统提供了查询作业详情API接口,可返回作业详情。返回体中的作业状态字段“jobs.job_status”表示了当前任务的状态。 重新执行作业的API用来将任务以相同的配置重新执行一次。 通过查询作业详情API和重新执行作业的API可完成对任务状态的监控,并且可以根据任务状态决定是否需要重新执行任务。
推荐系统提供了重新执行作业的API,用来将任务以相同的配置重新执行一次,实现对离线任务生成结果的更新。以固定的周期定时调用此API,可保持结果处于一个较新的状态,以获得更好的推荐结果。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下:
选择CloudTable进入列表。 单击CloudTable集群名称操作列的“开启公共终端节点”,待页面提示“开启公共终端节点成功”即可正常使用集群。 当您不再使用该集群,请先进行解绑,然后在服务对应的管理控制台删除集群。 父主题: 管理资源
match_infos 进行召回匹配的参数配置,即搜索的匹配信息。 label:客体的属性名称(可为字符串或字符串数组类型)。 value:相应的属性值。 weight:该属性值的匹配权重,多个匹配条件做加权汇总后按分值从大到小给出候选集。 filter_info 搜索的过滤信息。 black_list:客体需要过滤的黑名单。
过滤规则 过滤规则用于配置候选集的过滤方式,使之不进入候选集。对于每个需要过滤的行为,生成用户具有该行为的物品的列表。再对同用户的每种行为的物品列表进行“与”或者“或”的关系,最终生成用户-物品过滤表。 表1 过滤规则参数说明 参数名称 说明 名称 自定义过滤规则名称。由中文、英
模型相关的参数信息。 预测 可对运行中状态的在线服务进行预测,输入预测代码,单击“预测”后显示预测结果。 配置更新记录 展示配置相关记录。 单击配置记录前方的可查看该记录下详细的模型信息,包括模型名称、版本、分流、计算节点规格和计算节点个数。 排序模型更新记录 展示模型的更新记录。包括模型名称、状态、更新时间和消息。
一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 在除中国大陆以外的亚太地区有业务的用户,可以选择“中国-香港”、“亚太-曼谷”或“亚太-新加坡”区域。 在非洲地区有业务的用户,可以选择“非洲-约翰内斯堡”区域。 在欧洲地区有业务的用户,可以选择“欧洲-巴黎”区域。
会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。 集群名称,选择“资源中心”绑定的CloudTable集群名称。
online_services 是 List 需要进行效果评估的在线服务; indicators 是 List 请参见表3,需要统计的指标列表及其对应的参数。 start_time 是 Long 被统计数据的起始时间戳。 end_time 是 Long 被统计数据的终止时间戳。 interval 是 Double
行为类型:选择需要进行评估的行为类型,如物品曝光。 阈值:阈值是用来衡量用户行为有效性的标准, 当数据源的actionMeasure的值大于阈值时, 当前用户行为有效。 去重:您可以单击勾选,根据用户对行为记录去重。 指标设置 指标名称:请您定义评估的指标名称。 指标公式:用户指
gpu_num Int 资源规格GPU的个数。 gpu_type String 资源规格GPU的类型。 spec_code String 云资源的规格类型。 max_num Int 以选择的最大节点数量。 storage String 资源规格的ssd大小。 interface_type
UserCF算法生成的用户-物品列表候选集。 基于交替最小二乘的矩阵分解推荐 基于交替最小二乘的矩阵分解推荐:基于用户-物品的行为信息作为原始矩阵,利用ALS优化算法对原始矩阵进行矩阵分解,分解之后的用户隐向量矩阵和物品隐向量矩阵可以用来生成预估的新的用户-物品评分矩阵,提取出评分最高的若干个物品作为召回结果。
(可选)数据接入资源DIS 开通相关资源 绑定资源 针对您创建的集群等资源,需要完成绑定,才可以在创建作业时可选择绑定的集群进行计算存储等操作。 绑定资源 创建跨源链接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。 创建跨源连接 开启公共终端节点
开始和结束,长度为1~64个字符。 描述 对于特征工程的描述信息。 待提取用户特征 排序模型需要经特征工程处理后的数据, 选择排序模型需要的用户特征, 未选择的用户特征将不会被处理,即排序模块将忽略这些特征。 说明: 离散的区间个数不能超过100个,请您根据业务需求合理分配参数值。
实时日志 RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。用户发送到DIS上的数据具体如下: 实时行为日志 实时行为日志的作用包括: 更新用户的兴趣标签。 记录所选行为类型的历史记录。 更新用户的上下文信息。 召回候选集。 表1 实时行为日志字段描述 字段名
效果评估 创建效果评估可以对服务设置指标,查看推荐效果的反馈,可以根据系统提供的指标添加。 创建效果评估作业 登录RES管理控制台,在左侧导航栏中选择“推荐业务>智能场景”,默认进入“智能场景”列表。 在智能场景列表中,单击“运行中”状态的目标场景名称,进入详情页。 单击“效果评估”页签