检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 确保用户选择的属性在物品表存在相应的字段属性,若不存在,统一按照默认(不打散)处理。 用户已经创建自定义场景或新建自定义场景过程中。 创建数据源 参考数据源管理进行创建。 配置“在线服务”参数
“否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 DeepFM DeepFM,结合了FM和深度神经网络对于特征表达的学习,同时学习高阶和低阶特
图4 创建离线数据源 数据路径选择完成后单击“立即创建”。 离线数据源创建完成后,在数据源列表页面单击目标数据源名称进行数据质量管理,具体操作请参见推荐系统用户指南>数据源质量管理,完成数据探索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建自定义场景 在R
约束与限制 您能创建的在线服务的数量与配额有关系,具体请参见关于配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
略生成的候选集进行重排序,得到推荐候选集列表。 排序策略-离线排序模型 在线服务 在线服务用来做线上推荐时的应用,每个服务之间是独立的。即根据不同的离线计算得到的候选集以及相关参数,提供不同的推荐服务。 在线服务 效果评估 指用于通过推荐系统推荐出去的结果集并利用trace_id
格。在创建数据源和场景时,需要提供此信息。 数据源 创建数据源 在指定的工作空间下面创建一个新的数据源。 查询数据源列表 查询当前工作空间下的数据源列表。 查询数据源详情 查询指定数据源的详情信息。 修改数据源内容 修改指定数据源的配置内容。 修改数据源特征 修改数据源中的特征。
用于存放经过特征工程处理的宽表,又名通用格式数据。 │ obs-pretrain-data 用于存放排序预处理任务生成的预训练数据。 │ obs-error-data 用于存放异常数据输出路径,来源于近线策略。 │ obs-nearline-data 用于存放近线任务结果数据,宽表形式。
选择提前已经存储在OBS上的如下数据源: 用户属性表 物品属性表 用户操作行为表 如上数据表的数据格式规范请参见离线数据源。 在对应表的“数据源”列中,单击选择数据的OBS存储路径。 在对应表的“数据格式”列中,数据格式可选:csv/json。 当选择数据格式为csv时,在弹框中设置数据参数,具体参数如下:
次或在7天内消费超过3次的物品。 数据源 数据源可选择初始格式或通用格式。 说明: 过滤规则涉及历史行为过滤,则用到用户操作行为表,需要选取目标数据进行过滤。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像
Service,简称OBS)进行数据源以及黑白名单和用户数据的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白
站的视频。 召回策略 召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、 特征过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 特征工程 特征工程常用于对原始数据进行特征挖掘的处理,形成的结果用于排序策略的训练。
计算引擎信息,选择指定服务名、集群名称、任务配置地址、资源名等信息。 数据源 数据源类型有初始格式和通用格式可以选择。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户
获取推荐结果 在线服务创建完成,部署成功后,当服务状态会显示“运行中”,表示服务状态正常。您可以通过在线预测功能测试推荐结果进一步调整作业参数,也可以通过预测接口来调用API,获取推荐结果。 界面预测 登录RES管理控制台,在左侧菜单栏中选择“推荐业务>自定义场景”,进入自定义场景列表页面。
输出流DIS通道名称。该通道用于存放由行为数据和画像库计算生成的排序预处理数据,以供模型训练。通道中的数据属于流式训练作业产生的中间数据,使用者只需指定通道名称,无需往该通道发送或获取数据。 starting_offsets 是 String 读取DIS数据的起始位置,LATEST表示从最新的数据开始读取。 表10
详情信息 资源信息 资源信息包括: 计算引擎:服务名、集群名称、任务配置地址、资源名信息、 存储平台:服务名、集群名称、表名。 数据源:数据表类型、数据源、数据格式。 召回策略信息 该离线作业设置的召回策略详情,召回策略信息包括: 策略别名,策略显示的名称。 OBS地址,推荐业务人员
述作业训练出可用于在线服务的推荐候选集。当在线作业运行完成,您可以通过效果评估检测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作 创建华为云账号 进行服务授权 数据源 准备离线数据 创建离线数据源 上传实时数据 导入近线数据源 数据质量管理 修改或删除数据源 智能场景 创建智能场景
开启时间跨度 不开启取全部数据,开启则指定从数据源中取最近天数或小时数的行为数据计算相似度。 时间单位 开启时间跨度后,支持按照天或者小时为单位从指定从数据源中取行为数据计算相似度。 时间跨度 用于指定从数据源中取最近多少天或者多少小时的行为数据计算热度。默认取全部数据。 开启调度 开启调度,按照指定的调度策略定期执行作业。
DEEPFM,DEEPFM作业 AutoGroup,AutoGroup作业 StreamRank,在线训练作业 DataStruct,识别数据结构作业 DataExploration,数据探索作业 DataImport,离线数据导入作业 Evaluate,效果评估作业 schedule 否 String
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval Integer 更新周期(在线训练任务需要提供此参数)。 optimizer Optimizer object 优化器(在线训练任务需要提供此参数)。 flows Flow object 在线流程(在线训练任务需要提供此参数)。
CloudTable集群需要开启IAM统一身份认证。 (可选)开通数据接入资源DIS 在使用推荐系统之前,数据接入服务(Data Ingestion Service,简称DIS)采集用户实时日志,在计算引擎中消费实时日志并做近线处理。 登录华为云。在华为云“产品”页签,选择“大数据>数据接入服务DIS”,进入DIS产