检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建跨源连接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。 前提条件 已开通计算引擎DLI服务,创建集群并完成资源绑定。 创建跨源链接 DLI集群绑定完成后,创建跨源链接。步骤如下: 登录RES管理控制台,在“
是否需要重新执行任务。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下: 登录数据治理中心 DataArts Studio管理控制台,在控制台的左侧导航栏,选择“数据开发 > 作业开发”。 在“工作区”页面的右侧,单击“新建作业”。
“否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 DeepFM DeepFM,结合了FM和深度神经网络对于特征表达的学习,同时学习高阶和低阶特
什么是区域、可用区? 什么是区域、可用区? 使用用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region
概述 欢迎使用推荐系统(Recommender System,简称RES) 。基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。 您可以使用本文档提供推荐系统服务API的描述、语法、参数说明及样例等
次或在7天内消费超过3次的物品。 数据源 数据源可选择初始格式或通用格式。 说明: 过滤规则涉及历史行为过滤,则用到用户操作行为表,需要选取目标数据进行过滤。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像
“全局特征信息文件”:根据全局特征信息文件规范准备并上传的全局特征信息文件路径。 “通用格式数据”:经过特征工程处理的宽表路径。 “用户属性表”:离线数据用户属性表的OBS路径。 “物品属性表”:离线数据物品属性表的OBS路径。 “用户操作行为表”:离线数据用户操作行为表的OBS路径。 图1 属性配置 删除场景 登
参考准备离线数据源中的物品表字段介绍,status置为0,代表该物品可被推荐。status置为1,代表该物品不可推荐,代替商品下架或者无货状态。此字段不为空时,在最终的推荐列表中,系统会对该字段进行过滤处理,若此字段为空,则按照默认(status不生效)处理。 表1 物品数据中status字段描述
作”列的“删除”。 在“删除场景”页面确认自定义场景信息后单击“确定”。 删除场景包含删除场景下所有的策略和服务。场景运行存储在OBS中的数据不会被删除,需要您登录OBS进行删除操作。 父主题: 自定义场景
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求
自定义场景”,进入“自定义场景”列表页面。 在自定义场景列表中,单击目标场景名称进入“自定义场景详情”页。 在基本信息页签下单击,在弹出页面修改“数据区间”和“场景规格”等信息。 参考基本信息修改自定义场景基本信息,然后单击“确认”完成修改。 新增作业配置 登录RES管理控制台,在左侧菜单栏中选择“推荐业务
load_widetable Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
图4 创建离线数据源 数据路径选择完成后单击“立即创建”。 离线数据源创建完成后,在数据源列表页面单击目标数据源名称进行数据质量管理,具体操作请参见推荐系统用户指南>数据源质量管理,完成数据探索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建自定义场景 在R
格。在创建数据源和场景时,需要提供此信息。 数据源 创建数据源 在指定的工作空间下面创建一个新的数据源。 查询数据源列表 查询当前工作空间下的数据源列表。 查询数据源详情 查询指定数据源的详情信息。 修改数据源内容 修改指定数据源的配置内容。 修改数据源特征 修改数据源中的特征。
训练集测试集划分方式 数据划分方式按时间比例或个数比例划分训练集测试集。 “时间比例”:将全部数据的时间跨度按照时间比例划分成两段数据,训练数据为前一段时间中的数据,测试数据为后一段时间的数据,取值TIME。 “个数比例”:个数比例是将全部数据按个数比例随机划分成训练集和测试集传入值。取值RAMDOM。
相关服务 交互功能 数据湖探索 数据湖探索(Data Lake Insight,简称DLI)用于推荐系统的离线计算和近线计算。DLI的更多信息请参见《数据湖探索文档》。 对象存储服务 对象存储服务(Object Storage Service,简称OBS)存储RES的推荐数据源,实现安全
Boolean 请求是否成功。 specs List 计算资源规格列表,表3。 error_code String 请求失败时的错误码,请求成功时无此字段。 error_msg String 请求失败时的错误信息,请求成功时无此字段。 表3 specs参数说明 参数名称 参数类型 说明
相关服务 交互功能 数据湖探索 数据湖探索(Data Lake Insight,简称DLI)用于推荐系统的离线计算和近线计算。DLI的更多信息请参见《数据湖探索文档》。 对象存储服务 对象存储服务(Object Storage Service,简称OBS)存储RES的推荐数据源,实现安全
用户操作行为表USER_BEHAVIOR 通用格式GENERAL_FORMAT 数据格式请参见推荐系统离线数据源。 data_source_url 是 String 数据源路径,最大长度1000字符。 data_format 是 String 数据格式,可选值:csv、parquet、json、orc。
计算引擎信息,选择指定服务名、集群名称、任务配置地址、资源名等信息。 数据源 数据源类型有初始格式和通用格式可以选择。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户