检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
属性表、用户操作行为表。 全局特征信息文件 用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。
资源名最大长度为10字符,只能由字母,数字,下划线,中划线组成。 Driver内存 Driver内存大于等于512MB。 DLI:默认7GB。 Driver核数 Driver核数,大于等于1。 DLI默认2。 Executor内存 Executor内存大于等于1GB。 DLI:默认8GB。 Executor核数
driver_memory 是 String 驱动内存,大于等于512M(m),或大于等于1G(g)。 driver_cores 是 Integer 驱动核数,大于等于1。 executor_memory 是 String 运行内存,大于等于512M(m),或大于等于1G(g)。 executor_cores
SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。 子账户无法使用SDK上传数据,需要主账号授权子账号DIS USER权限。详细请参考权限管理。 下载SDK之后,需要修改pom文件中的依赖,对SDK进行升级,最新版本可升级至1.3.12。 上传实时数据至RES 初始化DIS客户端,使用代码初始化DIS
最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 目前推荐系统支持的默认在线并发规格为5。由于伸缩资源有一定的时延导致预测接口出现变慢的情况,因此在可预见的并发规格中,建议填写实际并发的规格,推荐系统后台会根据并发规格提前预留好资源,避免峰值的到来。 如果需要更多的规格,请您提工单联系工程师解决。
driver_memory 是 String 驱动内存,大于等于512M(m),或大于等于1G(g)。 driver_cores 是 Integer 驱动核数,大于等于1。 executor_memory 是 String 运行内存,大于等于512M(m),或大于等于1G(g)。 executor_cores
资源,均为必选项。套餐的数量可以根据实际业务按需购买。 计算资源:用于推荐作业的计算规格。涉及计费功能包含:数据源、自定义场景、智能场景中的离线计算和模型训练。 存储资源:用于推荐系统数据存储规格。涉及计费功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。 套餐介绍
成。 driver_memory String 驱动内存,大于等于512M(m),或大于等于1G(g)。 driver_cores Integer 驱动核数,大于等于1。 executor_memory String 运行内存,大于等于512M(m),或大于等于1G(g)。 executor_cores
成。 driver_memory String 驱动内存,大于等于512M(m),或大于等于1G(g)。 driver_cores Integer 驱动核数,大于等于1。 executor_memory String 运行内存,大于等于512M(m),或大于等于1G(g)。 executor_cores
SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。 子账户无法使用SDK上传数据,需要主账号授权子账号DIS USER权限。详细请参考权限管理。 下载SDK之后,需要修改pom文件中的依赖,对SDK进行升级,最新版本可升级至1.3.12。 上传实时数据至RES 初始化DIS客户端,使用代码初始化DIS
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
务别名和UUID。 模型文件路径:排序策略生成的模型存储路径。 “属性权重” 属性权重:输入属性,权重默认1.0 。也可单击“增加属性权重”。 公共配置 “全局特征信息文件” 为json格式文件。指定在去重过滤即属性过滤中物品属性和用户属性的特征信息文件,如物品属性需要“feat
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
“画像数据”:在数据源导入数据成功后,按每小时每百万条画像进行计费,在删除数据源后,将停止计费。 “训练作业”:在创建离线作业和导入实时数据均需要选取训练规格,根据训练规格大小进行计费。 如果需要数据源停止计费,请先终止近线数据源的导入,删除对应数据源和对应OBS中的数据存储。 父主题: 计费相关
core String 资源规格的核数。 cpu String 资源规格CPU内存。 gpu_num Int 资源规格GPU的个数。 gpu_type String 资源规格GPU的类型。 spec_code String 云资源的规格类型。 max_num Int 以选择的最大节点数量。
查询训练规格 功能介绍 查询当前推荐系统所提供的离线计算规格,实时计算规格和排序模型训练规格。在创建数据源和场景时,需要提供此信息。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.0/{project_id}/resource-specs 表1 路径参数
选择数据存储的OBS桶及其文件或文件夹。 如果选取文件夹,该文件夹下面的数据格式需保持一致,避免数据干扰。 物品属性表 从OBS桶中选择数据。在“物品属性表”右侧,单击,从弹出的对话框中,选择数据存储的OBS桶及其文件或文件夹。 如果选取文件夹,该文件夹下面的数据格式需保持一致,避免数据干扰。
查询规格 查询训练规格 父主题: API
List 请参见表3,返回规格列表信息。 表3 specifications参数说明 参数名称 是否必选 参数类型 说明 id 是 String 模型名称。 display_zh 是 String 规格中文名称。 display_en 是 String 规格英文名称。 specification
修改behavior.txt文件 将item.txt中的每条数据的publishTime字段的值修改到当前时间附近,将item.txt中的每条数据的expireTime字段的值修改成大于当前时间的值。 图3 修改item.txt文件 将“test-data”文件夹下的所有文件上传至准备工作中您创建的OBS路径下。