computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 所选配置生成的文件在OBS上的存储路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型 说明 cluster_name 是 String
computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 所选配置生成的文件在OBS上的存储路径。 表4 platform_parameter 参数说明 参数名称 是否必选 参数类型 说明 cluster_name 是 String
数据源如何收费? 数据源的收费包括三项。 “OBS存储”:将离线数据源上传至OBS进行存储,根据存储空间大小进行计费。详见OBS计费详情。 “画像数据”:在数据源导入数据成功后,按每小时每百万条画像进行计费,在删除数据源后,将停止计费。 “训练作业”:在创建离线作业和导入实时数据
会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名 指定DLI运行作业的资源规格。 可选择“全局配置”添加的计算资源或默认值。 存储平台 服务名称 CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。此处选择
算节点规格获取spec_id返回的值。 run_path 是 String 训练结果保存根路径,训练完成后,会将模型和日志文件保存在该路径下。不包含中文的文件夹。 training_data_path 是 String 训练数据的OBS路径。 test_data_path 是 String
用户在使用RES时需要先创建并绑定计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关资源。 背景信息 使用RES需要消耗其他服务资源,需要收费。根据您选择的资源不同,收费标准不同,针对不同类型资源的价格,详情请参见产品价格详情。 已开通计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关服务。
如何上传数据至OBS 使用RES进行推荐时,您需要将数据上传至对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,然后再进行数据的上传。创建OBS桶和上传文件夹的操作指导请参见创建桶和上传对象。 您在创建OBS桶时,需保证您的OBS桶与RES在同一个区域。
上传离线数据源至OBS RES使用对象存储服务(Object Storage Service,简称OBS)进行数据源的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户
使用用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云
式在OBS上存储。 操作步骤 登录OBS管理控制台,创建OBS桶。例如,创建名称为“obs-res”的OBS桶。 创建桶的区域需要与RES所在的区域一致。例如:当前RES在华北-北京一区域,在对象存储服务创建桶时,请选择华北-北京一。 通过OBS创建用于存放数据的文件夹 推荐的O
RES服务根据用户使用的不同资源分别进行收费。 计费支持区域:华北-北京四。 由于RES使用的离线数据需存储在OBS中,数据存储产生的费用,请参见《OBS价格说明》。 表1 推荐系统计费项说明 计费项 说明 存储资源 应用于物品画像和用户画像的存储计费,对用户和物品的总条目数统计进行收费。 每个数据源默认规格最低是
统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。 结果保存路径 效果评估结果在OBS的文件输出路径。 指标 推荐服务效果评估指标,通过指标后的下拉框选择系统自置指标或自定义指标。您可以单击添加指标,单击该指标后的删除指标。 点击PV
h 是 String 该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,文件路径为用户在排序数据预处理中输入的结果保存路径参数表示的路径的“fields_feature_size”目录下,文件名称为“part-00000”,需要用户提供文件完整路径。 max_iterations
对话框中,选择数据存储的OBS桶及其文件或文件夹。 如果选取文件夹,该文件夹下面的数据格式需保持一致,避免数据干扰。 物品属性表 从OBS桶中选择数据。在“物品属性表”右侧,单击,从弹出的对话框中,选择数据存储的OBS桶及其文件或文件夹。 如果选取文件夹,该文件夹下面的数据格式需保持一致,避免数据干扰。
选择功能,该功能指定为"keywords"。 响应消息 响应参数请参见表2。 表2 响应参数说明 参数名称 是否必选 参数类型 说明 result 是 String 一个由抽取出来的无序的关键词集合生成的字符串,以空格连接。 示例 请求示例 { "mode":"keywords", "title":[
全局特征信息文件 开启扩展功能时,此配置项生效。其中“数据源类型”您可以选择“用户特征”或者“物品特征”进行设置。 全局特征信息文件:单击选择该文件的OBS存储路径,当涉及更新时,单击更新全局特征信息文件,并重新设置依赖此文件的配置项。 用户特征:从下拉选项中勾选全局特征信息文件中提取的用户特征用于进行分组推荐。
所有输出数据(用户物品特征、特征映射、域特征值数目统计结果、训练集、测试集)的存储都路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 高
"GENERAL_FORMAT", "data_format": "json", "data_source_url": "<数据源存储路径>" }, "online_services": [ "res-test1", "res-test2"
通过DLF重新执行作业 推荐系统提供了重新执行作业的API,用来将任务以相同的配置重新执行一次,实现对离线任务生成结果的更新。以固定的周期定时调用此API,可保持结果处于一个较新的状态,以获得更好的推荐结果。 以上功能,我们也可以使用数据治理中心 DataArts Studio,
该作业的详情。 表1 组合作业详情 参数名称 详情信息 资源信息 资源信息包括: 计算引擎:服务名、集群名称、任务配置地址、资源名信息、 存储平台:服务名、集群名称、表名。 数据源:数据表类型、数据源、数据格式。 召回策略信息 该离线作业设置的召回策略详情,召回策略信息包括: 策略别名,策略显示的名称。