检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据导入 数据导入介绍 数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。
"1.0", "actionDateTime": "1512689700" } 实时用户日志 实时用户日志用于在实时流中对用户画像表进行写入。 表2 用户实时日志字段描述 字段名 类型 描述 是否必选 userId String 全局唯一用户ID。 是 BASICINFO Json
离线数据和近线实时数据如何配合使用? 在推荐系统初始化阶段,需要用户提供批量的离线数据源并按照推荐系统要求的数据格式上传至OBS,完成数据的检测和导入。 近线实时数据源推荐使用RES SDK上传,此操作所有的数据更新都是实时生效的。 父主题: 数据源
否 String DIS通道名称。 starting_offsets 是 String 读取DIS数据的起始位置。 LATEST:从最新的数据开始读取。 EARLIEST:从最旧的数据开始读取。 表12 data_source_config参数说明 参数名称 是否必选 参数类型 说明
在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。如果使用近线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说明,准备相应的数据。 目前数据源只支持JSON格
加到DIS中,推荐系统通过读取该数据进行近线计算。 DIS。 通道名称 数据通道名称,不同类型的数据需要创建不同的通道。 无。 起始位置 读取DIS数据的起始位置,latest表示从最新的数据开始读取,earliest表示从通道中现存最旧的数据开始读取。 默认为latest。 行为类型
新建多个训练作业 功能介绍 批量新建作业。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/job-instances
将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。
该接口用于删除场景,删除之后不能恢复,请您谨慎操作。 训练作业 新建训练作业 新建训练作业元数据,新建成功之后可手动执行此任务。 新建多个训练作业 批量新建作业。 查询训练作业 查询resource_id(数据源id或场景id)下的指定类型的作业。 修改训练作业参数 修改指定作业的元数据信息。
computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 读取配置源路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型 说明 cluster_name 是 String
画像表中定义的带权重的标签,Context为上下文属性。该文件用于说明数据字段信息,以便推荐系统识别用户离线数据,通过特征工程将对应的数据写入到画像中,同时用于排序训练和线上推理服务中使用。 文件数据信息请参见全局特征信息文件数据格式。 当上传的数据中的特征有变化时,用户需要同步
xxxx/resources/testuuidxxxxxxxxxxxxxxxxxxxxxxxx/service-instance { "category" : "SERVICE", "job_type" : "infer", "job_config" : {
输入流DIS通道名称。该通道用于接收近线行为数据。 starting_offsets 是 String 读取DIS数据的起始位置。 LATEST:从最新的数据开始读取。 EARLIEST:从最旧的数据开始读取。 表9 out_stream_conf 参数说明 参数名称 是否必选 参数类型 说明 stream_name
选择“资源中心”绑定的DLI集群名称。 任务配置地址 在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名 指定DLI运行作业的资源规格。 可选择“全局配置”添加的计算资源或默认值。 存储平台 服务名称 Clo
xxxxxx/service-instance/testuuidxxxxxxxxxxxxxxxxxxxxxxxx { "job_name" : "res-test-service2", "description" : "inference service", "category"
xxxxxxxxx/resources/testuuidxxxxxxxxxxxxxxxxxxxxxxxx/service-instance?category=SERVICE - 响应示例 状态码: 200 OK { "jobs" : [ { "workspace_id"
集群名称,选择“资源中心”绑定的DLI集群名称。 任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。
computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 读取配置源路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型 说明 cluster_name 是 String
作与API相对应,授权项列表说明如下: 权限:允许或拒绝某项操作。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 对应API接口:自定义策略实际调用的API接口。 授权范围:自定义策略的授权范围,包括IAM项目与
请求格式正确,但是由于含有语义错误,无法响应。 429 TooManyRequests 表明请求超出了客户端访问频率的限制或者服务端接收到多于它能处理的请求。建议客户端读取相应的Retry-After首部,然后等待该首部指出的时间后再重试。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。