检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据格式规范 推荐系统OBS文件夹规范 离线数据源 实时日志 全局特征信息文件 父主题: 用户指南(旧版)
如何上传数据至OBS 如何上传实时数据? 离线数据和近线实时数据如何配合使用? 数据探索是什么?近线实时数据如何在数据探索中的报告体现? 如何确定近线数据源导入实时数据成功? 实时数据能否立即应用到推荐场景?
属性表、用户操作行为表。 全局特征信息文件 用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。
填写该密钥的描述说明,单击“确定”。根据提示单击“立即下载”,下载密钥。 图4 新增访问密钥 密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件,即可查看访问密钥(Access Key Id和Secret Access Key)。 父主题:
注册华为帐号并开通华为云 在使用华为云服务之前您需要申请华为云帐号。通过此账号,您可以使用所有华为云服务,并且只需为您所使用的服务付费。 操作步骤 进入华为云首页,单击页面右上角的“注册”。 设置手机号、短信验证码、账号名、密码并勾选“我已阅读并同意《华为云用户协议》和《隐私政策声明》”,单击“同意协议并注册”。
各标签体系下,兴趣标签的最大长度。 20 全局特征信息文件 用户在使用近线策略之前,需要提供全局特征信息文件,该文件为JSON格式,包含特征名、特征大类、特征值类型。当上传的数据中的特征有变化时,需要同步更新该文件。全局特征信息文件示例请参考全局特征信息文件。 - 异常数据输出路径 单击右侧的按
值数目统计结果、训练集、测试集)的存储都路径,文件夹。 全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。 高级设置(writer_parameters)
声明》”,单击“同意协议并注册”。 页面提示注册成功后,使用注册的用户,登录华为云。 父主题: 准备工作
请求参数说明 参数名称 是否必选 参数类型 说明 global_features_information_path 是 String 全局特征文件OBS路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。
请求参数说明 参数名称 是否必选 参数类型 说明 global_features_information_path 是 String 全局特征文件OBS路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。
所需的行为参数、模型文件路径、数据预处理信息等参数会从指定的在线服务的在线流程中获取。 online_training_config 是 JSON 请参见表12,平台参数。 bad_record_log 否 String 异常数据记录日志路径。路径填写到文件夹。 表12 online_training_config
算节点规格获取spec_id返回的值。 run_path 是 String 训练结果保存根路径,训练完成后,会将模型和日志文件保存在该路径下。不包含中文的文件夹。 training_data_path 是 String 训练数据的OBS路径。 test_data_path 是 String
集群名称,选择“资源中心”绑定的DLI集群名称。 任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储
测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作 创建华为云账号 进行服务授权 数据源 准备离线数据 创建离线数据源 上传实时数据 导入近线数据源 数据质量管理 修改或删除数据源 智能场景 创建智能场景 发布或终止智能场景 获取推荐结果 自定义场景 创建自定义场景 修改自定义场景
computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 所选配置生成的文件在OBS上的存储路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型 说明 cluster_name 是
computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 所选配置生成的文件在OBS上的存储路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型 说明 cluster_name 是
Error UserPair为空 请检查请求内容是否跟文档要求相符。 400 RES.1020 Basic Error 加载配置文件失败 请重新加载配置文件。 400 RES.1024 Basic Error 禁止操作作业({0}) 请检查作业信息是否正确。 400 RES.1025
闻网站,category取值可能为娱乐、体育、时事等。 设置黑名单 设置黑名单列表。后续任务读取数据时,将会过滤掉指定的用户或物品的记录。文件格式为每个ID占据一行。 用户黑名单/物品黑名单 上传设置的黑名单列表。 场景规格 离线计算规格 可选择“4CU”、“8CU”、“16CU
batch模式计算速度快于full模式。 重新训练 对第一次训练无影响,仅影响任务重跑。 “是”:清空上一轮的模型结果后重新开始训练。 “否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依
"envs": { "ONLINE_CONFIG": "<在线配置文件存储路径>" } } } ]