检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开发者认证课程学习的形式是什么样的? 开发者认证课程学习分为在线视频学习和在线实验操作。 父主题: 开发者认证课程学习常见问题
仿真器 进入、占用、释放仿真器 Octopus平台在线仿真模块为用户提供了在线仿真器。单击进入在线仿真器,用户进入机器后,机器显示红色按钮占用,用户退出在线仿真界面不会自动释放机器,会保持占用状态。机器图片的左上角会出现释放按钮,只有占用中的用户可以释放。 图1 仿真器 加载场景
训练算法 添加自定义算法 添加自定义算法流程为“初始化训练算法 > 选择训练算法文件 > 上传训练算法文件”。具体操作步骤如下: 在左侧菜单栏中单击“训练服务 > 算法管理”。 单击“新建训练算法”,填写算法基本信息。 图1 新建训练算法 名称:包含中英文、数字、“_”“-”,不得超过64个字符。
训练管理 创建算法 查询算法列表 查询算法详情 更新算法 删除算法 获取支持的超参搜索算法 创建训练实验 创建训练作业 查询训练作业详情 更新训练作业描述 删除训练作业 终止训练作业 查询训练作业指定任务的日志(预览) 查询训练作业指定任务的日志(OBS链接) 查询训练作业指定任务的运行指标
GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等,与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN
使用模型训练服务快速训练算法模型 本文档以硬盘故障检测的模型训练为例,介绍模型训练服务使用的全流程,包括数据集、特征工程、模型训练、模型管理和模型验证,使开发者快速熟悉模型训练服务。 操作流程 前提条件 订购模型训练服务 访问模型训练服务 创建项目 数据集 特征工程 模型训练 模型管理
训练服务 训练服务简介 算法管理 训练任务 模型评测 编译管理 推理服务
nizer文件,具体请参见训练tokenizer文件说明。 Step3 启动训练脚本 请根据Step2 修改训练超参配置修改超参值后,再启动训练脚本。Llama2-70B建议为8机64卡训练。 多机启动 以 Llama2-70B 为例,多台机器执行训练启动命令如下。多机启动需要在每个节点上执行。
LoRA微调训练 步骤1 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
GBS 128 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等,与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN
为什么“对话体验”为兜底,调用API时为闲聊 问题现象 在控制台,使用“对话体验”功能时,机器人的回复属于“兜底”。调用/v1/{project_id}/qabots/{qabot_id}/chat接口,同样的问题,机器人回复为“闲聊”。 原因 调用API时,请求参数chat_enable可以控
训练作业性能降低 问题现象 使用ModelArts平台训练算法训练耗时增加。 原因分析 可能存在如下原因: 平台上的代码经过修改优化、训练参数有过变更。 训练的GPU硬件工作出现异常。 处理方法 请您对作业代码进行排查分析,确认是否对训练代码和参数进行过修改。 检查资源分配情况(
下|一下][北京|上海]的天气*。 答案标签:主要是针对多答案问题时,可对答案设置标签,使不同用户可以看到不同的答案。 父主题: 智能问答机器人
自动学习生成的模型,存储在哪里?支持哪些其他操作? 模型统一管理 针对自动学习项目,当模型训练完成后,其生成的模型,将自动进入“模型管理”页面,如下图所示。模型名称由系统自动命名,前缀与自动学习项目的名称一致,方便辨识。 自动学习生成的模型,不支持下载使用。 图1 自动学习生成的模型
训练性能测试 流程图 训练性能测试流程图如下图所示: 图1 训练性能测试流程 执行训练任务 进入test-benchmark目录执行训练命令,可以多次执行,卡数及其它配置参考NPU卡数取值表按自己实际情况决定。 单机<可选>: # 默认8卡 benchmark-cli train
管理变量 添加全局变量 选择“配置中心>机器人管理>流程配置”,进入流程配置界面。 选择“资源管理 > 变量管理”,在新打开的页面单击“”。 如图所示填写“变量名称”,设置变量的“数据类型”, 选择“加密类型”,单击“确定”。 如果您要求的变量包含个人数据,例如客户的身份证号等信
String[] 4096 Chatbot返回的应答信息,字符串数组,可以有多个。 confidence True float 4 置信度 机器人回复的可靠度,取值范围0~1,最小值是0,最大值是1,例如基于你的一个问题1,有10个回答,其中6个回答是相同的Answer1,那么Answer1的置信度是0
准备模型训练镜像 ModelArts平台提供了Tensorflow,PyTorch,MindSpore等常用深度学习任务的基础镜像,镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时,您还可以基于这些基础镜像制作一个新的镜像并进行训练。 训练作业的预置框架介绍
填写用户基本信息,单击“下一步”。 在“加入用户组”页面勾选已创建的用户组名称。 图3 加入用户组 单击“立即创建”,用户创建完成。 父主题: 智能问答机器人
用户可通过流程检查,查看复合图元、业务接口、存储过程、灰度规则、资源模板、全局变量、流程变量在所有流程的使用情况。 操作步骤 选择“配置中心 >机器人管理>流程配置 ”,进入流程配置管理页面。 选择“流程管理 > > > 流程检查”,点击“”按钮,获取最新的统计数据。 图1 流程检查