检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
系统会自动填入该值,格式为Email序号,序号从“0”开始,表示同类型图元序号。 名称 设置图元的名称,名称为图元在服务编排中的标识,请确保在当前服务编排中唯一。命名要求如下: 长度范围为1~80个字符。 必须以英文字母开头,由英文字母,数字和单下划线组成,且不能以下划线结尾。
最小长度:1 最大长度:40960 Content-Type 是 String 指定类型为application/json。
最小长度:1 最大长度:40960 Content-Type 是 String 指定类型为application/json。
管理中心-创建执行器(机器人) 新建执行器:单击新建执行器,选择类型,可以选择有人值守或无人值守;名称自定义;保存即创建成功 图1 图示1 图2 图示2 图3 新建执行器 这里就多了个一个执行器 图4 新建执行器 点击更多导出配置;将导出的配置文件放到执行器的机器上 图5 导出配置
产品交付前准备 IP地址准备 系统镜像的准备 Windows操作系统的版本及序列号 配件的准备 设备标配是不含万兆模块的,用户如果需要,请自行准备 父主题: 3.1产品使用前准备
大量数据文件,训练过程中读取数据效率低? 当数据集存在较多数据文件(即海量小文件),数据存储在OBS中,训练过程需反复从OBS中读取文件,导致训练过程一直在等待文件读取,效率低。 解决方法 建议将海量小文件,在本地压缩打包。例如打包成.zip格式。 将此压缩后的文件上传至OBS。
调用API提交训练作业后,能否绘制作业的资源占用率曲线? 调用API提交训练作业后,您可登录ModelArts控制台,在“模型训练 > 训练作业”中,单击“名称/ID”进入“训练作业详情”页面的“资源占用情况”模块,查看作业的资源占用率曲线。 父主题: API/SDK
信息模板实名认证填写规范 根据《中国互联网络域名管理办法》第二十八条规定: 域名注册申请者应当提交真实、准确、完整的域名注册信息,并与域名注册服务机构签订用户注册协议。域名注册完成后,域名注册申请者即成为其注册域名的持有者。 因此,在对信息模板进行实名认证时,必须遵循真实、准确、完整的原则
从DLI导入数据到ModelArts数据集 表格数据集支持从DLI导入数据。 从DLI导入数据,用户需要选择DLI队列、数据库和表名称。所选择的表的schema(列名和类型)需与数据集一致,支持自动获取所选择表的schema。DLI的详细功能说明,请参考DLI用户指南。 图1 DLI
从MRS导入数据到ModelArts数据集 ModelArts支持从MRS服务中导入存储在HDFS上的csv格式的数据,首先需要选择已有的MRS集群,并从HDFS文件列表选择文件名称或所在目录,导入文件的列数需与数据集schema一致。MRS的详细功能说明,请参考MRS用户指南。
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导(6.3.910) 场景介绍 准备工作 执行预训练任务 执行SFT全参微调训练任务 执行LoRA微调训练任务 查看日志和性能 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导(6.3.910) 场景介绍 准备工作 执行训练任务 查看日志和性能 训练benchmark工具 训练脚本说明 附录:训练常见问题 父主题: LLM大语言模型训练推理
下单后服务多久可以完成? 项目服务周期为客户合同签订后,支付服务订单日开始,以项目验收日期为截止日期。 父主题: 关于服务交付
准备工作 准备环境 准备代码 准备数据 准备镜像 父主题: 主流开源大模型基于DevServer适配PyTorch NPU训练指导(6.3.906)
训练脚本说明 训练启动脚本说明和参数配置 训练的数据集预处理说明 训练中的权重转换说明 训练tokenizer文件说明 父主题: 主流开源大模型基于DevServer适配PyTorch NPU训练指导(6.3.906)
主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导(6.3.907) 场景介绍 准备工作 指令监督微调训练任务 查看日志和性能 训练脚本说明 附录:指令微调训练常见问题 父主题: LLM大语言模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导(6.3.908) 场景介绍 准备工作 执行预训练任务 执行SFT全参微调训练任务 执行LoRA微调训练任务 查看日志和性能 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导(6.3.909) 场景介绍 准备工作 执行预训练任务 执行SFT全参微调训练任务 执行LoRA微调训练任务 查看日志和性能 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
查看“Key”值,并重新配置appkey。
建议搭配使用 弹性负载均衡ELB + 应用性能管理APM + 应用运维管理AOM 图1 微服务治理场景 父主题: 应用场景