搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

--workers：设置数据处理时，要执行的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以 llama2-13b 为例，输出数据路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
管理训练容器环境变量 - AI开发平台ModelArts

任务卡死。取值范围：10~720 单位：分钟默认值：30 “30” 如何查看训练环境变量在创建训练作业时，“启动命令”输入为“env”，其他参数保持不变。当训练作业执行完成后，在训练作业详情页面中查看“日志”。日志中即为所有的环境变量信息。图1 查看日志父主题：管理模型训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
Standard数据管理 - AI开发平台ModelArts

为什么在ModelArts数据标注平台标注数据提示标注保存失败？标注多个标签，是否可针对一个标签进行识别？使用数据处理的数据扩增功能后，新增图片没有自动标注视频数据集无法显示和播放视频使用样例的有标签的数据或者自己通过其他方式打好标签的数据放到OBS桶里，在model

帮助中心 > AI开发平台ModelArts > 常见问题
Yaml配置文件参数配置说明 - AI开发平台ModelArts

、lora】如果设置为"full"，则对整个模型进行微调。这意味着在微调过程中，除了输出层外，模型的所有参数都将被调整以适应新的任务。 dataset identity,alpaca_en_demo 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

S官方文档。处理方法检查OBS路径及内容格式是否正常。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

x) 关闭数据预处理开关，可能会影响性能。 NPURunConfig(enable_data_pre_proc=false) 建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

environ['PS_VERBOSE'] = '2'”为打印所有的通信信息。“os.environ['PS_RESEND'] = '1'”为在“PS_RESEND_TIMEOUT”毫秒后没有收到ACK消息，Van实例会重发消息。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
策略及授权项说明 - AI开发平台ModelArts

权项列表说明如下：权限：允许或拒绝某项操作。对应API接口：自定义策略实际调用的API接口。授权项：自定义策略中支持的Action，在自定义策略中的Action中写入授权项，可以实现授权项对应的权限功能。依赖的授权项：部分Action存在对其他Action的依赖，需要将依

 帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

单击进入Python插件的Version History页签后，下载该插件的离线安装包，如图所示。图1 Python插件离线安装包在本地VS Code环境中，将下载好的.vsix文件拖动到远端Notebook中。右键单击该文件，选择Install Extension VSIX。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
Yaml配置文件参数配置说明 - AI开发平台ModelArts

disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。 include_tokens_per_second

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

他用户obs下的数据时，需要用户委托权限，没有创建委托，就没有权限使用其他用户obs中的数据。登录ModelArts控制台，管理控制台，在左侧导航栏中选择“权限管理”，单击“查看权限”，检查是否配置了obs的委托权限。图1 查看权限如果检查后已经存在委托，但是仍然无法访问，可以提工单寻求技术支持。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

INFO级别的日志信息。环境变量的设置一定要在import tensorflow或者import moxing之前。处理方法您需要通过在代码中设置环境变量“TF_CPP_MIN_LOG_LEVEL”来屏蔽INFO级别的日志信息。具体操作如下： import os os.en

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

镜像下线后是否可以继续基于该镜像新建实例？镜像下线后无法使用该镜像新建实例，界面不会呈现了。镜像下线后用户还想继续使用，怎么办？如果想长期使用该镜像，建议用户在镜像下线前保存自定义镜像使用，镜像下线后不会影响自定义镜像使用。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──llm_inference # 推理代码包 |──llm_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
AIGC工具tailor使用指导 - AI开发平台ModelArts

运行结果将存储在output文件夹中，如果用户指定了output_path，会指定位置保存，如果不指定则在当前代码执行目录生成文件夹保存输出。整体运行的结果都存放在output文件夹中，每转一次模型就会根据模型名称以及相关参数生成结果文件，如下图所示。图3 output文件在每次运行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
训练的权重转换说明 - AI开发平台ModelArts

权重转换完成之后保存路径。 --tokenizer-model : tokenizer路径。输出转换后权重文件保存路径：权重转换完成后，在/home/ma-user/work/llm_train/processed_for_ma_input/llama2-13b/convert

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
PyCharm ToolKit工具中Edit Credential时，出现错误 - AI开发平台ModelArts

错误示例：Endpoint参数前面带了https，正确的配置中不需要有https。图1 配置ToolKit 二、未配置hosts文件或者hosts文件信息配置不正确在本地PC的hosts文件中配置域名和IP地址的对应关系。三、网络代理设置如果用户使用的网络有代理设置要求，请检查代理配置是否正确。也可以使用手机热点网络连接进行测试排查。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用

总条数： 1889

上一页
1
...
89
90
91
...
95
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

策略及授权项说明 - AI开发平台ModelArts

安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

PyCharm ToolKit工具中Edit Credential时，出现错误 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线