搜索_华为云

训练数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。微调数据集预处理参数说明微

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
创建新版Notebook无法使用已购买的专属资源池，如何解决？ - AI开发平台ModelArts

otebook。解决方法请到专属资源池页面初始化开发环境。进入“专属资源池”页面，单击目标资源池“操作”列的“更多 > 设置作业类型”。在“设置作业类型”页面，勾选“开发环境”，单击“确定”。此时“开发环境”的状态为“环境初始化中”，等到状态为“已启用”，即可使用新购买的专属资源池。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

Studio”，您可以按需修改。提供商类型配置为“OpenAI”。添加API密钥和API地址。在Cherry Studio客户端左下角，单击设置图标。在“设置”页面，找到“华为云ModelArts Studio”选项，配置API密钥和API地址。图5 添加API密钥和API地址参数说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理
创建诊断任务 - AI开发平台ModelArts

Data项中输入性能数据所在的Notebook本地或OBS路径，单击Submit按钮。界面参考下图。图6 对比两份性能数据性能诊断插件支持设置高级参数，当前支持的高级参数列表如下表所示。表1 高级参数介绍序号键默认值是否必填说明 1 cann_version 8.0.RC1

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
上传OBS文件到JupyterLab - AI开发平台ModelArts

上传OBS文件异常处理提示文件上传失败，有以下三种常见场景。异常场景1 图5 文件上传失败可能原因： OBS路径没有设置为具体的文件路径，设置成了文件夹。 OBS中的文件设置了加密。请前往OBS控制台查看，确保该文件未加密。 OBS桶和Notebook不在同一个区域。请确保读取的OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
使用CTS审计ModelArts服务 - AI开发平台ModelArts

使用CTS审计ModelArts服务 ModelArts支持云审计的关键操作查看ModelArts相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
推理服务性能评测 - AI开发平台ModelArts

推理服务性能评测语言模型推理性能测试多模态模型推理性能测试父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
扩缩容Standard专属资源池 - AI开发平台ModelArts

用户增加实例数量时，可以通过指定节点计费模式，为资源池新创建的节点设置不同于资源池的计费模式，例如用户可以在包周期的资源池中创建按需的节点。如果用户不指定该参数，创建的节点计费模式和资源池保持一致。在“专属资源池扩缩容”页面，设置“资源配置 > 可用区”，可用区可选择随机分配和指定AZ。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

vsix文件拖动到远端Notebook中。右键单击该文件，选择Install Extension VSIX。方法二：设置远端默认安装的插件按照在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？配置，即会在连接远端时自动安装，减少等待时间。方法三：VS Code官网排查方式https://code

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

查看运行日志也可以单击本地IDE右上角的Run/Debug Configuration按钮来设置运行参数。图11 设置运行参数（1）选择远程连接到云上开发环境实例对应的Python解释器。图12 设置运行参数（2）当需要调试代码时，可以直接打断点，然后使用debug方式运行程序。图13

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
添加资源标签 - AI开发平台ModelArts

error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例为指定服务添加标签。设置TMS标签的key为“test”和“model_version”，TMS标签的value为“service-gpu”和“0.1”。 htt

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

ModelArts在线服务和边缘服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。边缘服务云端服务是集中化的离终端设备较远，对于实时性要求高的计算需求，把计算放在云上会引起网络延时变长、网络拥塞、服务质量下降等问题。而终端

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
执行训练任务（推荐） - AI开发平台ModelArts

processed_data_dir /home/ma-user/ws/xxx 已处理好数据路径目录，如有处理完成数据可设置此参数权重文件、输出目录及其他重要参数设置,详解如下：参数示例值参数说明 model_name_or_path /home/ma-user/ws/llm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
创建在线服务包 - AI开发平台ModelArts

创建在线服务包功能介绍计费工作流购买资源。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workfl

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

发布数据集（ModelArts）表1 参数说明（ModelArts）参数说明资产标题在AI Gallery显示的资产名称，建议按照您的目的设置。来源选择“ModelArts”。单个数据集最多支持20000个文件，总大小不超过30G。 ModelArts区域选择数据集所在的区域，以控制台实际可选值为准。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

路径。 Data OBS Path 设置为存储训练数据的OBS路径，例如“/test-modelarts2/mnist/dataset-mnist/”，其中“test-modelarts2”为桶名称。 Training OBS Path 设置OBS路径，该路径下会自动创建用于存放训练输出模型和训练日志的目录。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业

总条数： 1950

上一页
1
...
28
29
30
...
98
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练数据集预处理说明 - AI开发平台ModelArts

创建新版Notebook无法使用已购买的专属资源池，如何解决？ - AI开发平台ModelArts

基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

上传OBS文件到JupyterLab - AI开发平台ModelArts

使用CTS审计ModelArts服务 - AI开发平台ModelArts

推理服务性能评测 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

ModelArts在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

创建在线服务包 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线