搜索_华为云

分页查询智能任务列表 - AI开发平台ModelArts

根据样本所在目录搜索（目录需要以/结尾），只搜索指定目录下的样本，不支持目录递归搜索。 sample_name String 根据样本名称搜索（含后缀名）。 sample_time String 样本加入到数据集时，会根据样本在OBS上的最后修改时间(精确到天)建立索引，此处可以根据此时间进行搜索。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

练迭代的时长。 TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

GBS 128 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 CP 1 表示context并行，默认为1。应用于训练长序列文本的模型。若训练时SEQ_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

练迭代的时长。 TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

dli-job get-log命令查询DLI Spark运行日志执行ma-cli dli-job get-log命令查询DLI Spark作业后台的日志。 $ ma-cli dli-job get-log -h Usage: ma-cli dli-job get-log [OPTIONS]

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
终止训练作业 - AI开发平台ModelArts

String 内存单元数。表50 Disk 参数参数类型描述 size String 磁盘大小。 unit String 磁盘大小单位，一般为GB。表51 JobVolume 参数参数类型描述 nfs Nfs object nfs方式的挂载卷。表52 Nfs 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

String 内存单元数。表49 Disk 参数参数类型描述 size String 磁盘大小。 unit String 磁盘大小单位，一般为GB。表50 JobVolume 参数参数类型描述 nfs Nfs object nfs方式的挂载卷。表51 Nfs 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

Content-Type→text/plain 其中，加粗的斜体字段需要根据实际值填写: “task_id”为训练作业的任务名称，一般使用work-0。 Content-Type可以设置成不同方式。text/plain，返回OBS临时预览链接。application/oc

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

至model目录，AI引擎选择Custom，引擎包选择步骤3构建的镜像。图3 创建模型将创建的模型部署为在线服务，大模型加载启动的时间一般大于普通的模型创建的服务，请配置合理的“部署超时时间”，避免尚未启动完成被认为超时而导致部署失败。图4 部署为在线服务调用在线服务进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
非分离部署推理服务 - AI开发平台ModelArts

he索引，如果不使用该功能，则无需配置。注意：如果使用投机推理功能，必须开启此参数。 --served-model-name：vllm服务后台id。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

he索引，如果不使用该功能，则无需配置。注意：如果使用投机推理功能，必须开启此参数。 --served-model-name：vllm服务后台id。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
新建Workflow工作流 - AI开发平台ModelArts

数字、空格、下划线（_）和中划线（-），并且以中英文开头。 workflow_id String Workflow工作流ID。创建工作流时后台自动生成。 created_at String Workflow工作流的创建时间。 description String Workflow工作流的描述信息。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询训练作业列表 - AI开发平台ModelArts

String 内存单元数。表52 Disk 参数参数类型描述 size String 磁盘大小。 unit String 磁盘大小单位，一般为GB。表53 JobVolume 参数参数类型描述 nfs Nfs object nfs方式的挂载卷。表54 Nfs 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Notebook专属预置镜像列表 - AI开发平台ModelArts

是否使用昇腾（CANN版本） URL 包含的依赖项 Tensorflow 1.15 是（CANN 5.1） swr.{region-id}.{局点域名}/atelier/ tensorflow_1_15_ascend:tensorflow_1.15-cann_5.1.0-py_3.7-euler_2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

e-model ${container_draft_model_path}同时使用。 --served-model-name：vllm服务后台id。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

创建分布式并行模型，每个进程都会有相同的模型和参数。创建数据分发Sampler，使每个进程加载一个mini batch中不同部分的数据。网络中相邻参数分桶，一般为神经网络模型中需要进行参数更新的每一层网络。每个进程前向传播并各自计算梯度。模型某一层的参数得到梯度后会马上进行通讯并进行梯度平均。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
部署推理服务 - AI开发平台ModelArts

he索引，如果不使用该功能，则无需配置。注意：如果使用投机推理功能，必须开启此参数。 --served-model-name：vllm服务后台id。可在run_vllm.sh增加如下环境变量开启高阶配置：配置环境变量。 export USE_PFA_HIGH_PRECISION_MODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

e-model ${container_draft_model_path}同时使用。 --served-model-name：vllm服务后台id。可在run_vllm.sh增加如下环境变量开启高阶配置：配置环境变量。 export USE_PFA_HIGH_PRECISION_MODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
创建Workflow训练作业节点 - AI开发平台ModelArts

JobEngine(image_url="fake_image_url"), # 自定义镜像的url，格式为：组织名/镜像名称:版本号，不需要携带相应的域名地址；如果image_url需要设置为运行态可配置，则使用如下方式：image_url=wf.Placeholder(name="image_url"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
非分离部署推理服务 - AI开发平台ModelArts

ache索引，若不使用该功能，则无需配置。注意：若使用投机推理功能，必须开启此参数。 --served-model-name：vllm服务后台id。服务启动后，会打印如下类似信息。 server launch time cost: 15.443044185638428 s INFO:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务

总条数： 404

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分页查询智能任务列表 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

Notebook专属预置镜像列表 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线