搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

6表示FP16，bfloat16表示BF16。推理启动脚本必须名为run_vllm.sh，不可修改其他名称。 hostname和port也必须分别是0.0.0.0和8080不可更改。高阶参数说明： --enable-prefix-caching：如果prompt的公共前缀较长

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

6.3.907-xxx.zip到宿主机的工作目录中，包获取路径请参见表2。 Step4 启动容器镜像启动容器镜像。启动前请先按照参数说明修改${}中的参数。 docker run -itd --net=host \ --device=/dev/davinci0 \ --dev

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
查询数据集的版本列表 - AI开发平台ModelArts

版本发布的manifest文件保存路径。 message String 发布时记录的任务信息（如：错误信息等）。 modified_sample_count Integer 已修改的样本数量。 previous_annotated_sample_count Integer 父版本的已标注样本数量。 previous_total_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

训练代码以下代码中以“### 分布式改造，... ###”注释的代码即为多节点分布式训练需要适配的代码改造点。不对示例代码进行任何修改，适配数据路径后即可在ModelArts上完成多节点分布式训练。注释掉分布式代码改造点，即可完成单节点单卡训练。完整代码见分布式训练完整代码示例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
管理AI Gallery镜像 - AI开发平台ModelArts

显示镜像的名称，不可编辑。 README.md - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。编辑完成后，单击“确认”保存修改。管理镜像文件预览文件在镜像详情页，选择“镜像文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU） - AI开发平台ModelArts

训练容器的“${MA_JOB_DIR}/demo-code”目录中，“demo-code”为OBS存放代码路径的最后一级目录，可以根据实际修改。启动命令：“/home/ma-user/miniconda3/bin/python ${MA_JOB_DIR}/demo-code/pytorch-verification

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
新建Workflow工作流 - AI开发平台ModelArts

SMN消息订阅ID。 exeml_template_id 否 String 自动学习模板ID。 last_modified_at 否 String 最近一次修改的时间。 package 否 WorkflowServicePackege object 计费工作流订阅包信息。表3 WorkflowStep

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

服务在llm_inference/ascend_vllm/目录下通OpenAI服务API接口启动服务，具体操作命令如下，可以根据参数说明修改配置。（1）非多模态 python -m vllm.entrypoints.openai.api_server --model ${container_model_path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
分离部署推理服务 - AI开发平台ModelArts

rank_table local_ranktable_10.**.**.18_host.json # api-server 如果要启动多P多D服务，则需要修改--prefill-server-list和--decode-server-list参数，每个实例之间用空格隔开，例如2p2d-tp2： python

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内的/home/ma-user工作目录中访问并编辑以上源码文件。编辑完成后重新构建新镜像。训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

系统默认关联您存储在OBS中的配置文件。打开开关，您可以直接在当前界面查看或编辑模型配置文件。说明：该功能即将下线，后续请根据“AI引擎”、“运行时依赖”和“apis定义”修改模型的配置信息。 “部署类型” 选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

训练容器的“${MA_JOB_DIR}/demo-code”目录中，“demo-code”为OBS存放代码路径的最后一级目录，可以根据实际修改。启动命令：“/home/ma-user/miniconda3/bin/python ${MA_JOB_DIR}/demo-code/pytorch-verification

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
获取Workflow工作流列表 - AI开发平台ModelArts

SMN消息订阅ID。 exeml_template_id String 自动学习模板ID。 last_modified_at String 最近一次修改的时间。 package WorkflowServicePackege object 计费工作流订阅包信息。表5 WorkflowStep

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服本文介绍如何使用MaaS（大模型即服务平台）的免费Token额度的满血版DeepSeek-R1 API接入Dify（开源Agent平台），快速构建AI对话机器人并将其嵌入在网页页面中。当免费Token额度用完后

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理
（可选）本地安装ma-cli - AI开发平台ModelArts

D:\ma_cli-latest-py3-none-any.whl -noverify > ./test 本示例以软件包在D:\举例，请根据软件包实际路径修改。 Step3：安装ma-cli 在本地环境cmd中执行命令python --version，确认环境已经安装完成Python。（Python版本需大于3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考

总条数： 898

上一页
1
...
36
37
38
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU） - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

（可选）本地安装ma-cli - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线