搜索_华为云

推理精度测试 - AI开发平台ModelArts

范围为0~5整数。 is_devserver：是否DevServer部署方式，True表示DevServer模式。False表示ModelArts Standard模式。 model_name：评测模型名称，llama2。 deploy_method：部署方法，不同的部署方式a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
推理精度测试 - AI开发平台ModelArts

范围为0~5整数。 is_devserver：是否DevServer部署方式，True表示DevServer模式。False表示ModelArts Standard模式。 vllm_model：对应Step4 部署并启动推理服务中的模型地址参数model，模型格式是Huggingface的目录格式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
使用Notebook进行代码调试 - AI开发平台ModelArts

自动停止，即1小时后停止规格资源计费。开启自动停止功能后，可选择“1小时”、“2小时”、“4小时”、“6小时”或“自定义”几种模式。选择“自定义”模式时，可指定1~24小时范围内任意整数。填写Notebook详细参数，如镜像、资源规格等。镜像：在“自定义镜像”页签选择已上传的自定义镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
运行第一条Workflow - AI开发平台ModelArts

阅”即可完成工作流的订阅。订阅过的工作流会显示“已订阅”。运行工作流订阅完成后，单击“运行”进入ModelArts控制台配置页面。选择资产版本、Workflow名称、云服务区域以及工作空间参数后，单击“导入”。图3 从AI Gallery导入工作流工作流运行的云服务区域需

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
Lite Server资源开通 - AI开发平台ModelArts

确保服务持久稳定运行，提升运维效率。计费模式选择“按需计费”或“包年/包月”模式。包年/包月包年/包月是预付费模式，按订单的购买周期计费，适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。按需计费按需计费是后付费模式，按云服务器的实际使用时长计费，可以随时开通/删除云服务器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
使用Notebook进行代码调试 - AI开发平台ModelArts

自动停止，即1小时后停止规格资源计费。开启自动停止功能后，可选择“1小时”、“2小时”、“4小时”、“6小时”或“自定义”几种模式。选择“自定义”模式时，可指定1~24小时范围内任意整数。填写Notebook详细参数，如镜像、资源规格等。镜像：在“自定义镜像”页签选择已上传的自定义镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
Lite Cluster资源开通 - AI开发平台ModelArts

选择“ModelArts Lite”。计费模式 - 选择“按需计费”或“包年/包月”模式。包年/包月包年/包月是预付费模式，按订单的购买周期计费，适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。按需计费按需计费是后付费模式，按云服务器的实际使用时长计费，可以随时开通/删除云服务器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
数据管理计费项 - AI开发平台ModelArts

增强的数据处理任务时，不收费。但是存储到OBS中的数据会收取费用。具体内容如表1所示。表1 存储计费项计费项计费项说明适用的计费模式计费公式存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。注意：存储到OBS中

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
使用llm-compressor工具量化 - AI开发平台ModelArts

2、若量化Deepseek-v2-236b模型，大致需要10+小时。使用量化模型使用量化模型需要在NPU的机器上运行。启动vLLM前，请开启图模式（参考步骤六启动推理服务中的配置环境变量），启动服务的命令和启动非量化模型一致。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查询训练作业列表 - AI开发平台ModelArts

算法的代码目录下载到训练容器内的本地路径。规则如下：必须为/home下的目录； v1兼容模式下，当前字段不生效；当code_dir以file://为前缀时，当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。 environments Array

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

算法的代码目录下载到训练容器内的本地路径。规则如下：必须为/home下的目录； v1兼容模式下，当前字段不生效；当code_dir以file://为前缀时，当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。 environments Array

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
终止训练作业 - AI开发平台ModelArts

算法的代码目录下载到训练容器内的本地路径。规则如下：必须为/home下的目录； v1兼容模式下，当前字段不生效；当code_dir以file://为前缀时，当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。 environments Array

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
部署推理服务 - AI开发平台ModelArts

USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

使用正确的工具和设备：确保您使用正确的工具和设备，并且它们得到了正确的维护和保养。\n\n4.个人防护装备：确保您和您的同事穿戴正确的个人防护装备，如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化：鼓励个人对安全的责任感和意识，并创建一个安全文化，使人们始终关注自己和他人的安全。\n\n6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

使用正确的工具和设备：确保您使用正确的工具和设备，并且它们得到了正确的维护和保养。\n\n4.个人防护装备：确保您和您的同事穿戴正确的个人防护装备，如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化：鼓励个人对安全的责任感和意识，并创建一个安全文化，使人们始终关注自己和他人的安全。\n\n6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

使用正确的工具和设备：确保您使用正确的工具和设备，并且它们得到了正确的维护和保养。\n\n4.个人防护装备：确保您和您的同事穿戴正确的个人防护装备，如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化：鼓励个人对安全的责任感和意识，并创建一个安全文化，使人们始终关注自己和他人的安全。\n\n6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
将AI应用部署为批量推理服务 - AI开发平台ModelArts

“计算节点个数” 设置当前版本AI应用的实例个数。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变量，注入环境变量到容器实例。为确保您的数据安全，在环境变量中，请勿输入敏感信息，如明文密码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
AI应用的自定义镜像制作流程 - AI开发平台ModelArts

自定义镜像中不能包含恶意代码。创建AI应用的自定义镜像大小不超过50GB。对于同步请求模式的AI应用，如果预测请求时延超过60s，会造成请求失败，甚至会有服务业务中断的风险，预测请求时延超过60s时，建议制作异步请求模式的AI应用。自定义镜像的配置规范镜像对外接口设置镜像的对外服务接口，推理接口需与config

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建Standard专属资源池 - AI开发平台ModelArts

Lite”。创建“ModelArts Lite”相关资料请见《ModelArts Lite Cluster用户指南》。该参数仅在贵阳一区域显示。计费模式 - 选择计费模式，“包年/包月”或“按需计费”。资源池类型 - 可选物理资源池和逻辑资源池。逻辑资源池与规格有关，如果无逻辑规格则不显示逻辑资源池。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理

总条数： 330

上一页
1
...
6
7
8
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

将AI应用部署为批量推理服务 - AI开发平台ModelArts

AI应用的自定义镜像制作流程 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线