搜索_华为云

通过SSH工具远程使用Notebook - AI开发平台ModelArts

pem文件生成）。单击“Open”。如果首次登录，PuTTY会显示安全警告对话框，询问是否接受服务器的安全证书。单击“Accept”将证书保存到本地注册表中。图6 询问是否接受服务器的安全证书成功连接到云上Notebook实例。图7 连接到云上Notebook实例父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
语言模型推理性能测试 - AI开发平台ModelArts

lm、mindspore、openai等后端。本文档使用的推理接口是openai。 --host：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

Spark应用每个Executor的CPU核数。该配置项会替换sc_type中对应的默认参数。 -em / --executor-memory String 否 Spark应用的Executor内存，参数配置例如2G，2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必须带单位，否则会启动失败。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
语言模型推理性能测试 - AI开发平台ModelArts

lm、mindspore、openai等后端。本文档使用的推理接口是openai。 --host：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
非分离部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
安全 - AI开发平台ModelArts
安全 - AI开发平台ModelArts

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书安全边界

 帮助中心 > AI开发平台ModelArts > 产品介绍
调用MaaS部署的模型服务 - AI开发平台ModelArts

'application/json', 'Authorization': 'Bearer yourApiKey' # 把yourApiKey替换成已获取的API Key。例如，获取的API Key是“1234abcd...”时，此处填写“Bearer 1234abcd...”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

再新建实例。镜像下线后是否可以继续基于该镜像新建实例？镜像下线后无法使用该镜像新建实例，界面不会呈现了。镜像下线后用户还想继续使用，怎么办？如果想长期使用该镜像，建议用户在镜像下线前保存自定义镜像使用，镜像下线后不会影响自定义镜像使用。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
使用AWQ量化 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化工具转换权重 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
推理性能测试 - AI开发平台ModelArts

ore、openai等。本文档使用的推理接口是vllm。 --host ${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
Ascend-vLLM介绍 - AI开发平台ModelArts

可以快速适配新模型。调用：提供高性能算子下发和图模式两种方案，兼顾性能和灵活性。特性：服务调度、特性实现和社区一致，针对昇腾硬件做亲和替换和优化。接口：离线SDK、在线OpenAI Server和社区完全一致，无缝迁移。 Ascend-vLLM支持的特性介绍表1 Ascend-vLLM支持的特性

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
Standard镜像相关 - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？用户如何设置默认的kernel？

帮助中心 > AI开发平台ModelArts > 常见问题
Standard数据准备 - AI开发平台ModelArts

在ModelArts中如何将图片划分到验证集或者训练集？在ModelArts中物体检测标注时能否自定义标签？ ModelArts数据集新建的版本找不到怎么办？如何切分ModelArts数据集？如何删除ModelArts数据集中的图片？

帮助中心 > AI开发平台ModelArts > 常见问题
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

index-url = https://repo.huaweicloud.com/repository/pypi/simple trusted-host = repo.huaweicloud.com timeout = 120 在华为开源镜像站https://mirrors.huaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
执行预训练任务 - AI开发平台ModelArts

进入代码目录 /home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。xxx-Ascend请根据实际目录替换。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）

总条数： 455

上一页
1
...
6
7
8
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过SSH工具远程使用Notebook - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

安全 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

Standard镜像相关 - AI开发平台ModelArts

Standard数据准备 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线