搜索_华为云

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

在浏览器地址栏输入http://<弹性公网IP>:9090，即可打开Prometheus监控浏览页面。单击Graph菜单，在输入框输入任意一个指标名称即可看到Prometheus收集到的指标数据：父主题：监控Lite Cluster资源

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
使用AWQ量化 - AI开发平台ModelArts

hostPath: path: ${node-path} 参数说明： ${container_name}：容器名称，此处可以自己定义一个容器名称，例如ascend-vllm。 ${image_name}：Step3 制作推理镜像构建的推理镜像名称。 ${node-path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

hostPath: path: ${node-path} 参数说明： ${container_name}：容器名称，此处可以自己定义一个容器名称，例如ascend-vllm。 ${image_name}：Step3 制作推理镜像构建的推理镜像名称。 ${node-path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练脚本说明
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

支持CopyBlocks算子，满足vllm框架beam search解码场景支持AdvanceStep算子，满足vllm投机推理场景多个融合算子支持PTA图模式适配，满足AIGC场景支持两种版本配套算子包（torch2.1.0和python3.9、torch2.3.1和python3

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
新建Workflow Execution - AI开发平台ModelArts

执行记录使用到的执行策略。表3 StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一，1到64位只包含中英文，数字，空格，下划线（_）和中划线（-），并且以中英文开头。 duration 否 Integer Execution执行的运行时长。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用AWQ量化 - AI开发平台ModelArts

hostPath: path: ${node-path} 参数说明： ${container_name}：容器名称，此处可以自己定义一个容器名称，例如ascend-vllm。 ${image_name}：Step3 制作推理镜像构建的推理镜像名称。 ${node-path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

ma-user@<域名/ip> SSH可用时跳过3继续远端排查。 SSH不可用，排查3。在VS Code Terminal里执行如下检查网络。如果网络异常，请执行命令检查端口。 curl -kv telnet://<域名/ip>:<port> 端口有问题，请联系技术支持。端口无问题请继续远端排查。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程使用到的HuggingFace原始权重文件和Tokenizer。标记器(Tokenizer)是NLP管道的核心组件之一。它们有一个目的：将文本转换为模型可以处理的数据。模型只能处理数字，因此标记器(Tokenizer)需要将文本输入转换为数字数据。 Qwen-14B-Chat

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

本地验证镜像并上传镜像至SWR服务在本地环境执行以下命令启动自定义镜像 docker run -it -p 8080:8080 test:v1 图2 启动自定义镜像另开一个终端，执行以下命令验证自定义镜像的三个API接口功能。 curl -X POST -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
InternVL2&2.5系列模型基于Lite Server适配PyTorch NPU训练指导（6.5.901) - AI开发平台ModelArts

不同机器之间网络互通。购买Lite Server资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909）
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

本地验证镜像并上传镜像至SWR服务在本地环境执行以下命令启动自定义镜像 docker run -it -p 8080:8080 test:v1 图2 启动自定义镜像另开一个终端，执行以下命令验证自定义镜像的三个API接口功能。 curl -X POST -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

\Roaming 如上所示，即需要在C:\Users\xxx\AppData\Roaming路径下创建pip文件夹。在pip文件夹中创建一个名为pip的文本文件，并将后缀名由“.txt”改为“.ini”。文件内容示例如下：其中，index-url为pip源ip地址，使用时需自行替换。本示例以华为源为例，具体如下：

帮助中心 > AI开发平台ModelArts > SDK参考
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

上1分钟内，统计该请求每次响应所消耗的时间，并将这些时间按从小到大的顺序进行排序，取第99.9%的值作为TP99.9的值。 ≥ms ModelArts在线服务 1分钟对于有多个测量维度的测量对象，使用接口查询监控指标时，所有测量维度均为必选。查询单个监控指标时，多维度dim使用样例：dim.0=service_id

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
昇腾云服务6.5.901版本说明（推荐） - AI开发平台ModelArts

支持CopyBlocks算子，满足vllm框架beam search解码场景支持AdvanceStep算子，满足vllm投机推理场景多个融合算子支持PTA图模式适配，满足AIGC场景支持两种版本配套算子包（torch2.1.0和python3.9、torch2.3.1和python3

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备所需的权重文件。准备代码准备AscendFactory训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901）

总条数： 1303

上一页
1
...
59
60
61
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

InternVL2&2.5系列模型基于Lite Server适配PyTorch NPU训练指导（6.5.901) - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

昇腾云服务6.5.901版本说明（推荐） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线