搜索_华为云

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

Sun.ttf 2. 将文件 /home/ma-user/work/model-dir/Qwen-VL-Chat/tokenization_qwen.py 中的 30-35 行注释 3. 然后增加一行直接读取本地的Simsun.ttf文件，写绝对路径 # FONT_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
查询服务详情 - AI开发平台ModelArts

src_path String 批量任务输入数据的OBS路径。 dest_path String 批量任务输出结果的OBS路径。 req_uri String 批量任务中调用的推理路径。 mapping_type String 输入数据的映射类型，取值为：file或csv。 mapping_rule

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理部署使用的服务框架是vLLM。vLLM支持v0.6.0版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

thon版本的包，上下文版本替换要保持一致。将上述pip源文件、*.list文件、*.run文件、 *.whl文件、Miniconda3安装文件放置在context文件夹内，context文件夹内容如下。 context ├── Ascend-cann-nnae_7.0.0_linux-aarch64

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

观地查看ModelArts在线服务和模型负载的各项监控指标。由于监控数据的获取与传输会花费一定时间，因此，云监控显示的是当前时间5～10分钟前的状态。如果您的在线服务刚创建完成，请等待5～10分钟后查看监控数据。前提条件： ModelArts在线服务正常运行。已在云监控页面设

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
准备镜像环境 - AI开发平台ModelArts

240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模板，用于配置pod。而在训练中，需要按照参数说

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
使用SmoothQuant量化 - AI开发平台ModelArts

下。如果有指定的量化系数，则不需此参数，直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup/resolve/main/val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

下。如果有指定的量化系数，则不需此参数，直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup/resolve/main/val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

下。如果有指定的量化系数，则不需此参数，直接读取--scale-input参数指定的量化系数输入路径即可。 --dataset-path：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup/resolve/main/val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
准备镜像环境 - AI开发平台ModelArts

240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模板，用于配置pod。而在训练中，需要按照参数说

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像环境 - AI开发平台ModelArts

240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模板，用于配置pod。而在训练中，需要按照参数说

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
查询超参搜索所有trial的结果 - AI开发平台ModelArts

训练作业ID。获取方法请参见查询训练作业列表。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 返回的数据条目数。 offset 否 Integer 数据条目偏移量。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 total Integer

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用AWQ量化 - AI开发平台ModelArts

指定模型输入、输出路径。 model_path = ** quant_path = ** 可以指定校准数据集路径，如calib_data="/path/to/pile-val"，如不指定，默认数据集是“mit-han-lab/pile-val-backup”。 model.quantize(tokenizer

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用CES监控Lite Server资源 - AI开发平台ModelArts

在收集必要信息后，尝试退出当前AI任务并尝试重新执行退出当前AI任务以便重新执行 NPU: errorcode告警 NPUErrorCodeWarning 重要这里涵盖了大量重要及以上的NPU错误码，您可以根据这些错误码进一步定位错误原因对照《黑匣子错误码信息列表》和《健康管理故障定义》进一步定位错误

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

PRO是一款为企业级AI应用打造的专业开发套件。用户可根据预置工作流生成指定场景模型，无需深究底层模型开发细节。ModelArts PRO底层依托ModelArts平台提供数据标注、模型训练、模型部署等能力。也可以理解为增强版的自动学习，提供行业AI定制化开发套件，沉淀行业知识，让开发者聚焦自身业务。父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
查询工作空间配额 - AI开发平台ModelArts

响应Body参数参数参数类型描述 quotas Array of WorkspaceQuotasResponse objects 工作空间配额数据。表4 WorkspaceQuotasResponse 参数参数类型描述 max_quota Integer 配额允许设置的最大值。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
修改工作空间 - AI开发平台ModelArts

表3 请求Body参数参数是否必选参数类型描述 grants 否 Array of grants objects 训练作业使用的数据集。不可与data_url或dataset_id/dataset_version_id同时使用。 auth_type 否 String 授

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
如何在ModelArts的Notebook的CodeLab上安装依赖？ - AI开发平台ModelArts

install在Notebook或Terminal中安装依赖包。在Notebook中安装在总览页面进入CodeLab。在“Notebook”区域下，新建一个ipynb文件。在新建的Notobook中，在代码输入栏输入如下命令。 !pip install xxx 在Terminal中安装在Terminal里激活需要的anaconda

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
分离部署推理服务 - AI开发平台ModelArts

able.json文件和使用实例个数的local_ranktable.json文件；如果指定了`--api-server`，还会生成一个local_ranktable_host.json文件用于确定服务入口实例。 ./save_dir 生成ranktable文件如下（假设本地主机ip为10

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

able.json文件和使用实例个数的local_ranktable.json文件；如果指定了`--api-server`，还会生成一个local_ranktable_host.json文件用于确定服务入口实例。 ./save_dir 生成ranktable文件如下（假设本地主机ip为10

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务

总条数： 1677

上一页
1
...
68
69
70
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

查询超参搜索所有trial的结果 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

查询工作空间配额 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

如何在ModelArts的Notebook的CodeLab上安装依赖？ - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线