搜索_华为云

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

解决方法：降低transformers版本到4.42：pip install transformers==4.42 --upgrade 问题6：使用AWQ转换llama3.1系列模型权重出现报错ValueError: `rope_scaling` must be a dictionary with

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
查询服务监控信息 - AI开发平台ModelArts

表5 Monitor 参数参数类型描述 failed_times Integer 模型实例调用失败次数，在线服务字段。 model_version String 模型版本，在线服务字段。 cpu_memory_total Integer 总内存，单位MB。 gpu_usage Float

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。如果有长期的资源使用诉求，可以购买独占使用的专属资源池。如果是专属资源池，建议您进行以下排查：排查专属资源池中是否存在其

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
Workflow工作流管理 - AI开发平台ModelArts

删除Workflow工作流查询Workflow工作流修改Workflow工作流总览Workflow工作流查询Workflow待办事项在线服务鉴权创建在线服务包获取Execution列表新建Workflow Execution 删除Workflow Execution 查询Workflow

帮助中心 > AI开发平台ModelArts > API参考
使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

在“模型部署”页面的“预置服务”页签，单击DeepSeek-R1服务右侧的“领取”。当“领取”置灰时，表示该服务的免费额度已领取。在DeepSeek-R1服务右侧，单击“在线体验”，跳转到“模型体验”页面，即可开始问答体验。更多信息，请参见免费体验MaaS预置服务。图1 体验DeepSeek-R1模型（可选

 帮助中心 > AI开发平台ModelArts > 快速入门
Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

ascend_cloud_ops_atb-xx.whl Step4 开始推理在容器工作目录下进到Qwen-VL/infer_test，将要测试的图片放到Qwen-VL/infer_test/images文件夹中，执行如下命令，运行推理脚本。 bash infer_demo.sh 推理结果如下所示：

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
附录：大模型推理常见问题 - AI开发平台ModelArts

解决方法：降低transformers版本到4.42：pip install transformers==4.42 --upgrade 问题6：使用AWQ转换llama3.1系列模型权重出现报错ValueError: `rope_scaling` must be a dictionary with

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

解决方法：降低transformers版本到4.42：pip install transformers==4.42 --upgrade 问题6：使用AWQ转换llama3.1系列模型权重出现报错ValueError: `rope_scaling` must be a dictionary with

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
准备W8A8权重 - AI开发平台ModelArts

执行install过程会下载依赖包，因此需要确保能够访问到pip源。进入到msit/msmodelslim/example/DeepSeek目录，执行转换命令。 BF16权重路径是${path-to-file}/deepseekV3-bf16，例如：/home/data/deepseekV3

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 准备权重
ModelArts入门实践 - AI开发平台ModelArts

Standard，并进行在线推理预测的体验过程。面向AI开发零基础的用户从0-1制作自定义镜像并创建AI应用针对ModelArts不支持的AI引擎，您可以构建自定义镜像，并将镜像导入ModelArts，创建为模型。本案例详细介绍如何使用自定义镜像创建模型，并部署成在线服务。面向熟悉

 帮助中心 > AI开发平台ModelArts > 快速入门
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

设置相关权限，并且该权限仅对此项目生效；如果“授权范围”选择“所有资源”，则该权限在所有区域项目中都生效。访问ModelArts时，需要先切换至授权区域。如表1所示，包括了ModelArts的所有系统策略权限。如果系统预置的ModelArts权限，不满足您的授权要求，可以创建自

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
准备预测分析数据 - AI开发平台ModelArts

将原始.xlsx格式的数据转换为.csv格式的数据的方法如下：将原始表格数据（.xlsx）另存。单击“文件>另存为”，选择本地地址后，下拉选择“保存类型”为“CSV (逗号分隔)(*.csv)”单击“保存”，在弹窗中，单击“确定”后就可以将.xlsx格式数据集转换为.csv格式。表格数据集对训练数据的要求：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
查询服务详情 - AI开发平台ModelArts

服务当前运行所用配置的更新时间，距“1970.1.1 0:0:0 UTC”的毫秒数。 debug_url String 在线服务在线调试地址，只有当模型支持在线调试且只有一个实例的时候会存在。 due_time Number 在线服务自动停止时间，距“1970.1.1 0:0:0 UTC”的毫秒数，未配置自动停止则不返回。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
场景介绍及环境准备 - AI开发平台ModelArts

度及性能调优。环境准备迁移环境准备有以下两种方式：表1 迁移环境准备方式方式说明 ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。环境开通指导请参考Notebook环境创建。 ModelArts Lite DevServer

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
推理精度测试 - AI开发平台ModelArts

1:${port}/v1/completions"；若服务部署在生产环境中，该地址由API接口公网地址与"/v1/completions"拼接而成，部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 few_shot：开启少量样本测试后添加示例样本的个数。默认为3，取值范围为0~5整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──awq # W4A16量化工具 ├──convert_awq_to_npu.py # awq权重转换脚本 ├──llm_evaluation # 推理评测代码包 ├──benchmark_tools #性能评测

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
附录：大模型推理常见问题 - AI开发平台ModelArts

解决方法：降低transformers版本到4.42：pip install transformers==4.42 --upgrade 问题6：使用AWQ转换llama3.1系列模型权重出现报错ValueError: `rope_scaling` must be a dictionary with

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
附录：大模型推理standard常见问题 - AI开发平台ModelArts

解决方法：降低transformers版本到4.42：pip install transformers==4.42 --upgrade 问题6：部署在线服务报错starting container process caused "exec: \"/home/mind/model/run_vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
创建导入任务 - AI开发平台ModelArts

导入的OBS路径或manifest路径。导入manifest时，path必须精确到具体manifest文件。导入为目录时，目前仅支持数据集类型为图片分类、物体检测、文本分类、声音分类。 import_samples 否 Boolean 是否导入样本。可选值如下： true：导入样本（默认值）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

alpaca_gpt4_data.json # 微调数据文件注意：多机情况下，只有在rank_0节点进行数据预处理，转换权重等工作，所以原始数据集和原始权重，包括保存结果路径，都应该在共享目录下。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作

总条数： 915

上一页
1
...
32
33
34
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

Workflow工作流管理 - AI开发平台ModelArts

使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

准备W8A8权重 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理standard常见问题 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线