搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

# 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号中的AK和SK进行签名验证，确保通过授权的账号才能访问指定的OBS资源。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
LLM/AIGC/数字人基于Server适配NPU的训练推理指导 - AI开发平台ModelArts

NPU的Finetune训练指导 Qwen-VL基于Server适配Pytorch NPU的推理指导数字人模型 Wav2Lip基于Server适配PyTorch NPU推理指导 Wav2Lip基于Server适配PyTorch NPU训练指导父主题： Lite Server资源使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
管理Notebook实例 - AI开发平台ModelArts

管理Notebook实例查找Notebook实例更新Notebook实例启动/停止/删除实例保存Notebook实例动态扩充云硬盘EVS容量动态挂载OBS并行文件系统查看Notebook实例事件 Notebook Cache盘告警上报父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
约束与限制 - AI开发平台ModelArts

Standard推理部署在线服务单个账号最多可创建20个在线服务。是提交工单申请提升配额更多信息，请参见部署在线服务。 Standard推理部署批量服务单个账号最多可创建1000个批量服务。否更多信息，请参见部署批量服务。 Standard推理部署边缘服务单个账号最多可创建1000个边缘服务。

帮助中心 > AI开发平台ModelArts > 产品介绍
更新网络资源 - AI开发平台ModelArts

与SFS Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。状态码： 400 表20 响应Body参数参数参数类型描述 error_code String ModelArts错误码。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
通过VS Code远程使用Notebook实例 - AI开发平台ModelArts

通过VS Code远程使用Notebook实例 VS Code连接Notebook方式介绍安装VS Code软件 VS Code一键连接Notebook VS Code ToolKit连接Notebook VS Code手动连接Notebook 在VS Code中上传下载文件父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

auto-completion自动补全命令命令行自动补全是指用户可以在Terminal中输入命令前缀通过Tab键自动提示支持的ma-cli命令。ma-cli自动补全功能需要手动在Terminal中激活。执行ma-cli auto-completion命令，用户根据提示的补全命令，复制并在当前Term

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在线服务预测报错MR.0105 - AI开发平台ModelArts

在线服务预测报错MR.0105 问题现象部署为在线服务，服务处于运行中状态，预测时报错：{ "erno": "MR.0105", "msg": "Recognition failed","words_result": {}}。图1 预测报错原因分析请在“在线服务”详情页面

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

承载REST服务端点的服务器域名或IP，不同服务在不同区域时，对应Endpoint不同，可以从终端节点中获取。例如IAM服务在“华北-北京一”区域的Endpoint为“iam.cn-north-1.myhuaweicloud.com”。 resource-path 资源路径，即API访问路径。从具体

 帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
VS Code一键连接Notebook - AI开发平台ModelArts

图9 选择正确的密钥文件当左下角显示如下状态时，代表实例连接成功：图10 实例连接成功当弹出如下错误时，代表实例连接失败，请关闭弹窗，并查看OUTPUT窗口的输出日志，请查看FAQ并排查失败原因。图11 实例连接失败远程调试代码在VS Code界面，上传本地代码到云端开发环境。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

在GPU的机器上使用开源GPTQ量化工具GPTQ (huggingface.co)量化模型权重。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

查询Notebook支持的有效规格列表功能介绍查询运行Notebook实例所支持的有效规格列表。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

pseek-v2-236B-W8A8。另外，当前MoE模型的PTA图模式启动不支持multi step。 PTA图模式参数配置如果要开启PTA图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

header和request body？问题现象部署在线服务完成且在线服务处于“运行中”状态时，通过ModelArts console的调用指南tab页签可以获取到推理请求的地址，但是不知道如何填写推理请求的header及body。原因分析在线服务部署完成且服务处于运行中状态后，可以通过

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
使用GPTQ量化 - AI开发平台ModelArts

(huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

(huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

(huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

(huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

(huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

(huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers 设置G

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化

总条数： 1255

上一页
1
...
50
51
52
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - AI开发平台ModelArts

LLM/AIGC/数字人基于Server适配NPU的训练推理指导 - AI开发平台ModelArts

管理Notebook实例 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

通过VS Code远程使用Notebook实例 - AI开发平台ModelArts

ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线