搜索_华为云

AIGC工具tailor使用指导 - AI开发平台ModelArts

pip install tailor-0.3.4-py3-none-any.whl 使用指导 tailor支持“命令行”和“Python API”两种方式使用。命令行方式命令行运行样例： tailor --model_path="./resnet50-v2-7.onnx"--config_path="

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
切换Lite Server服务器操作系统 - AI开发平台ModelArts

response) } else { fmt.Println(err) } } Python封装API方式切换操作系统以下为BMS使用Python语言通过API方式切换操作系统的示例代码。 # -*- coding: UTF-8 -*- import requests

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

SWR OperateAccess 必选 CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 必选 SMN消息服务授予子用户使用SMN消息服务的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

的dependencies字段中读取需要安装的依赖包。 apis 否 String 模型提供的推理接口列表，默认为空。如果已在模型配置文件中配置apis信息时，则可不填，后台自动从配置文件中的apis字段读取所配置的推理接口信息。表3 params结构参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
服务预测请求体大小限制是多少？ - AI开发平台ModelArts

服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。如果是从ModelArts console的预测页

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

Tenant Administrator 可选 CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 可选 SMN消息服务授予子用户使用SMN消息服务的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

从OBS中或者从容器镜像中导入模型时，开发者需要编写模型配置文件。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件为JSON格式。配置文件中的“dependencies”，表示配置模型推理代码需要的依赖包，需要提供依赖包名、安装方式和版本约

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
部署推理服务 - AI开发平台ModelArts

配置后重启服务生效。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。通过vLLM服务API接口启动服务在ascend_vllm目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.904）
查询模型详情 - AI开发平台ModelArts

e_job_version有值且对应的训练作业有评测结果时会返回该结果。 apis String 模型所有的apis入参出参信息。表2 params结构参数参数类型描述 url String api代表的url路径。 param_name String 参数名，不超过64个字符。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──start.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
SDXL Diffusers框架基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

gz 也可以从HuggingFace官网下载到本地后，通过docker cp命令复制到容器中/home/ma-user目录下，如下图所示。在线下载地址： https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/tree/main

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
部署推理服务 - AI开发平台ModelArts

参数类型描述 model 是无 Str 通过OpenAI服务API接口启动服务时，推理请求必须填写此参数。取值必须和启动推理服务时的model ${model_path}参数保持一致。通过vLLM服务API接口启动服务时，推理请求不涉及此参数。 prompt 是 - Str

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
附录：微调训练常见问题 - AI开发平台ModelArts

rver/api.py文件参数： vim /home/ma-user/anaconda3/envs/PyTorch-2.2.0/lib/python3.10/site-packages/torch/distributed/elastic/agent/server/api.py 修改def

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
训练作业容错检查 - AI开发平台ModelArts

启，表示不做重新下发作业，也不会启用环境检测。打开开关后，允许设置重启次数为1~128次。图5 自动重启设置使用API接口设置容错检查：用户可以通过API接口的方式开启自动重启。创建训练作业时，在“metadata”字段的“annotations”中传入“fault-tol

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

推理结果（2） Step5 调用API接口推理进入源码根目录，安装依赖。 cd Qwen-VL pip install -r requirements_openai_api.txt 修改openai_api.py脚本，适配NPU。 # 在openai_api.py脚本的import torch下新增两行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用GPTQ量化 - AI开发平台ModelArts

["auto-gptq is an easy-to-use model quantization library with user-friendly apis, based on GPTQ algorithm."] gptq_config = GPTQConfig(bits=8, dataset=dataset

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 1089

上一页
1
...
47
48
49
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AIGC工具tailor使用指导 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

服务预测请求体大小限制是多少？ - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

SDXL Diffusers框架基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线