搜索_华为云

推理专属预置镜像列表 - AI开发平台ModelArts

04-x86_64 引擎版本一：tensorflow_2.1.0-cuda_10.1-py_3.7-ubuntu_18.04-x86_64 镜像地址：swr.{region_id}.myhuaweicloud.com/atelier/tensorflow_2_1:tensorflow_2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

\ --memory_efficient \ --eval 参数介绍： model：必选，要进行压缩的原始模型地址 save：必选，压缩后模型的保存的地址 dataset：可选，压缩模型所用的校准数据，可选范围["wikitext2"，"c4"]，默认wikitext2。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理通过patch操作对服务进行更新查询服务监控信息查询服务列表部署服务查询支持的服务部署规格查询服务详情更新服务配置删除服务更新模型服务的单个属性查询专属资源池列表查询服务事件日志启动停止边缘节点服务实例查询服务更新日志添加资源标签删除资源标签

 帮助中心 > AI开发平台ModelArts > API参考
语言模型推理性能测试 - AI开发平台ModelArts

--backend：服务类型，如tgi，vllm，mindspore、openai。 --host ${docker_ip}：服务部署的IP地址，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --dataset：数据集路径。 --dataset-type：支持三种 "a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的时候是在适配Diffusers和Stable Diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
删除Notebook实例 - AI开发平台ModelArts

参数参数类型描述 allowed_access_ips Array of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询数据处理任务版本的结果展示 - AI开发平台ModelArts

DescProcessorTaskVersionResultsResp 参数参数类型描述 new_source String 处理后样本的地址。 origin_source String 样本的原地址。 result_description Array of objects 样本的处理描述。 result_property

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
停止Notebook实例 - AI开发平台ModelArts

参数参数类型描述 allowed_access_ips Array of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练性能测试 - AI开发平台ModelArts

<master_addr> --num_nodes <nodes> --rank <rank> <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <ru

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

专属资源池需单独创建，不与其他租户共享。公共资源池实例规格选择实例规格，规格中描述了服务器类型、型号等信息。 xxx 流量限制（QPS）设置待部署模型的流量限制QPS。 3 实例数设置服务器个数。 1 更多选项内容审核选择是否打开内容审核，默认启用。开关打开（默认打开）

帮助中心 > AI开发平台ModelArts > 快速入门
在ECS中创建ma-user和ma-group - AI开发平台ModelArts

在ECS中创建ma-user和ma-group 在ModelArts训练平台使用的自定义镜像时，默认用户为ma-user、默认用户组为ma-group。如果在训练时调用ECS中的文件，需要修改文件权限改为ma-user可读，否则会出现Permission denied错误，因此需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
执行训练任务（推荐） - AI开发平台ModelArts

model_name_or_path：加载tokenizer与Hugging Face权重对应存放目录地址。否，设置以下超参 model_name_or_path：加载tokenizer与Hugging Face权重对应的存放地址在“输出”的输入框内设置超参：output_dir、hf_save_dir，根据实际要求选择，示例如下；

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
线下容器镜像构建及调试 - AI开发平台ModelArts

install等方式安装conda环境的依赖。更多ModelArts自定义镜像介绍请见自定义镜像简介。调试要点确认对应的脚本、代码、流程在linux服务器上运行正常。如果在linux服务器上运行就有问题，那么先调通以后再做容器镜像。确认打入镜像的文件是否在正确的位置、是否有正确的权限。训练场景主要查看自研的依赖包是否正常，查看pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
执行训练任务（历史版本） - AI开发平台ModelArts

endFactory 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：方法一：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts_modellink/llama2/0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
Standard推理部署 - AI开发平台ModelArts

Standard推理部署 ModelArts Standard推理服务访问公网方案端到端运维ModelArts Standard推理服务方案使用自定义引擎在ModelArts Standard创建模型使用大模型在ModelArts Standard创建模型部署在线服务第三方推理框架迁移到ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
语言模型推理性能测试 - AI开发平台ModelArts

--backend：服务类型，如tgi，vllm，mindspore、openai。 --host ${docker_ip}：服务部署的IP地址，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --dataset：数据集路径。 --dataset-type：支持三种 "a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试

总条数： 1829

上一页
1
...
26
27
28
...
92
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理专属预置镜像列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

删除Notebook实例 - AI开发平台ModelArts

查询数据处理任务版本的结果展示 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

在ECS中创建ma-user和ma-group - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线