搜索_华为云

MoXing进阶用法的样例代码 - AI开发平台ModelArts

jpg', binary=True), np.uint8), cv2.IMREAD_COLOR) 将一个不支持OBS路径的API改造成支持OBS路径的API pandas中对h5的文件读写to_hdf和read_hdf既不支持OBS路径，也不支持输入一个文件对象，考虑以下代码会出现错误。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
训练中的权重转换说明 - AI开发平台ModelArts

scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。注意脚本中的python命令分别有Hugging Face 转 Megatron格式，以及Megatron

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
管理Lite Cluster资源池 - AI开发平台ModelArts

是一种应用性能调优手段，在大部分场景下可以提升应用性能。但是清除缓存也可能会导致容器启动失败或系统性能暂时下降（因为系统需要重新从磁盘加载数据到内存中）。关闭表示不启用缓存清理功能。大页内存：开启表示配置使用透明大页功能。大页内存是一种内存管理机制，可以通过增大内存页的大小来提

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 OBS上传下载上传本地文件或文件夹至OBS，从OBS下载文件或文件夹到本地。使用PyCharm上传数据至Notebook 前提条件本地已安装2019.2-2023.2之间（包含2019.2和2023.2）版本的PyCharm专业版。SSH

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

168.20.1 slots=1 192.168.20.2 slots=1 NCCL环境变量说明： NCCL_IB_GID_INDEX=3 ：数据包走交换机的队列4通道，这是RoCE协议标准。 NCCL_IB_TC=128 ：使用RoCE v2协议，默认使用RoCE v1，但是v1在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

s://github.com/vllm-project/vllm/tree/v0.3.2，版本：v0.3.2）。仅支持FP16和BF16数据类型推理。适配的CANN版本是cann_8.0.rc2，驱动版本是23.0.5。本案例仅支持在专属资源池上运行。支持的模型列表本方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
免费体验MaaS预置服务 - AI开发平台ModelArts

当Tokens的免费调用额度使用完时，操作列的“体验”会置灰。在业务环境中调用模型服务的API进行推理。在预置服务列表，选择所需的服务，单击操作列的“更多 > 调用”，在调用弹窗中获取API地址和调用示例，在业务环境中调用API进行体验。操作指导请参见调用MaaS部署的模型服务。预置服务默认启用内容审核，且调用页面不显示该参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

output2=obs://bucket/output2 --input String 否训练的输入信息，指定后，训练作业将会把对应OBS上的数据下载到训练容器，并将数据存储路径通过指定的参数传递给训练脚本。如果需要指定多个参数，可以使用--input data_path1=obs://bucket/data1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info 如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

从OBS中或者从容器镜像中导入模型时，开发者需要编写模型配置文件。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件为JSON格式。配置文件中的“dependencies”，表示配置模型推理代码需要的依赖包，需要提供依赖包名、安装方式和版本约

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

状态变为“已冻结”，您将无法对处于保留期的包年/包月资源执行任何操作。保留期到期后，如果包年/包月资源池仍未续费，那么计算资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于续费的详细介绍请参见续费概述。父主题：计费模式

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
投机推理使用说明 - AI开发平台ModelArts

性。投机推理端到端推理示例以llama-2-13b-chat-hf模型作为LLM大模型，llama1.1b作为小模型，启用openai接口服务为例。使用下面命令启动推理服务。 base_model=/path/to/base_model spec_model=/path/to/spec_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。如果是从ModelArts console的预测页

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

元模型来源：选择“从对象存储服务（OBS）中选择”。选择元模型：从OBS中选择一个模型包。 AI引擎：选择“Custom”。引擎包：从容器镜像中选择一个镜像。容器调用接口：端口和协议可根据镜像实际使用情况自行填写。其他参数保持默认值。单击“立即创建”，跳转到模型列表页，查看模型状态，当状态变为“正常”，模型创建成功。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

el-len。 e5-mistral-7B和gte-Qwen2-7B-instruct模型，使用openai启动服务，发送推理请求使用的是接口curl -X POST http://localhost:port/v1/embedding。表1 基于vLLM不同模型推理支持最小卡数和最大序列说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

ry CLI配置工具下载文件。获取待下载的文件名在AI Gallery页面的资产详情页，如果是模型资产，则选择“模型文件”页签，如果是数据集资产，则选择“文件版本”页签，获取“文件名称”。下载单个文件在服务器执行如下命令，可以从AI Gallery仓库下载单个文件到服务器的缓存目录下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

conf文件。 vim whitelist.conf 配置内容为安全控制可访问的地址，支持配置通配符，例如： .apig.cn-east-3.huaweicloudapis.com 如果地址访问不通，请在浏览器配置访问域名。打开并配置squid.conf文件。 vim squid

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.4.2版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

解决方案。 KooSearch企业搜索服务：基于在MaaS开源大模型部署的模型API，搭建企业专属方案、LLM驱动的语义搜索、多模态搜索增强。盘古数字人大脑：基于在MaaS开源大模型部署的模型API，升级智能对话解决方案，含智能客服、数字人。 Dify：支持自部署的应用构建开源

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

期，资源状态变为“已冻结”，您将无法对处于保留期的按需计费资源执行任何操作。保留期到期后，如果您仍未支付账户欠款，那么计算资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于充值的详细操作请参见账户充值。欠费受限您购买的资源欠费后，会导

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式

总条数： 1953

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MoXing进阶用法的样例代码 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线