搜索_华为云

推理精度测试 - AI开发平台ModelArts

ize大小，不影响精度，只影响得到结果速度。 eval_datasets：评测数据集和评测方法，比如ceval_gen、mmlu_gen，不同数据集可以详见opencompass下面data目录。 model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
推理精度测试 - AI开发平台ModelArts

ize大小，不影响精度，只影响得到结果速度。 eval_datasets：评测数据集和评测方法，比如ceval_gen、mmlu_gen，不同数据集可以详见opencompass下面data目录。 model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
推理精度测试 - AI开发平台ModelArts

ize大小，不影响精度，只影响得到结果速度。 eval_datasets：评测数据集和评测方法，比如ceval_gen、mmlu_gen，不同数据集可以详见opencompass下面data目录。 model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
安装Gallery CLI配置工具 - AI开发平台ModelArts

AI Gallery仓库的地址，格式为“http://{ModelArts-Endpoint}.myhuaweicloud.com”，其中不同区域的Endpoint可以在ModelArts地区和终端节点获取。 cached_dir 缓存目录，默认AI Gallery仓库的文件下载至该目录下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
在线服务预测报错MR.0105 - AI开发平台ModelArts

部署为在线服务，服务处于运行中状态，预测时报错：{ "erno": "MR.0105", "msg": "Recognition failed","words_result": {}}。图1 预测报错原因分析请在“在线服务”详情页面的日志页签中查看对应的报错日志，分析报错原因。图2 报错日志

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
预训练任务 - AI开发平台ModelArts

scripts/llama2/0_pl_pretrain_70b.sh xx.xx.xx.xx 8 7 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NODE_RANK、 NODE_RANK 为必填。单机启动对于Llama2-7B和

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

scripts/llama2/0_pl_lora_70b.sh xx.xx.xx.xx 4 3 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致。其中MASTER_ADDR、NNODES、NODE_RANK为必填项。单机启动对于Llama2-7b和Llama

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
SFT全参微调训练任务 - AI开发平台ModelArts

scripts/llama2/0_pl_sft_70b.sh xx.xx.xx.xx 4 3 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致。其中MASTER_ADDR、 NNODES、 NODE_RANK为必填。单机启动对于Llama2-7b和Llam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

选择完成后勾选“我已经详细阅读并同意《ModelArts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。图2 查看委托配置信息步骤一：准备训练数据本案例使用的数据是MNIST数据集，您可以在浏览器中搜索“MNIST数据集”下载如图3所示的4个文件。

帮助中心 > AI开发平台ModelArts > 快速入门
更新服务配置 - AI开发平台ModelArts

量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。 deploy_timeout_in_seconds

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
部署推理服务 - AI开发平台ModelArts

json里面定义的“max_position_embeddings”和“seq_length”；如果设置过大，会占用过多显存，影响kvcache的空间。不同模型推理支持的max-model-len长度不同，具体差异请参见表1。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
预训练任务 - AI开发平台ModelArts

scripts/llama2/0_pl_pretrain_70b.sh xx.xx.xx.xx 4 3 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NNODES、 NODE_RANK 为必填。单机启动对于Llama2-7B和Lla

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
查询服务更新日志 - AI开发平台ModelArts

量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。 specification

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

录中。运行用户ID 容器运行时的用户ID，该参数为选填参数，建议使用默认值1000。如果需要指定uid，则uid数值需要在规定范围内，不同资源池的uid范围如下：公共资源池：1000-65535 专属资源池：0-65535 启动命令必填，镜像的启动命令。运行训练作业时，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询Notebook实例列表 - AI开发平台ModelArts

capacity Integer 存储容量，EVS默认5G，EFS默认50G，最大限制4096G。 category String 支持的存储类型。不同存储类型的差异，详见开发环境中如何选择存储。枚举值如下： SFS：弹性文件服务 EVS：云硬盘 mount_path String 存储挂

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询所有Notebook实例列表 - AI开发平台ModelArts

capacity Integer 存储容量，EVS默认5G，EFS默认50G，最大限制4096G。 category String 支持的存储类型。不同存储类型的差异，详见开发环境中如何选择存储。枚举值如下： SFS：弹性文件服务 EVS：云硬盘 mount_path String 存储挂

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
AI应用的自定义镜像制作流程 - AI开发平台ModelArts

rn缺省情形下不支持keep-alive，需要同时安装gevent并配置启动参数“--keep-alive 200 -k gevent”。不同服务框架参数设置有区别，请以实际情况为准。（可选）处理SIGTERM信号，容器优雅退出如果需要支持滚动升级的过程中不中断业务，那么需要

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
订阅免费模型 - AI开发平台ModelArts

模型”，进入“我的模型”页面。选择“我的订阅”页签，进入个人订阅的模型列表。在模型列表选择需要推送的模型，单击“应用控制台”列的服务名称将模型推送至不同应用控制台。图2 选择应用控制台如果订阅的是ModelArts模型，在弹出的“选择云服务区域”页面选择ModelArts所在的云服务区

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
查询指定节点池详情 - AI开发平台ModelArts

rack：表示整柜。表12 NodePoolStatus 参数参数类型描述 resources resources object 节点池中不同状态的资源量。表13 resources 参数参数类型描述 creating PoolResourceFlavorCount object

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
删除节点池 - AI开发平台ModelArts

rack：表示整柜。表11 NodePoolStatus 参数参数类型描述 resources resources object 节点池中不同状态的资源量。表12 resources 参数参数类型描述 creating PoolResourceFlavorCount object

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理

总条数： 607

上一页
1
...
26
27
28
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

AI应用的自定义镜像制作流程 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线