搜索_华为云

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
推理场景介绍 - AI开发平台ModelArts

能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本本教程中用到基础

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
Ascend-vLLM推理常见问题 - AI开发平台ModelArts

图3 服务端响应200 图4 仍返回报错Response payload is not completed 解决方法：安装brotlipy后返回正确报错 pip install brotlipy 问题10：使用benchmark-tools访问推理客户端返回报错或警告使用ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
下载代码目录失败 - AI开发平台ModelArts

处理方法请您根据报错原因排查创建训练作业时指定的代码目录，即OBS桶的路径是否正确。有两种方法判断是否存在。使用当前账户登录OBS管理控制台，去查找对应的OBS桶、文件夹、文件是否存在。通过接口判断路径是否存在。在代码中执行如下命令，检查路径是否存在。 import moxing

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
如何获取访问密钥？ - AI开发平台ModelArts

如何获取访问密钥？获取访问密钥登录华为云，在页面右上方单击“控制台”，进入华为云管理控制台。图1 控制台入口在控制台右上角的账户名下方，单击“我的凭证”，进入“我的凭证”页面。图2 我的凭证在“我的凭证”页面，选择“访问密钥>新增访问密钥”，如图3所示。图3 单击新增访问密钥

 帮助中心 > AI开发平台ModelArts > 常见问题 > 权限相关
语言模型推理性能测试 - AI开发平台ModelArts

的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

格式是HuggingFace的目录格式。即上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址，还需要有Tokenizer原始文件。 --max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
语言模型推理性能测试 - AI开发平台ModelArts

的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
语言模型推理性能测试 - AI开发平台ModelArts

的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Face的目录格式。即Step2 准备权重文件上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用推理模型量化章节转换后的权重。 --max-num-seqs：最大同时处理的请求数，超过后拒绝访问。 --max-model-len：推理时最大输入+最大输出to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务。当参数值>=max_steps时，生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。当参数值<max_steps时，生成模型会每经过save_steps次，保存一次模型版本。模型版本保存次数=max_steps//save_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
创建Workflow训练作业节点 - AI开发平台ModelArts

storages=[storage] ) 使用算法管理中的算法 from modelarts import workflow as wf # 构建一个OutputStorage对象，对训练输出目录做统一管理 storage = wf.data.OutputStorag

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
训练作业重调度 - AI开发平台ModelArts

当训练作业发生故障恢复时（例如进程级恢复、POD级重调度、JOB级重调度等），作业详情页面中会出现“故障恢复详情”页签，里面记录了训练作业的启停情况。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单击“故障恢复详情”页签查看故障恢复信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
使用Workflow实现低代码AI开发 - AI开发平台ModelArts

使用Workflow实现低代码AI开发什么是Workflow 运行第一条Workflow 管理Workflow 开发第一条Workflow 开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
数据集版本不合格 - AI开发平台ModelArts

物体检测：用于训练的图片，至少有1种以上的分类（即1种以上的标签），每种分类的图片数不少于5张。预测分析：由于预测分析任务的数据集不在数据管理中进行统一管理，即使数据不满足要求，不在此环节出现故障信息。声音分类：用于训练的音频，至少有2种以上的分类（即2种以上的标签），每种分类的音频数不少于5个。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
开发环境（旧版） - AI开发平台ModelArts

开发环境（旧版）创建开发环境实例查询开发环境实例列表查询开发环境实例详情更新开发环境实例信息删除开发环境实例管理开发环境实例父主题：历史API

帮助中心 > AI开发平台ModelArts > API参考 > 历史API
ModelArts Standard准备工作 - AI开发平台ModelArts

ModelArts Standard准备工作配置ModelArts Standard访问授权创建并管理工作空间创建OBS桶用于ModelArts存储数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
处理ModelArts数据集中的数据 - AI开发平台ModelArts

创建ModelArts数据校验任务创建ModelArts数据清洗任务创建ModelArts数据选择任务创建ModelArts数据增强任务管理和查看数据处理任务父主题：数据准备与处理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
附录：大模型推理常见问题 - AI开发平台ModelArts

图3 服务端响应200 图4 仍返回报错Response payload is not completed 解决方法：安装brotlipy后返回正确报错 pip install brotlipy 问题10：使用benchmark-tools访问推理客户端返回报错或警告使用ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

enstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。配置Cluster资源，确保可以通过公网访问Cluster机器，具体配置请参见配置Lite Cluster网络。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理

总条数： 1749

上一页
1
...
81
82
83
...
88
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

如何获取访问密钥？ - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

训练作业重调度 - AI开发平台ModelArts

使用Workflow实现低代码AI开发 - AI开发平台ModelArts

数据集版本不合格 - AI开发平台ModelArts

开发环境（旧版） - AI开发平台ModelArts

ModelArts Standard准备工作 - AI开发平台ModelArts

处理ModelArts数据集中的数据 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线