搜索_华为云

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去修改CUDA_VISIBLE_DEVICES变量，用系统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
查询服务更新日志 - AI开发平台ModelArts

GPU个数，可选，默认不使用，支持配置小数，输入值不能小于0（最多支持2位小数，小数点后第3位做四舍五入处理）。 memory Integer 内存，单位为MB，仅支持整数。 cpu Float CPU核数，支持配置小数，输入值不能小于0.01（最多支持2位小数，小数点后第3位做四舍五入处理）。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

WebSocket客户端和服务端双向传输数据 WebSocket连接的建立打开Postman（需选择8.5 以上版本，以10.12.0为例）工具，单击左上角，选择“File>New”，弹出新建对话框，选择“WebSocket Request”（当前为beta版本）功能：图1 选择WebSocket

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
创建并管理工作空间 - AI开发平台ModelArts

训练作业CPU规格训练核数默认无限制，支持设置1~10000。核训练作业GPU规格训练卡数默认无限制，支持设置1~1000。卡训练作业RAM规格训练内存大小默认无限制，支持设置1~100000。 GB 智能标注GPU规格使用时长默认无限制，支持设置1~60000。分钟工作空间的配额

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

代码中ModelLink、MindSpeed已升级到最新版本，Python三方依赖版本已升级，其中： MindSpeed的版本升级到commitID=4ea42a23 ModelLink的版本升级到commitID=8f50777 transformers版本升级到4.45.0 peft版本升级到0.12.0 支持的模型列表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
查询服务详情 - AI开发平台ModelArts

GPU个数，可选，默认不使用，支持配置小数，输入值不能小于0（最多支持2位小数，小数点后第3位做四舍五入处理）。 memory Integer 内存，单位为MB，仅支持整数。 cpu Float CPU核数，支持配置小数，输入值不能小于0.01（最多支持2位小数，小数点后第3位做四舍五入处理）。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

--local-dir <模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了git clone repo_url 的方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
集成在线服务API至生产环境中应用 - AI开发平台ModelArts

线服务API，SDK调用方式请参见《SDK参考》>“场景1：部署在线服务Predictor的推理预测”。除此之外，您还可以使用常见的开发工具及开发语言调用此接口，建议通过互联网搜索并获取调用标准Restful API的指导。父主题：管理同步在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
更新服务配置 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable 否 Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 te

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

连接。更多Screen使用说明可参考Screen User's Manual。通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题本文指导用户通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题。在ModelArts Standard控制台，选择“模型训练>训练作业”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

--local-dir <模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了git clone repo_url 的方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

--local-dir <模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了git clone repo_url 的方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。 shm-size：共享内存大小。 ${container_name}：容器名称，进入容器时会用到，此处可以自己定义一个容器名称。 ${image_id}：镜像ID，通过docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

Lite Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Atlas 300I Duo。表1 资源规格要求名称版本资源规格 Atlas 300I Duo PyTorch 2.1.0 驱动 24

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
运行第一条Workflow - AI开发平台ModelArts

径。资源配置训练资源规格配置，根据实际需要选择公共资源规格或者专属资源池。说明：华北-北京四可支持选择限时免费的资源规格，其余规格均为收费规格，请在使用完之后，及时停止或删除实例，避免产生不必要的费用。如果您购买了套餐包，可优先选择您对应规格的套餐包，在“配置费用”页

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
查询训练作业参数详情 - AI开发平台ModelArts

gpu_type String 资源规格gpu的类型。 create_time Long 训练作业参数创建时间。 cpu String 资源规格CPU内存。 gpu_num Integer 资源规格gpu的个数。 core String 资源规格的核数。 dataset_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
精度问题概述 - AI开发平台ModelArts

是很常规的现象，并非错误。为了更好地了解这种计算差异，并且能够正确区分正常计算差异和引起模型精度问题的异常差异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
推理场景介绍 - AI开发平台ModelArts

本教程需要使用到的AscendCloud-3rdLLM-xxx.zip软件包中的关键文件介绍如下。 ├──llm_tools #推理工具包 ├──llm_evaluation #推理评测代码包 ├──benchmark_eval # 精度评测

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
Manifest管理概述 - AI开发平台ModelArts

8处理能力。 Manifest文件中文本分类的source数值可以包含中文，其他字段不建议用中文。 Manifest文件可以由用户、第三方工具或ModelArts标注系统生成。 Manifest文件名没有特殊要求，可以为任意合法文件名。父主题： Manifest管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

--local-dir <模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了 git clone repo_url 的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 1061

上一页
1
...
31
32
33
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

集成在线服务API至生产环境中应用 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线