搜索_华为云

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

enabled” 原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

\ --memory_efficient \ --eval 参数介绍： model：必选，要进行压缩的原始模型地址 save：必选，压缩后模型的保存的地址 dataset：可选，压缩模型所用的校准数据，可选范围["wikitext2"，"c4"]，默认wikitext2。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

安全组，默认为空，当配置了vpc_id则此参数必填。安全组起着虚拟防火墙的作用，为服务实例提供安全的网络访问控制策略。安全组须包含至少一条入方向规则，对协议为TCP、源地址为0.0.0.0/0、端口为8080的请求放行。 subnet_network_id 否 String 子网的网络ID，默认为空，当配置了

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
批量更新团队标注样本的标签 - AI开发平台ModelArts

样本用处。可选值如下： TRAIN：训练 EVAL：验证 TEST：测试 INFERENCE：推理 source 否 String 样本数据源地址，通过调用样本列表接口获取。 worker_id 否 String 团队标注的成员ID。表4 SampleLabel 参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
上传文件至OBS - AI开发平台ModelArts

会话对象。 src_local_file 是 String 本地需要上传的文件路径。 dst_obs_dir 是 String 上传的目标OBS桶地址，必须以“obs://”作为前缀，上传的目标文件夹后缀必须以“/”结尾。表2 失败响应参数说明参数参数类型描述 error_code

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

号赋SWR权限，子账号从SWR Console界面看不到该镜像，需要主账号给子账号在SWR侧赋予SWR权限，使得子账号可以看到该SWR镜像地址，否则该镜像子账号不可使用。该镜像不属于该租户（包括主账号和子账号），是其他人共享的public镜像，而这个镜像又被镜像所有者删除，导致

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
执行训练任务（历史版本） - AI开发平台ModelArts

ORIGINAL_HF_WEIGHT：加载tokenizer与Hugging Face权重对应的存放目录地址。否，设置以下变量 ORIGINAL_HF_WEIGHT：加载tokenizer与Hugging Face权重对应的存放地址在“输出”的输入框内设置变量：OUTPUT_SAVE_DIR、HF_SAV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
批量更新样本标签 - AI开发平台ModelArts

样本用处。可选值如下： TRAIN：训练 EVAL：验证 TEST：测试 INFERENCE：推理 source 否 String 样本数据源地址，通过调用样本列表接口获取。 worker_id 否 String 团队标注的成员ID。表4 SampleLabel 参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts的Notebook是否支持Keras引擎？ - AI开发平台ModelArts

Keras是一个用Python编写的高级神经网络API，它能够以TensorFlow、CNTK或者Theano作为后端运行。Notebook开发环境支持“tf.keras”。如何查看Keras版本在ModelArts管理控制台，创建一个Notebook实例，镜像选择“TensorFlow-1.13”或“TensorFlow-1

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

_wirte_check_passed = True df = pd.read_csv(ff, **param) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

（https://github.com/AUTOMATIC1111/stable-diffusion-webui）。如果是基于其他开源，需要附带开源代码仓地址。 - 具体使用库例如：使用了哪个pipeline （例如lpw_stable_diffusion.py）。使用了哪个huggingface的模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
Lite Server部署推理服务 - AI开发平台ModelArts

NPU底层tls校验行为置0操作 for i in {0..7};do hccn_tool -i $i -tls -s enable 0;done 获取每张卡的ip地址。 for i in {0..7};do hccn_tool -i $i -ip -g; done 配置rank_table_file.j

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练作业失败，返回错误码139 - AI开发平台ModelArts

通和跑不通的日志是否存在pip源更新了依赖包，如下图，安装之前跑通的老版本即可。图1 PIP安装对比图推荐您使用本地Pycharm远程连接Notebook调试。如果上述情况都解决不了，请联系技术支持工程师。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

显的改善。同样功能的PyTorch Pipeline，因为指导要求适配onnx pipeline，两个pipeline本身功能就有差别，如何适配？由于Diffusers社区的“single model file policy”设计原则，不同的pipeline是不同路径在独立演

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

总条数： 1183

上一页
1
...
45
46
47
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

上传文件至OBS - AI开发平台ModelArts

在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

ModelArts的Notebook是否支持Keras引擎？ - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Lite Server部署推理服务 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线