搜索_华为云

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

enabled” 原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

举例：假设需要安装两个pip包six，numpy，将安装放到同一层，而不是放到不同层：正确方式： RUN pip install six &&\ pip install numpy 不宜方式： RUN pip install six RUN pip install numpy

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
查询服务更新日志 - AI开发平台ModelArts

的实例数。 max_unavailable Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 termination_grace_period_seconds Integer 容器优雅停止时间。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
日志提示“ Network is unreachable” - AI开发平台ModelArts

load(checkpoint) model1.load_state_dict(state_dict) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
从OBS目录导入数据规范说明 - AI开发平台ModelArts

<filename>bike_1_1593531469339.png</filename> <source> <database>Unknown</database> </source> <size> <width>554</width>

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI Gallery工具链服务部署完成后将一直处于“运行中”。指定时长：设置作业运行几小时后停止，当AI Gallery工具链服务运行时长达到指定时长时，系统将会暂停作业。时长设置不能超过计算资源的剩余额度。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
查询数据集标签列表 - AI开发平台ModelArts

version_id 否 String 数据集版本ID。 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100000]，默认为100000。请求参数无响应参数状态码： 200 表3 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
重试/停止/运行Workflow节点 - AI开发平台ModelArts

行状况页面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
获取训练作业事件列表 - AI开发平台ModelArts

结束时间，需要与开始时间一起传入。 level 否 String 指定返回的事件级别，取值范围[Info Error Warning]。 pattern 否 String 指定事件信息包含的内容，最长256个字符。 source 否 String 指定返回的事件来源，取值范围为[K8S Job Task]。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用基础镜像 - AI开发平台ModelArts

/home/ma-user/modelarts/user-job-dir/AscendSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Megatron-DeepSpeed pip install -r requirements.txt -i http://mirrors.myhuaweicloud.com/pypi/web/simple --trusted-host mirrors.myhuaweicloud.com pip install

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

_wirte_check_passed = True df = pd.read_csv(ff, **param) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
使用基础镜像 - AI开发平台ModelArts

/home/ma-user/modelarts/user-job-dir/AscendSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
查看Standard专属资源池详情 - AI开发平台ModelArts

进行的操作不一致，具体以控制台显示为准。在“基本信息”的“网络”中，可单击关联的资源池中的数字，查看关联的资源池。可以查看该网络中可用的IP数量。在扩展信息中可以查看监控、作业、节点、规格、事件、标签，详细介绍见下文。查看资源池中的作业在资源池详情页，切换到“作业”页签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
附录：指令微调训练常见问题 - AI开发平台ModelArts

module named 'multipart'"报错：截图如下：解决措施：可更新python-multipart为0.0.12版本，具体步骤如下：启动训练任务前更新python-multipart版本： pip install python-multipart==0.0.12 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
训练精度测试 - AI开发平台ModelArts

客户使用工具自带精度基线Yaml则需使用accuracy_cfgs.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k和mmlu、ceval数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
Standard资源管理 - AI开发平台ModelArts

专属资源池有什么能力？新版专属资源池是一个全面的技术和产品的改进，主要能力提升如下：专属资源池类型归一：不再区分训练、推理专属资源池。如果业务允许，您可以在一个专属资源池中同时跑训练和推理的Workload。同时，也可以通过“设置作业类型”来开启/关闭专属资源池对特定作业类型的支持。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
数字人模型训练推理 - AI开发平台ModelArts

数字人模型训练推理 Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践
上传本地文件至JupyterLab - AI开发平台ModelArts

'/home/ma-user/work/obs_file.txt') 如果下载到Notebook中的是zip文件，在Terminal中执行下列命令，解压压缩包。 unzip xxx.zip #在xxx.zip压缩包所在路径直接解压代码执行完成后，参考图13打开Terminal后执行ls /ho

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
读取文件报错，如何正确读取文件 - AI开发平台ModelArts

np.uint8), 1) 在MXNet环境下使用torch包，请您尝试如下方法先进行导包： import os os.sysytem('pip install torch') import torch 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障

总条数： 1393

上一页
1
...
54
55
56
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

数字人模型训练推理 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

读取文件报错，如何正确读取文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线