搜索_华为云

如何定位Workflow运行报错 - AI开发平台ModelArts

确认安装的SDK包是否是最新版本，避免出现包版本不一致问题。检查编写的SDK代码是否符合规范，具体可参考相应的代码示例。检查运行过程中输入的内容是否正确，格式是否与提示信息中要求的一致。根据具体报错信息定位到报错的代码行，分析上下文逻辑。历史SDK包常见的报错如下服务部署节点运行报错输入服务相关的参数后，执行报错如下：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Workflow
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

py3-none-any.whl -noverify > ./test 本示例以软件包在D:\举例，请根据软件包实际路径修改。步骤二：配置运行环境检查本地环境是否已安装Python。如果环境中没有安装Python，可从Python官网下载并安装合适的Python版本。Python版本需大于3

帮助中心 > AI开发平台ModelArts > SDK参考
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

–json-key标志更改数据集文本字段的名称，默认为text。在维基百科数据集中，它有四列，分别是id、url、title和text。可以指定–json-key标志来选择用于训练的列。 { 'id': '1', 'url': 'https://simple.wikipedia

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
更新训练作业描述 - AI开发平台ModelArts

表2 update_job_configs请求参数说明参数是否必选参数类型描述 description 是 String 需要更改的训练作业的描述信息。无成功响应参数表3 调用训练接口失败响应参数参数类型描述 error_msg String 调用失败时的错误信息，调用成功时无此字段。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆盖权重文件保存路径，作为最终的权重保存路径。修改代码如图2。图2 修改权重保存路径多机训练场景下，需要将CODE_DIR修改为OBS_CODE_DIR目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

实际情况更改。单击“Apply”，配置完成后，重启IDE生效。重启后初次进行update python interpreter需要耗费20分钟左右。 Step5 使用插件连接云上Notebook 与Notebook断开连接的状态下，单击Notebook名称，根据提示启动本地I

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

llama2-70b https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface.co/meta-llama/Llama-2-70b-chat-hf (推荐) 4 llama3 llama3-8b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆盖权重文件保存路径，作为最终的权重保存路径。修改代码如图2。图2 修改权重保存路径多机训练场景下，需要将CODE_DIR修改为OBS_CODE_DIR目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
在ModelArts中同一个账户，图片展示角度不同是为什么？ - AI开发平台ModelArts

L代表last，L3-产品版本上线时最新的3个稳定浏览器版本。如果您当前使用的浏览器版本过低，将在一定程度上影响页面的显示效果，系统会提示您尽快对浏览器进行升级。如果您当前使用的浏览器不支持访问管理控制台，系统会建议您对浏览器进行升级或安装支持的浏览器。表1 PC端浏览器兼容性一览表

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
服务启动失败 - AI开发平台ModelArts

拉取镜像失败服务启动失败，提示拉取镜像失败，请参考服务部署、启动、升级和修改时，拉取镜像失败如何处理？资源不足，服务调度失败服务启动失败，提示资源不足，服务调度失败，请参考服务部署、启动、升级和修改时，资源不足如何处理？内存不足服务启动失败，提示内存不足，请参考内存不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

单击“立即注册”。图7 选择已上传的镜像源 Step9 通过openssl创建SSL pem证书在ECS中执行如下命令，会在当前目录生成cert.pem和key.pem，并将生成的pem证书上传至OBS。证书用于后续在推理生产环境中部署HTTPS推理服务。 openssl genrsa

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

为默认的工作空间。 ai_project 否 String 指定算法所属的ai项目，默认值为"default-ai-project"。ai项目已下线，无需关注。表4 AlgorithmJobConfig 参数是否必选参数类型描述 code_dir 否 String 算法的代码

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
数据集版本不合格 - AI开发平台ModelArts

数据集版本不合格出现此问题时，表示数据集版本发布成功，但是不满足自动学习训练作业要求，因此出现数据集版本不合格的错误提示。标注信息不满足训练要求针对不同类型的自动学习项目，训练作业对数据集的要求如下。图像分类：用于训练的图片，至少有2种以上的分类（即2种以上的标签），每种分类的图片数不少于5张。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
云上迁移适配故障 - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” 使用moxing适配OBS路径，pandas读取文件报错日志提示“Please

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

llama2-70b https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface.co/meta-llama/Llama-2-70b-chat-hf (推荐) 4 llama3 llama3-8b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
GPU相关问题 - AI开发平台ModelArts

GPU相关问题日志提示"No CUDA-capable device is detected" 日志提示“RuntimeError: connect() timed out” 日志提示“cuda runtime error (10) : invalid device ordinal

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
业务代码问题 - AI开发平台ModelArts

bool” 日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” 日志提示“Out of bounds nanosecond timestamp” 日志提示“Unexpected keyword argument passed to optimizer” 日志提示“no socket

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
重建、停止或删除训练作业 - AI开发平台ModelArts

重建、停止或删除训练作业另存为算法当您需要修改训练作业的算法时，可以在训练作业详情页面右上角，单击“另存为算法”。在“创建算法”页面中，会自动填充上一次训练作业的算法参数配置，您可以根据业务需求在原来算法配置基础上进行修改。订阅算法不支持另存为算法。重建训练作业当对创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
释放Lite Server资源 - AI开发平台ModelArts

委托。在弹性裸金属列表中，单击的“退订”，跳转至“退订资源”页面。根据界面提示，确认需要退订的资源，并选择退订原因。图2 退订资源确认退订信息无误后，勾选“我已确认……”和“资源退订后……”提示信息。单击“退订”，再次根据界面信息确认要退订的资源。再次单击“退订”，完成包年/包月资源的退订操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

通过自定义镜像创建模型失败导入模型后部署服务，提示磁盘不足创建模型成功后，部署服务报错，如何排查代码问题自定义镜像导入配置运行时依赖无效通过API接口查询模型详情，model_name返回值出现乱码导入模型提示模型或镜像大小超过限制导入模型提示单个模型文件超过5G限制订阅的模型一直处于等待同步状态

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署

总条数： 1357

上一页
1
...
7
8
9
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何定位Workflow运行报错 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在ModelArts中同一个账户，图片展示角度不同是为什么？ - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

数据集版本不合格 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

GPU相关问题 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线