搜索_华为云

模型转换报错如何查看日志和定位？ - AI开发平台ModelArts

模型转换报错如何查看日志和定位？通过如下的配置项打开对应的模型转换日志，可以看到更底层的报错。如配置以下的环境变量之后，再重新转换模型，导出对应的日志和dump图进行分析：报错日志中搜到“not support onnx data type”，表示MindSpore暂不支持该算子。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

<img>img_path</img>\n{your prompt}，其中id表示对话中的第几张图片。"img_path"可以是本地的图片或网络地址。如果是本地图片，容器需要有权限读取图片。网络图片服务端会自动下载。 messages的样例如下： # body参考 # 图片存放本地示例 { "messages":

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？问题现象 Notebook中，运行训练代码出现如下错误。 cudaCheckError() failed : no kernel image is available for execution on the device

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
训练专属资源池如何与SFS弹性文件系统配置对等链接？ - AI开发平台ModelArts

训练专属资源池如何与SFS弹性文件系统配置对等链接？配置训练专属资源池与SFS弹性文件系统的对等链接，需要资源池打通VPC，使得资源池与SFS弹性文件系统所配置的VPC相同。配置完成后，在创建训练作业时，就可以看到SFS的配置选项。打通VPC步骤请参考打通VPC。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
资源管理 - AI开发平台ModelArts
资源管理 - AI开发平台ModelArts

资源管理查询OS的配置参数查询插件模板查询节点列表批量删除节点批量重启节点查询事件列表创建网络资源查询网络资源列表查询网络资源删除网络资源更新网络资源查询资源实时利用率创建资源池查询资源池列表，可通过标签、资源池状态筛选查询资源池列表查询资源池删除资源池

 帮助中心 > AI开发平台ModelArts > API参考
访问边缘服务 - AI开发平台ModelArts

访问边缘服务当边缘服务和边缘节点的状态都处于“运行中”状态，表示边缘服务已在边缘节点成功部署。您可以通过以下两种方式，在能够访问到边缘节点的网络环境中，对部署在边缘节点上的边缘服务发起预测请求。方式一：使用图形界面的软件进行预测（以Postman为例）方式二：使用curl命令发送预测请求

 帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 部署AI应用（部署上线） > 部署AI应用（边缘服务）
模型转换失败时如何查看日志和定位原因？ - AI开发平台ModelArts

模型转换失败时如何查看日志和定位原因？在模型转换的过程，如果出现模型转换失败，可以参考以下步骤查看日志并定位原因：设置DEBUG日志。设置MindSpore日志环境变量。 #shell export GLOG_v=0 # 0-DEBUG、1-INFO、2-WARNING、3-ERROR

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 常见问题
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致云上挂载路径 Notebook中挂载SFS后，SFS默认在“/home/ma-user/work”路径下。在创建训练作业时，设置SFS Turbo的“云上挂载路径”为“/home/ma-user/work”，使得训练环境下SFS也在“/home/ma-user/work”路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
创建训练作业时提示“对象目录大小/数量超过限制”，如何解决？ - AI开发平台ModelArts

创建训练作业时提示“对象目录大小/数量超过限制”，如何解决？问题分析创建训练作业选择的代码目录有大小和文件个数限制。解决方法将代码目录中除代码以外的文件删除或存放到其他目录，保证代码目录大小不超过128MB，文件个数不超过4096个。父主题：创建训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
数据标注中，难例集如何定义？什么情况下会被识别为难例？ - AI开发平台ModelArts

数据标注中，难例集如何定义？什么情况下会被识别为难例？难例是指难以识别的样本，目前只有图像分类和检测支持难例。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
FAQ - AI开发平台ModelArts
FAQ - AI开发平台ModelArts

CUDA和CUDNN CloudShell调试方法 run.sh脚本测试ModelArts训练整体流程 ModelArts环境挂载目录说明如何查看训练环境变量 infiniband驱动的安装 Tensorboard的使用如何保证训练和调试时文件路径保持一致父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
GPU A系列裸金属服务器没有任务但GPU被占用如何解决 - AI开发平台ModelArts

GPU A系列裸金属服务器没有任务但GPU被占用如何解决问题现象服务器没有任务，但GPU显示被占用。图1 显卡运行状态处理方法 nvidia-smi -pm 1 父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
调用API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

调用API接口创建训练作业和部署服务时，如何填写资源池的参数？调用API接口创建训练作业时，“pool_id”为“资源池ID”。调用API接口部署在线服务时，“pool_name”为“资源池ID” 。图1 资源池ID 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

导入模型时，模型配置文件中的安装包依赖参数如何编写？问题描述从OBS中或者从容器镜像中导入模型时，开发者需要编写模型配置文件。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件为JSON格式。配置文件中的“dependencies

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
在推理生产环境中部署推理服务 - AI开发平台ModelArts

“预测”既可看到预测结果。图5 预测-openai 在线服务的更多内容介绍请参见文档查看服务详情。 Step5 推理性能测试推理性能测试操作请参见推理性能测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
数据类型不匹配问题如何处理？ - AI开发平台ModelArts

数据类型不匹配问题如何处理？报错“data type not equal”时，按照堆栈信息，将对应的行数的数据类型修改为匹配的类型。图1 报错信息处理该问题时，pipeline_onnx_stable_diffusion_img2img_mslite.py文件的第454行修改如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 常见问题
主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
配置Lite Server存储 - AI开发平台ModelArts

存放的是二进制数据，无法直接存放文件，如果需要存放文件，需要先格式化文件系统后使用。访问方式在BMS中通过网络协议挂载使用，支持NFS和CIFS的网络协议。需要指定网络地址进行访问，也可以将网络地址映射为本地目录后进行访问。可以通过互联网或专线访问。需要指定桶地址进行访问，使用的是HTTP和HTTPS等传输协议。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
推理业务迁移评估表 - AI开发平台ModelArts

模型参数规模，是否涉及分布式推理 10B/100B，单机多卡推理。 - 能否提供实际模型、网络验证的代码和数据等信息提供实际模型、网络验证的代码和数据。提供与业务类型类似的开源模型，例如GPT3 10B/13B。提供测试模型以及对应的Demo代码路径（开源或共享）。可以提前的完成POC评估

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
部署模型为在线服务 - AI开发平台ModelArts

服务的“状态”变为“运行中”时，表示服务部署完成。使用预测功能测试在线服务 AI应用部署为在线服务成功后，您可以在“预测”页签进行代码调试或添加文件测试。根据AI应用定义的输入请求不同（JSON文本或文件），测试服务包括如下两种方式： JSON文本预测：如当前部署服务的AI应用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业

总条数： 804

上一页
1
...
14
15
16
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型转换报错如何查看日志和定位？ - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

训练专属资源池如何与SFS弹性文件系统配置对等链接？ - AI开发平台ModelArts

资源管理 - AI开发平台ModelArts

访问边缘服务 - AI开发平台ModelArts

模型转换失败时如何查看日志和定位原因？ - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

创建训练作业时提示“对象目录大小/数量超过限制”，如何解决？ - AI开发平台ModelArts

数据标注中，难例集如何定义？什么情况下会被识别为难例？ - AI开发平台ModelArts

FAQ - AI开发平台ModelArts

GPU A系列裸金属服务器没有任务但GPU被占用如何解决 - AI开发平台ModelArts

调用API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

数据类型不匹配问题如何处理？ - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线