搜索_华为云

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

但是达不到预期，可能是nv_peer_mem异常。处理方法查看nv_peer_mem是否已安装。 dpkg -i | grep peer 如果未安装则需要安装，安装方法参考装机指导。如果已安装则进入下一检测项。查看该软件是否已经加载至内核。 lsmod | grep peer

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

ch环境或没有安装Cuda的镜像，而不是选择一个PyTorch引擎和Cuda都不满足的镜像，如MindSpore+Cuda11.X，这样基础镜像就会很大，同样的操作最终目的镜像就很大。此外下面举出几种常见的减少镜像大小的方式。减少目的镜像层数举例：假设需要安装两个pip包s

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

2k条指令和演示的数据集。这些指令数据可以用来对语言模型进行指令调优，使语言模型更好地遵循指令。预训练使用的Alpaca数据集下载：https://huggingface.co/datasets/tatsu-lab/alpaca/resolve/main/data/train-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

peer-memory四个软件。但是如果nvidia和cuda是使用runfile(local)方式安装的，那么需要在下一步中再次卸载。若使用nvidia run包直接安装的驱动，需要找到对应的卸载命令。 sudo /usr/bin/nvidia-uninstall sudo

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

error from cudaGetDeviceCount() 原因分析经过对裸金属服务器排查，发现nvidia-drvier和cuda都已安装，并且正常运行。nvidia-fabricmanager服务可以使单节点GPU卡间互联，在多卡GPU机器上，出现这种问题可能是nvidia-fabricmanger异常导致。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查询团队标注验收任务报告 - AI开发平台ModelArts

验收总分。 unchecked_sample_count Integer 未验收的样本数目。请求示例查询团队标注验收任务报告 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/workforce-tasks/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
无法导入模块 - AI开发平台ModelArts

训练作业导入模块时日志出现前两条报错信息，可能原因如下：代码如果在本地运行，需要将“project_dir”加入到PYTHONPATH或者将整个“project_dir”安装到“site-package”中才能运行。但是在ModelArts可以将“project_dir”加入到“sys.path”中解决该问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
使用Msprobe工具分析偏差 - AI开发平台ModelArts

观察上一章Loss趋势，在首个Step有较小偏差，所以对第一个Step进行比对分析。此处使用Msprobe的整网Dump和比对分析功能。首先安装社区Msprobe工具，命令如下： pip install mindstudio-probe 使能工具进行数据Dump分析。本实验可在train

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
删除AI应用 - AI开发平台ModelArts

error_code String 删除该模型失败的错误码。 model_id String 删除失败的模型id。请求示例 DELETE https://{endpoint}/v1/{project_id}/models/{model_id} 响应示例状态码：200 删除成功或者失败的提示信息。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询标注团队列表 - AI开发平台ModelArts

String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求示例查询标注团队列表 GET https://{endpoint}/v2/{project_id}/workforces 响应示例状态码： 200 OK { "total_number"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
新建消息订阅Subscription - AI开发平台ModelArts

"job_step:stop" ]”。订阅Workflow失败、完成和job_step节点停止三个事件，发生这三个事件时，会有消息提醒。 POST https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/subscriptions

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例 DELETE https://{endpoint}/v1/{project_id}/services/{service_id}/app-auth-apis/{api_id}

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应work-0日志OBS临时链接为例。 GET https://endpoint/v2/{project_id}/training-jobs/2cd88daa-31a4-40a8-a58f-d1

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 eagle 投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
ModelArts入门实践 - AI开发平台ModelArts

面向熟悉代码编写和调测的AI工程师 ModelArts Standard推理部署使用Standard一键完成商超商品识别模型部署本案例以“商超商品识别”模型为例，介绍从AI Gallery订阅模型，一键部署到ModelArts Standard，并进行在线推理预测的体验过程。面向AI开发零基础的用户

 帮助中心 > AI开发平台ModelArts > 快速入门
如何保证自定义镜像能不因为超过35G而保存失败？ - AI开发平台ModelArts

-user/work以外的目录，请将数据集等放到work路径下，不要放到非work路径下。请不要将实例频繁保存镜像，建议一次将需要的安装包安装好，然后执行镜像保存，避免频繁执行镜像保存的动作，保存次数越多镜像越大，且多次保存后的镜像过大问题无法通过清理磁盘方式减少镜像的大小（Docker保存原理机制）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
Ascend-vLLM介绍 - AI开发平台ModelArts

多lora挂载，多个不同微调模型共用一份权重同时部署。控制输出 Guided Decoding 通过特定模式控制模型输出。 Beam search 通过beamsearch输出多个候选结果。分离部署 PD分离部署全量、增量分离部署，提高资源利用率，提升体验。剪枝 FASP (Fast

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
推理业务迁移评估表 - AI开发平台ModelArts

stable-diffusion套件使用differusers （https://github.com/huggingface/diffusers）。 stable-diffusion-webui （https://github.com/AUTOMATIC1111/stable-diffusion-webui）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

2k条指令和演示的数据集。这些指令数据可以用来对语言模型进行指令调优，使语言模型更好地遵循指令。预训练使用的Alpaca数据集下载：https://huggingface.co/datasets/tatsu-lab/alpaca/resolve/main/data/train-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1748

上一页
1
...
75
76
77
...
88
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

查询团队标注验收任务报告 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

删除AI应用 - AI开发平台ModelArts

查询标注团队列表 - AI开发平台ModelArts

新建消息订阅Subscription - AI开发平台ModelArts

删除API - AI开发平台ModelArts

查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

如何保证自定义镜像能不因为超过35G而保存失败？ - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线