搜索_华为云

管理Lite Cluster节点 - AI开发平台ModelArts

删除/退订/释放节点可能导致该节点上运行的作业失败，请保证该节点无任务运行时再进行操作。当资源池中存在异常节点时，可通过删除/退订/释放操作，将资源池中指定的异常节点移除，再通过扩容专属资源池获得和之前相同的总节点个数。仅有一个节点时，无法进行删除/退订/释放操作。续费/开通自动续费/修改自动续费

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

方式二：对于提供了onnx模型的仓库，可以直接下载onnx模型。通过git下载diffusers对应版本的源码。 git clone https://github.com/huggingface/diffusers.git -b v0.11.1 在diffusers的script

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
查询服务监控信息 - AI开发平台ModelArts

String 模型版本。 invocation_times Number 模型实例的总调用次数。 failed_times Number 模型实例调用失败次数。 cpu_core_usage Float 已使用CPU核数。 cpu_core_total Float 总CPU核数。 cpu_memory_usage

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

华为云根据客户等级定义了不同客户的宽限期和保留期时长。在专属资源池到期前均可开通自动续费，到期前7日凌晨3:00首次尝试自动续费，如果扣款失败，每天凌晨3:00尝试一次，直至专属资源池到期或者续费成功。到期前7日自动续费扣款是系统默认配置，您也可以根据需要修改此扣款日。父主题：

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
在Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

在Notebook中，如何访问其他账号的OBS桶？创建Notebook时选择OBS存储，这种情况下只能访问到自己账号下的桶，无法访问到其他账号的OBS桶。如果需要在Notebook中，访问其他账号的OBS文件，前提是，需获取目标OBS桶的读写权限。首先，请联系OBS桶的创建

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

是本地缓存，在每次触发flush时将该summary文件覆盖OBS上的原文件。当超过5GB后，由于达到了OBS单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法： import

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
复制数据至容器中空间不足 - AI开发平台ModelArts

复制数据至容器中空间不足问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致数据无法复制至容器中。 OSError:[Errno 28] No space left on device 原因分析数据下载至容器的位置空间不足。处理方法请排查是否将数据下载至“

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

功能正式下线。下线范围下线Region：华为云全部Region。下线影响 ModelArts自动学习-文本分类正式下线后，所有用户将无法使用自动学习的文本分类功能创建项目，但仍可查看历史使用文本分类功能创建的作业。如您有任何问题，可随时通过工单或者服务热线（+86-400

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
Notebook的自定义镜像制作方法 - AI开发平台ModelArts

t权限，运行中的Notebook实例中无root权限，所以在Notebook实例中安装需要root权限的软件，目前在预置的开发环境镜像中是无法实现的。用户可以使用ModelArts提供的基础镜像或用户第三方镜像来编写Dockerfile，构建出完全适合自己的镜像。 Notebook自定义镜像制作流程

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

ModelArts使用过程中涉及到OBS、SWR等服务交互，需要用户配置委托授权，允许ModelArts访问这些依赖服务。如果没有授权，ModelArts的部分功能将不能正常使用。约束与限制只有主账号可以使用委托授权，可以为当前账号授权，也可以为当前账号下的所有IAM用户授权。多个IAM用户或账号，可使用同一个委托。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

-p 8585:8585: 映射端口号 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。步骤三：进入容器通过容器名称进入容器中。默认使用ma-user用户执行后续命令。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

8585:8585：映射端口号，用户可自定义未被占用的端口号。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。步骤三：进入容器通过容器名称进入容器中。默认使用ma-user用户执行后续命令。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
重建、停止或删除训练作业 - AI开发平台ModelArts

训练作业停止后，ModelArts将停止计费。运行结束的训练作业，如“已完成”、“运行失败”、“已终止”、“异常”的作业，不涉及“终止”操作。删除训练作业如果不再需要使用此训练作业，建议清除相关资源，避免产生不必要的费用。请注意，删除训练作业后无法恢复，请谨慎操作。在“训练作业”页面，删除运行结束的训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
配置仪表盘查看指标数据 - AI开发平台ModelArts

集群视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Cluster-View.json 节点视图 https://cnnorth4-modelarts-sdk

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

从内核中卸载nvidia相关的所有进程。在安装nvidia驱动时，必须把内核中加载nvidia相关的进程卸载，否则会失败。具体操作请参考卸载nvidia驱动。若遇到加载到内核的nvidia进程循环依赖，无法从内核中卸载nvidia，此时执行reboot命令重启服务器即可。安装NVIDIA-515和CUDA-11

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
查询网络资源列表 - AI开发平台ModelArts

NetworkMetadataAnnotations 参数参数类型描述 os.modelarts/description String 网络资源描述，用于说明用于某种场景。不能包含字符!<>=&"'。表9 NetworkSpec 参数参数类型描述 cidr String 网络的cidr。取值范围： 172.16

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
更新服务配置 - AI开发平台ModelArts

update_service_config返回参数说明参数是否必选参数类型描述 error_code 是 String 调用失败时，的错误码。调用成功时，无此字段。 error_msg 是 String 调用失败时，错误信息。调用成功时，无此字段。父主题：服务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

总条数： 1240

上一页
1
...
35
36
37
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Lite Cluster节点 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

在Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

Notebook的自定义镜像制作方法 - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

查询网络资源列表 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线