搜索_华为云

附录：大模型推理standard常见问题 - AI开发平台ModelArts

附录：大模型推理standard常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
注册API并授权给APP - AI开发平台ModelArts

auth_id String 授权编号，授权失败时为空。 reason String 授权或者取消授权失败原因，授权成功时为空。 success Boolean 授权或者取消授权是否成功。状态码： 400 表9 响应Header参数参数参数类型描述 X-Request-Id

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
附录：指令微调训练常见问题 - AI开发平台ModelArts

调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框架的选择，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO-2以此类推，重新训练如未解决则执行下一步。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
ModelArts计费模式概述 - AI开发平台ModelArts

专属资源池公共资源池、专属资源池适用功能模块 Standard自动学习、Workflow、Notebook、模型训练、模型部署 Lite Cluster Lite Server Standard自动学习、Workflow、Notebook、模型训练、模型部署变更计费模式不支持支持变更为包年/包月计费模式。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 ModelArts Standard提供了Cloud Shell，可以登录运行中的容器，用于调试生产环境的训练作业。约束限制仅专属资源池支持使用Cloud Shell登录训练容器，且训练作业必须处于“运行中”状态。前提条件：给子账号配置允许使用Cloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
管理ModelArts服务的委托授权 - AI开发平台ModelArts

OK”表示删除成功，响应Body如下所示： { "result": true, "success_message": "Delete all-users auth info successfully!" } 父主题：应用示例

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
创建导入任务 - AI开发平台ModelArts

SourceInfo 参数是否必选参数类型描述 cluster_id 否 String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新团队标注验收任务状态 - AI开发平台ModelArts

/v2/{project_id}/datasets/{dataset_id}/workforce-tasks/{workforce_task_id}/acceptance/status 表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts中常用概念 - AI开发平台ModelArts

Standard专属资源池需单独创建，专属使用，不与其他用户共享。 ModelArts Lite Server和ModelArts Lite Cluster使用的都是专属资源池。 MoXing MoXing是ModelArts自研的组件，是一种轻型的分布式框架，构建于TensorFlow、

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
查询单个智能标注样本的信息 - AI开发平台ModelArts

sample_id 是 String 样本ID。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 check_accept Boolean 是否验收通过，用于团队标注。可选值如下： true：验收通过 false：验收不通过 check_comment String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

在已有的ModelArts委托权限中，追加IAM ReadOnlyAccess权限。在ModelArts管理控制台，单击“权限管理 ”，在对应委托的操作列，单击“查看权限 > 去IAM修改委托权限”。在新页面中，单击“授权记录 > 授权”，搜索“IAM ReadOnlyAccess”，勾选后单击“下一步”并单击“确认”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查询数据集的统计信息 - AI开发平台ModelArts

查询指定样本状态下的统计信息。可选样本状态如下： __ALL__：已标注 __NONE__：未标注 __UNCHECK__：待验收 __ACCEPTED__：验收通过 __REJECTED__：已驳回 __UNREVIEWED__：待审核 __REVIEWED__：已审核 __WO

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
快速配置ModelArts委托授权 - AI开发平台ModelArts

作提示追加授权即可。为什么专属资源池需要增加CCE、BMS、IMS、DEW相关授权？专属资源池能力升级，新上线ModelArts Lite功能，这项功能需要用户授权允许ModelArts访问云容器引擎服务CCE、裸金属服务BMS、镜像服务IMS和密钥管理服务DEW。当用户未使用ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘本文介绍了如何将Notebook的Conda环境迁移到SFS磁盘上。这样重启Notebook实例后，Conda环境不会丢失。步骤如下: 创建新的虚拟环境并保存到SFS目录克隆原有的虚拟环境到SFS盘重新启动镜像激活SFS盘中的虚拟环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

526f3be8c68-ma-platform-init-worker-0-172.16.24.51-01909681.log?AWSAccessKeyId=xxxxx" } 状态码状态码描述 200 ok 错误码请参见错误码。父主题：训练管理

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
日志提示“no socket interface found” - AI开发平台ModelArts

日志提示“no socket interface found” 问题现象在pytorch镜像运行分布式作业时，设置NCCL日志级别，代码如下： import os os.environ["NCCL_DEBUG"] = "INFO" 会出现如下错误： job0879f61e-jo

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

管理专属资源池的权限系统策略 ModelArts Dependency Access ModelArts服务的常用依赖服务的权限系统策略通常来讲，只给管理员开通“ModelArts FullAccess”，如果不需要太精细的控制，直接给所有用户开通“ModelArts Co

帮助中心 > AI开发平台ModelArts > 产品介绍
启动/停止/删除实例 - AI开发平台ModelArts

启动/停止/删除实例启动/停止实例由于运行中的Notebook将一直耗费资源，您可以通过停止操作，停止资源消耗。对于停止状态的Notebook，可通过启动操作重新使用Notebook。登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间 > Notebook”，进入Notebook管理页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例

总条数： 944

上一页
1
...
40
41
42
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理standard常见问题 - AI开发平台ModelArts

注册API并授权给APP - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

管理ModelArts服务的委托授权 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

更新团队标注验收任务状态 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

查询数据集的统计信息 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线