搜索_华为云

Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML 训练速度突然下降以及执行nvidia-smi卡顿如何解决？

帮助中心 > AI开发平台ModelArts > 故障排除
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

依赖包为开源安装包时在“代码目录”中创建一个命名为“pip-requirements.txt”的文件，并且在文件中写明依赖包的包名及其版本号，格式为“包名==版本号”。例如，“代码目录”对应的OBS路径下，包含模型文件，同时还存在“pip-requirements.txt”文件。“代码目录”的结构如下所示：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在MaaS中创建模型 - AI开发平台ModelArts

generation_config.json. generation_config.json内容格式错误。检查“generation_config.json”文件中的内容是否为json格式。 The value of do_sample is not set to true in generation_config

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
编排Workflow - AI开发平台ModelArts

default="True", description="是否进行数据清洗, 数据格式异常会导致训练失败，建议开启，保证训练稳定性。数据量过大时，数据清洗可能耗时较久，可自行线下清洗（支持BMP.JPEG,PNG格式, RGB三通道）。建议用JPEG格式数据")), wf.Algor

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
训练作业一直在等待中（排队）？ - AI开发平台ModelArts

费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。如果有长期的资源使用诉求，可以购买独占使用的专属资源池。专属资源池：如有多个可用的专属资源池，可尝试选择其他较为空闲的资源池。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
创建数据集 - AI开发平台ModelArts

表2 请求Body参数参数是否必选参数类型描述 data_format 否 String 数据格式。可选值如下： Default：默认格式 CarbonData：Carbon格式（仅表格数据集支持） data_sources 是 Array of DataSource objects

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用AOM看Lite Cluster监控指标 - AI开发平台ModelArts

my-task-image:latest # 替换为实际使用的镜像备注：业务负载和自定义指标采集可以共用一个容器，也可以由SideCar容器采集指标数据，然后将自定义指标采集容器指定到SideCar容器，这样可以不占用业务负载容器的资源。自定义指标数据格式自定义指标数据的格式必须是符合open metrics规范的文本，即每个指标的格式应为：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
配置仪表盘查看指标数据 - AI开发平台ModelArts

到导入的视图，单击视图即可打开监控。模板使用导入成功后，单击想查看的模板即可查看响应内容。这里介绍一些常用功能的使用。切换数据源和资源池图5 切换数据源和资源池单击红框中相应位置，即可出现下拉框，修改响应的数据源和资源池。刷新数据单击右上角的图标，即可刷新整个Das

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

即可看到当前代码库的信息，如仓库名称、分支、历史提交记录等。图6 查看代码库信息 Git插件一般默认克隆master分支，如果要切换分支可单击Current Branch展开所有分支，单击相应分支名称可完成切换。查看修改的内容如果修改代码库中的某个文件，在“Changes”页签的“Changed”下可以看

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
附录：训练常见问题 - AI开发平台ModelArts

ue 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Dee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

委托用户：选择委托名称。使用账号A创建一个权限委托，在此处将该委托授权给账号B拥有的委托。在使用账号B登录控制台时，可以在控制台右上角的个人账号切换角色到账号A，使用账号A的委托权限。图3 委托用户切换角色说明： ModelArts暂不支持创建身份策略权限的委托。 “委托选择” 已有委托：列表中如果已有委托选

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

est-v2/pytorch/fast_example/log”。操作步骤调用认证鉴权接口获取用户的Token。请求消息体： URI格式：POST https://{iam_endpoint}/v3/auth/tokens 请求消息头：Content-Type →application/json

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
配置Lite Server网络 - AI开发平台ModelArts

款”。虚拟私有云和子网和Server资源的网络保持一致。配置SNAT规则。 SNAT功能通过绑定弹性公网IP，实现私有IP向公有IP的转换，可实现VPC内跨可用区的多个云主机共享弹性公网IP、安全高效地访问互联网。公网NAT网关页面，单击创建的NAT网关名称，进入NAT网关详情页。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
创建Workflow数据集导入节点 - AI开发平台ModelArts

label_format 标签格式，此参数仅文本类数据集使用。否 LabelFormat 表5 AnnotationFormatConfig 属性描述是否必填数据类型 format_name 标注格式的名称。否 AnnotationFormatEnum parameters 标注格式的高级参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
迁移Standard专属资源池和网络至其他工作空间 - AI开发平台ModelArts

子用户仅限于对自己创建的工作空间下的资源池进行迁移操作。网络工作空间迁移登录ModelArts管理控制台，选择“AI专属资源池 > 弹性集群Cluster”，切换到“网络”页签。在网络列表中，选择目标网络“操作 > 更多 > 工作空间迁移”。在弹出的“迁移网络”中，选择要迁移的“目标工作空间”，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
推理精度测试 - AI开发平台ModelArts

rts Standard模式。 vllm_model：对应Step4 部署并启动推理服务中的模型地址参数model，模型格式是Huggingface的目录格式。 deploy_method：部署方法，不同的部署方式api参数输入、输出解析方式不同，目前支持tgi、vllm等方式，本案例使用vllm部署方式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
资源池监控 - AI开发平台ModelArts

String 查询时间范围，默认值“-1.-1.60”。格式为startTimeInMillis.endTimeInMillis.durationInMinutes，参数解释： startTimeInMillis: 查询的开始时间，格式为UTC毫秒，如果指定为-1，服务端将按(endTimeInMillis

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

取处理。处理方法结合当前购买的SFS盘性能规划业务，建议不要运行到性能上限。可以购买多个SFS Turbo实例分担业务压力，或者更换高性能的SFS盘。一个SFS实例容量建议不要太大，建议以同样的成本换成购买多个SFS实例。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

需要添加到请求中的公共消息头如表3所示。表3 公共请求消息头参数名说明是否必选示例 Content-type 消息体的类型（格式），默认取值为“application/json”。是 application/json Content-Length 请求body长度，单位为Byte。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
创建Workflow数据集节点 - AI开发平台ModelArts

annotation_format_config 导入的标注格式的配置参数。否 DAnnotationFormaTypeEtConumfig的列表表6 AnnotationFormatConfig 属性描述是否必填数据类型 format_name 标注格式的名称。否 AnnotationFormatEnum

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点

总条数： 1129

上一页
1
...
50
51
52
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Server - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

训练作业一直在等待中（排队）？ - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

使用AOM看Lite Cluster监控指标 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

迁移Standard专属资源池和网络至其他工作空间 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线