搜索_华为云

查看训练作业日志 - AI开发平台ModelArts

训练日志用于记录训练作业运行过程和异常信息，为快速定位作业运行中出现的问题提供详细信息。用户代码中的标准输出、标准错误信息会在训练日志中呈现。在ModelArts中训练作业遇到问题时，可首先查看日志，多数场景下的问题可以通过日志报错信息直接定位。训练日志包括普通训练日志和Ascend相关日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查询APP的API认证信息 - AI开发平台ModelArts

参数类型描述 service_id 是 String 服务ID project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

相关服务和用户进行授权，并对用户权限进行检查操作。由于ModelArts的使用权限依赖OBS服务的授权，您需要为用户授予OBS的系统权限。如果您需要授予用户关于OBS的所有权限和ModelArts的基础操作权限，请参见配置基础操作权限。如果您需要对用户使用OBS和Model

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

通过nvidia-smi -a查询到Retired Pages中，Single Bit和Double Bit之和大于64。发起维修流程。 NT_GPU_CARD_LOSE GPU 掉卡 GPU卡丢失。节点规格的GPU卡数和以下任意值不相等： lspci可见GPU卡数。 nvidia-smi可见卡数。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
查询服务列表 - AI开发平台ModelArts

running：运行中，服务正常运行。 deploying：部署中，服务正在部署，包含打镜像和调度资源部署。 concerning：告警，后端实例部分存在异常。 failed：失败，服务部署失败，失败原因可以看事件和日志标签页。 stopped：停止。 finished：只有批量服务会有这个状态，表示运行完成。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用MaaS调优模型 - AI开发平台ModelArts

有输入（对应Human角色）和输出（对应MOSS角色）。其中Human和MOSS仅用于角色区分，模型训练的内容只有text指代的文本。单击下载，获取示例数据集“simple_moss.jsonl”，该数据集可以用于文本生成类型的模型调优。 xlsx和csv格式表格里的一行数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
新建Workflow工作流 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 name 是 String Workflow工作流名称，1到64位只包含中英文、数字、空格、下划线（_）和中划线（-），并且以中英文开头。 description

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理前的权重合并转换 - AI开发平台ModelArts

ze ：任务不同调整参数target-pipeline-parallel-size。默认为1 add-qkv-bias：为像qkv这样的键和值添加偏差。 loader：权重转换时要加载检查点的模型名称。 saver：权重转换时加载检查模型保存名称。 CONVERT_HFtoMG：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
获取Workflow工作流列表 - AI开发平台ModelArts

lows 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 name 否 String 工作流名称。 description 否 String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
用户AK-SK认证模式 - AI开发平台ModelArts

csv”，可打开文件查看访问密钥（Access Key Id和Secret Access Key）。 “project_id”即项目ID，获取方式如下：在“我的凭证”页面，单击“API凭证”，在“项目列表”中可查看项目ID和名称（即“项目”）。多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
发布和管理AI Gallery项目 - AI开发平台ModelArts

在Notebook详情页，单击“项目介绍”。在基础设置中设置“许可证”、“语言”、“框架”、“任务类型”和“硬件资源”等信息。单击“确定”。编辑设置基本设置单击右侧的，可以更改Notebook名称和描述。编辑完成之后单击“确定”。关联资产在输入框中输入资产ID后，单击“关联”即可关

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用AWQ量化 - AI开发平台ModelArts

llm_tools/AutoAWQ bash build.sh 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

llm_tools/AutoAWQ bash build.sh 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

modelarts:service:* 部署、启动、查新、更新模型服务。建议配置。仅在严格授权模式开启后，需要显式配置左侧权限。 LTS lts:logs:list 查询和展示LTS日志。按需配置。批量服务 OBS obs:object:GetObject obs:object:PutObject obs:bucket:CreateBucket

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
创建资源池 - AI开发平台ModelArts

/v2/{project_id}/pools 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-ModelArts-User-ID 否 String 实际

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
PyTorch迁移精度调优 - AI开发平台ModelArts

GPU/CPU）环境和昇腾环境上运行训练时的差异点来判断问题所在、整体流程如下图所示，更多介绍可参考昇腾精度调试指南。图1 精度调优流程溢出检测和dump比对是通过在PyTorch模型中注入hook从而dump模型训练过程的输入输出数据，比对NPU环境和标杆环境的所有输入输出

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
创建Workflow训练作业节点 - AI开发平台ModelArts

# 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
在ModelArts上训练模型，输入输出数据如何配置？ - AI开发平台ModelArts

解析输入路径参数、输出路径参数运行在ModelArts的模型读取存储在OBS服务的数据，或者输出至OBS服务指定路径，输入和输出数据需要配置3个地方：训练代码中需解析输入路径参数和输出路径参数。ModelArts推荐以下方式实现参数解析。 1 2 3 4 5 6 7 8 9

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 训练过程读取数据
模型推理代码编写说明 - AI开发平台ModelArts

py”中，需要添加一个子类，该子类继承对应模型类型的父类，各模型类型的父类名称和导入语句如表1所示。导入语句所涉及的Python包在ModelArts环境中已配置，用户无需自行安装。表1 各模型类型的父类名称和导入语句模型类型父类导入语句 TensorFlow TfServingBaseService

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
使用AWQ量化 - AI开发平台ModelArts

/pile-val", split="validation") 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers sentencepiece #安装量化工具依赖 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化

总条数： 706

上一页
1
...
28
29
30
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看训练作业日志 - AI开发平台ModelArts

查询APP的API认证信息 - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

推理前的权重合并转换 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

PyTorch迁移精度调优 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

在ModelArts上训练模型，输入输出数据如何配置？ - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线