搜索_华为云

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

发起维修流程。 NT_NPU_ECC_COUNT NPU 显存 NPU ECC次数达到维修阈值。 NPU的HBM总的多Bit Ecc隔离地址记录达到64个。发起维修流程。 NT_NET_NTP_CHECK Runtime 其他 ntp异常。 ntpd或者chronyd服务异常。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
查询数据集导入任务列表 - AI开发平台ModelArts

input String 表格数据集，HDFS路径。例如/datasets/demo。 ip String 用户GaussDB(DWS)集群的IP地址。 port String 用户GaussDB(DWS)集群的端口。 queue_name String 表格数据集，DLI队列名。 subnet_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
自定义模型规范 - AI开发平台ModelArts

模型存放路径，AI Gallery的模型仓库地址，包含模型仓库的所有文件。 “/home/ma-user/.cache/gallery/model/ur12345--gpt2” ENV_AG_DATASET_DIR 数据集存放路径，AI Gallery的数据集仓库地址，包含数据集仓库的所有文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
更新网络资源 - AI开发平台ModelArts

Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。状态码： 400 表20 响应Body参数参数参数类型描述 error_code String ModelArts错误码。 error_msg

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建网络资源 - AI开发平台ModelArts

Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。状态码： 400 表19 响应Body参数参数参数类型描述 error_code String ModelArts错误码。 error_msg

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
将模型部署为批量推理服务 - AI开发平台ModelArts

文件内容是多行JSON，每行JSON描述一个输入数据，需精确到文件，不能是文件夹； JSON内容需定义一个source字段，字段值是OBS的文件地址，有2种表达形式：桶路径“<obs path>{{桶名}}/{{对象名}}/文件名”，适用于访问自己名下的OBS数据；您可以访问OBS服务的对象获取路径。<obs

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建AI应用 - AI开发平台ModelArts

型是从第三方元模型导入，则为空。默认值为空。非模板参数 source_location 是 String 模型所在的OBS路径或SWR镜像地址。 source_copy 否 String 镜像复制开关，仅当“model_type”为“Image”时有效。取值范围： true：默

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
创建节点池 - AI开发平台ModelArts

用户在运营平台选择的折扣信息。 os.modelarts/service.console.url 否 String 订购订单支付完成后跳转的url地址。 os.modelarts/order.id 否 String 订单id，包周期资源创建或者计费模式变更的时候该参数必需。表5 NodePoolSpec

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

m.sh及SSL证书。此处以chatglm3-6b为例。 ascend_vllm代码包在Step9 构建推理代码已生成。模型权重文件获取地址请参见表1。推理启动脚本run_vllm.sh制作请参见•创建推理脚本文件run_vllm.sh。 SSL证书制作包含cert.pem和key

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

联系桶的拥有者配置权限。在左侧菜单栏选择“访问权限控制>桶策略”，检查当前OBS桶是否允许子用户访问。检查训练作业的代码目录和启动文件地址进入ModelArts管理控制台，在“作业管理 > 训练作业”中查找到对应的“运行失败”的训练作业，单击作业“名称/ID”进入详情页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
推理业务迁移评估表 - AI开发平台ModelArts

（https://github.com/AUTOMATIC1111/stable-diffusion-webui）。如果是基于其他开源，需要附带开源代码仓地址。 - 具体使用库例如：使用了哪个pipeline （例如lpw_stable_diffusion.py）。使用了哪个huggingface的模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

')则表示用户设置了proxy，需要先关掉 export no_proxy=$no_proxy,repo.myhuaweicloud.com（此处需要替换成对应局点的pip源地址） pip install py-spy 查看堆栈。py-spy工具的具体使用方法可参考py-spy官方文档。 # 找到训练进程的PID ps

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

sft（指令微调） √ √ 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

peft版本升级到0.12.0 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

peft版本升级到0.12.0 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
终止训练作业 - AI开发平台ModelArts

挂载到训练容器中的路径。 read_only Boolean nfs挂载卷在容器中是否只读。表53 log_export_path 参数参数类型描述 obs_url String 训练作业日志保存的OBS地址。 host_path String 训练作业日志保存的宿主机的路径。表54 调用训练接口失败响应参数

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
准备预测分析数据 - AI开发平台ModelArts

数据集。将原始.xlsx格式的数据转换为.csv格式的数据的方法如下：将原始表格数据（.xlsx）另存。单击“文件>另存为”，选择本地地址后，下拉选择“保存类型”为“CSV (逗号分隔)(*.csv)”单击“保存”，在弹窗中，单击“确定”后就可以将.xlsx格式数据集转换为.csv格式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
保存Notebook实例 - AI开发平台ModelArts

镜像保存成功后，实例状态变为“运行中”，用户可在“镜像管理”页面查看到该镜像详情。单击镜像的名称，进入镜像详情页，可以查看镜像版本/ID，状态，资源类型，镜像大小，SWR地址等。基于自定义镜像创建Notebook实例从Notebook中保存的镜像可以在镜像管理中查询到，可以用于创建新的Notebook实例，完全继承保存状态下的实例软件环境配置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

镜像保存成功后，实例状态变为“运行中”，用户可在“镜像管理”页面查看到该镜像详情。单击镜像的名称，进入镜像详情页，可以查看镜像版本/ID，状态，资源类型，镜像大小，SWR地址等。基于自定义镜像创建Notebook实例从Notebook中保存的镜像可以在镜像管理中查询到，可以用于创建新的Notebook实例，完全继承保存状态下的实例软件环境配置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
SFT全参微调训练任务 - AI开发平台ModelArts

n/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

总条数： 883

上一页
1
...
34
35
36
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线