搜索_华为云

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

ser/ tar -zxvf ascendcloud-aigc-extensions-diffusers.tar.gz Step3 运行并验证SDXL模型首先在容器中运行命令。 source /usr/local/Ascend/ascend-toolkit/set_env.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
MoXing Framework功能介绍 - AI开发平台ModelArts

file.copy_parallel”接口加速数据下载。需要时可以通过在训练作业的“环境变量”中设置“MOX_C_ACCELERATE=0”，来关闭数据下载加速特性。父主题：在Notebook中使用Moxing命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
Yaml配置文件参数配置说明 - AI开发平台ModelArts

disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。 include_tokens_per_second

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

横坐标：目标框的高宽比。纵坐标：框数量（统计所有图片中的框）。一般呈泊松分布，但与使用场景强相关。多用于比较训练集和验证集的差异，如训练集都是长方形框的情况下，验证集如果是接近正方形的框会有比较大影响。按面积占比统计框数量的分布 Area Ratio of Bounding Boxes

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
Standard资源池节点故障定位 - AI开发平台ModelArts

节点正在执行NPU驱动升级。 A200008 节点管理节点准入准入检测。节点正在进行节点准入检测，包括基本的节点配置检查和简单的业务验证。 A050933 节点管理容错Failover 当节点具有该污点时，会将节点上容错（Failover）业务迁移走。当节点标记该污点时

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

Notebook：Notebook作业 state String 业务状态。可选值如下： Enabling：启动中 Enabled：已启动 Disabling：关闭中 Disabled：已关闭表18 driver 参数参数类型描述 gpu PoolDriverStatus object GPU驱动信息。 npu

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
分页查询智能任务列表 - AI开发平台ModelArts

ratio_sample_usage Boolean 指定切分比例后，是否按指定比例随机分配训练-验证集。可选值如下： true：主动随机分配训练集-验证集 false：不主动随机分配训练集-验证集（默认值） sample_state String 样本状态。可选样本状态如下： __ALL__：已标注

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

--page-size Int 否每页显示的训练作业数量，默认是10。 -v / --verbose Bool 否显示详细的信息开关，默认关闭。示例：查询指定任务ID的训练任务。 ma-cli ma-job get-job -i b63e90xxx 示例：根据任务名称关键字“auto”过滤训练任务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备大模型推理适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
ModelArts中提示OBS路径错误 - AI开发平台ModelArts

没有，请参考配置访问授权（全局配置）。检查OBS桶是否为非加密桶进入OBS管理控制台，单击桶名称进入概览页。确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶，可单击“默认加密”选项进行修改。创建OBS桶时，桶的存储类别请勿选择“归档存储”和“深度归档存储”，归档存储的OBS桶会导致模型训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

端。 python test.py 图2 部署在线服务在XShell中新建一个终端，参考步骤5~7进入容器，该容器为客户端。执行以下命令验证自定义镜像的三个API接口功能。当显示如图所示时，即可调用服务成功。 curl -X POST -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
使用MaaS压缩模型 - AI开发平台ModelArts

选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务日志会在30天后会被清理。可以在任务详情页下载全部日志至本地。开关打开：表示永久保存日志，此时必须配置“日志路径”，系统会将任务日志永久保存至指定的OBS路径。事件通知选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
推理性能测试 - AI开发平台ModelArts

变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/llm_evaluation目录下。代码目录如下:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
pipeline应用准备 - AI开发平台ModelArts

e_host/work/runwayml/onnx_models”。执行推理脚本进行测试，这里使用的推理硬件是CPU，由于CPU执行较慢，验证待迁移的代码可能需要大约15分钟左右才能完成： cd modelarts-ascend/examples/AIGC/stable_diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
Standard资源管理 - AI开发平台ModelArts

专属资源池类型归一：不再区分训练、推理专属资源池。如果业务允许，您可以在一个专属资源池中同时跑训练和推理的Workload。同时，也可以通过“设置作业类型”来开启/关闭专属资源池对特定作业类型的支持。自助专属池网络打通：可以在ModelArts管理控制台自行创建和管理专属资源池所属的网络。若需要在专属资

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备大模型推理适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
MoXing - AI开发平台ModelArts
MoXing - AI开发平台ModelArts

MoXing 使用MoXing复制数据报错如何关闭Mox的warmup Pytorch Mox日志反复输出 moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？训练作业使用MoXing复制数据较慢，重复打印日志

 帮助中心 > AI开发平台ModelArts > 故障排除
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。 414 Request-URI Too Large 请求

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
修复Standard专属资源池故障节点 - AI开发平台ModelArts

取消高可用冗余将会解除隔离，工作负载可正常调度到节点上，节点不再作为备用节点使用。如果想批量设置节点关闭高可用冗余，可勾选多个节点后，单击列表上方的“关闭高可用冗余”按钮实现批量关闭。图7 关闭高可用冗余能力图8 非高可用冗余重置节点：需要升级节点操作系统时，可通过重置节点完成。更新节点配置时产生故障报错，也可通过重置节点修复故障。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 311

上一页
1
...
9
10
11
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

MoXing Framework功能介绍 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

ModelArts中提示OBS路径错误 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

MoXing - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线