搜索_华为云

性能调优总体原则和思路 - AI开发平台ModelArts

用户采集性能profiling数据后，可通过该工具自动扫描profiling数据，工具分析完数据后会给出可能的性能问题点及调优建议，用户可以根据调优建议做相应的修改适配。目前该工具对CV类模型给出的调优建议较多，LLM类建议稍少，但是总体都有性能提升，实测大约可提升10%~30

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
获取项目ID和名称 - AI开发平台ModelArts

获取项目ID的接口为GET https://{iam-endpoint}/v3/projects，其中{iam-endpoint}为IAM的终端节点，可以从地区和终端节点处获取。响应示例如下，例如ModelArts部署的区域为"cn-north-4"，响应消息体中查找“name”为"cn-

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

<模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

<模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
从AI Gallery订阅模型 - AI开发平台ModelArts

针对订阅模型，支持将模型一键部署为服务。在“订阅模型”列表，单击“版本数量”，在右侧展开版本列表，当订阅模型的版本列表的状态显示为“就绪”时表示模型可以使用。图1 进入“我的订阅” 在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型如果您选择部署的是商用模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
更新服务配置 - AI开发平台ModelArts

predictor configs结构参数是否必选参数类型描述 model_id 是 String 模型ID。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。 weight 是 Integer 权重百分比，分配到此模型的流量权重，仅当infe

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

样例yaml文件仅展示常用实验配置，如需其他配置需根据样例自行添加，样例截图如下：步骤二：执行训练任务进入test-benchmark目录执行训练命令，可以多次执行，卡数及其它配置参考NPU卡数取值表按自己实际情况决定单机<可选>： # 默认8卡 ascendfactory-cli train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

autoremove --purge nvidia-* sudo apt-get autoremove --purge cuda-* 以上命令可以卸载nvidia-driver、cuda、nvidia-fabricmanager、nvidia-peer-memory四个软件。但是如

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

配置Cluster资源，确保可以通过公网访问Cluster机器，具体配置请参见配置Lite Cluster网络。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

/home/ma-user && \ chmod 770 /root && \ usermod -a -G root ma-user 其他现象，可以在已有的训练故障案例查找。建议与总结用户使用自定义镜像训练作业时，建议按照训练作业自定义镜像规范制作镜像。文档中同时提供了端到端的示例供用户参考。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

<模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

download internet resources（不同局点的Notebook代理可能不同，此处为举例，请以Notebook所在局点的实际代理为准，可以在JupyterLab的Terminal中，通过env|grep -i proxy命令查看） ENV HTTP_PROXY=http://proxy

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
多模态模型推理性能测试 - AI开发平台ModelArts

benchmark_tools/modal_benchmark/modal_benchmark_parallel.py，具体操作命令如下，可以根据参数说明修改参数。 python modal_benchmark_parallel.py \ --host ${docker_ip} \

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

<模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

会收费的实例已全部停止或删除，同时需清理运行Notebook实例时存储到云硬盘中的数据和其他存储到对象存储服务中的数据，以免继续扣费。您可以在“费用中心 > 总览”页面设置“可用额度预警”功能，当可用额度、通用代金券和现金券的总额度低于预警阈值时，系统自动发送短信和邮件提醒。

帮助中心 > AI开发平台ModelArts > 计费说明
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

服务运维和监控的实现步骤。图3 司乘安全算法将用户本地开发完成的模型，使用自定义镜像构建成ModelArts Standard推理平台可以用的模型。具体操作请参考从0-1制作自定义镜像并创建模型。在ModelArts管理控制台，使用创建好的模型部署为在线服务。登录云监控服

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

calling 暂不支持。在Dify中创建Agent进行编配，在右上角单击“Agent 设置”，选择上一步配置好的模型进行使用。在Agent设置中可以看到Dify已自动将Agent Mode切换到了Function Calling模式。图1 Agent设置在“编排”页面的“提示词”文本框，输入以下信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

pCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。前提条件提前部署在线服务，具体操作可以参考案例：使用ModelArts Standard一键完成商超商品识别模型部署。操作步骤在ModelArts控制台页面菜单栏中，单击“模型部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

predict(inputs)[0].get_data_to_numpy() print(outputs.shape) # (8, 1000) 动态分辨率动态分辨率可以用于设置输入图片的动态分辨率参数。适用于执行推理时，每次处理图片宽和高不固定的场景，该参数需要与input_shape配合使用，input

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
配置多分支节点数据 - AI开发平台ModelArts

), # 训练使用的算法对象，示例中使用AIGallery订阅的算法；部分算法超参的值如果无需修改，则在parameters字段中可以不填写，系统自动填充相关超参值 inputs=wf.steps.JobInput(name="data_url", data=obs_data)

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景

总条数： 1569

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优总体原则和思路 - AI开发平台ModelArts

获取项目ID和名称 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线