搜索_华为云

推理性能测试 - AI开发平台ModelArts

的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
语言模型推理性能测试 - AI开发平台ModelArts

的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

避免在容器中监听其他端口，有本地内部需要访问的其他端口，监听在localhost上。避免通过环境变量传递敏感信息，需要通过加密组件进行加密后再通过环境变量配置。部署在线服务，当打开APP认证时，app认证密钥是在线服务的另一个访问凭据，需要妥善保存app密钥，防止泄露。父主题：

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

node_rank：当前节点的编号。 log_dir：msrun组网和各个进程的日志输出地址。 join：训练进程拉起后，msrun进程是否仍存在，默认配置为“True”，等待所有进程退出后再退出。 cluster_time_out：集群组网超时时间，默认是“600s”，可通过环境变量“MSR

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

例如：“obs://test-modelarts/mpi/log/” 在“规格确认”页面，确认训练作业的参数信息，确认无误后单击“提交”。训练作业创建完成后，后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
语言模型推理性能测试 - AI开发平台ModelArts

的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

AIGC代码包：AscendCloud-AIGC 算子依赖包：AscendCloud-OPP 获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的特性表1 本版本支持的特性说明分类软件包特性说明

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
附录：大模型推理常见问题 - AI开发平台ModelArts

图3 服务端响应200 图4 仍返回报错Response payload is not completed 解决方法：安装brotlipy后返回正确报错 pip install brotlipy 问题10：使用benchmark-tools访问推理客户端返回报错或警告使用ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务。当参数值>=max_steps时，生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。当参数值<max_steps时，生成模型会每经过save_steps次，保存一次模型版本。模型版本保存次数=max_steps//save_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
创建训练作业 - AI开发平台ModelArts

填入model_id后app_url/boot_file_url和engine_id无需填写。请从查询作业引擎规格接口获取引擎规格ID。 model_id 是 Long 训练作业的内置模型ID。请通过查询预置算法接口获取model_id。填入model_id后app_url/bo

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
附录：大模型推理常见问题 - AI开发平台ModelArts

图3 服务端响应200 图4 仍返回报错Response payload is not completed 解决方法：安装brotlipy后返回正确报错 pip install brotlipy 问题10：使用benchmark-tools访问推理客户端返回报错或警告使用ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
更新训练作业参数 - AI开发平台ModelArts

ne_id无需填写。 model_id 是 Long 训练作业的模型ID。请通过查询预置算法接口获取model_id。填入model_id后app_url/boot_file_url和engine_id不需填写。 parameter 否 Array<Object> 训练作业的运行

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

AIGC代码包：AscendCloud-AIGC 算子依赖包：AscendCloud-OPP 获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的特性表1 本版本支持的特性说明分类软件包特性说明

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
附录：大模型推理常见问题 - AI开发平台ModelArts

图3 服务端响应200 图4 仍返回报错Response payload is not completed 解决方法：安装brotlipy后返回正确报错 pip install brotlipy 问题10：使用benchmark-tools访问推理客户端返回报错或警告使用ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
准备物体检测数据 - AI开发平台ModelArts

在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的图片，至少有1种以上的分类，每种分类的图片数不少50张。创建数据集数据准备完成后，需要创建相应项目支持的类型的数据集，具体操作请参考创建ModelArts数据集。父主题：使用自动学习实现物体检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

性能自动诊断工具，采集好的Profiling数据通过该工具进行自动扫描分析，可给出性能瓶颈的诊断和修改建议。当迁移开箱性能较低时，通过该工具给出的建议修改代码后，通常可提升10%~30%。 whl包，地址见教程中下载链接。 MA-Advisor自动诊断工具 compare_tools 性能比对工具，

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
创建ModelArts数据清洗任务 - AI开发平台ModelArts

据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。图3 输入输出设置-数据集图4 输入输出设置-OBS目录确认参数填写无误后，单击“创建”，完成数据处理任务的创建。数据清洗算子（PCC算子） ModelArts的数据清洗通过PCC算子实现。图像分类或者物体检测的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
上传算法至SFS - AI开发平台ModelArts

/configs/swin/swin_base_patch4_window7_224_22k.yaml 推荐先使用单机单卡运行脚本，待正常运行后再改用多机多卡运行脚本。多机多卡run.sh中的“VC_WORKER_HOSTS”、“VC_WORKER_NUM”、“VC_TASK_IN

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
切换Lite Server服务器操作系统 - AI开发平台ModelArts

进行接收即可，参考如下图操作。图1 共享镜像切换操作系统。对Lite Server资源对应的裸金属服务器，对其进行关机操作，完成关机后，才可以执行切换操作系统动作。在裸金属服务的更多选项中，单击切换操作系统，如下图所示。图2 切换操作系统在切换操作系统界面，选择上一步接收到的共享镜像即可。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

元数据。配置Cluster资源，确保可以通过公网访问Cluster机器，具体配置请参见配置Lite Cluster网络。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1667

上一页
1
...
79
80
81
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

准备物体检测数据 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

创建ModelArts数据清洗任务 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线