搜索_华为云

推理精度测试 - AI开发平台ModelArts

--output_path ${output_path} 参数说明: model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utili

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
精度问题概述 - AI开发平台ModelArts

异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括： Loss曲线与CPU/GPU差异不符合预期。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
推理精度测试 - AI开发平台ModelArts

--output_path ${output_path} 参数说明: model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utili

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

--output_path ${output_path} 参数说明: model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utili

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
托管数据集到AI Gallery - AI开发平台ModelArts

如果填写了“中文名称”，则资产发布后，在数据集页签上会显示该“中文名称”。许可证数据集资产遵循的使用协议，根据业务需求选择合适的许可证类型。描述填写资产简介，数据集发布后将作为副标题显示在数据集页签上，方便用户快速了解资产。支持0~90个字符，请勿在描述中输入涉政、迷信

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

model_inference(input_data) # 保存网络输出节点名称、维度、shape及输出到本地文件。 with open("output_data.txt", "w") as f: f.write("output_node_name 2 1 1000\n") f.write(" ".join([str(i)

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。执行性能测试脚本前，需先安装相关依赖。 conda activate python-3.9.10 pip install -r requirements.txt 静态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
在Lite Cluster资源池上使用Ascend FaultDiag工具完成日志诊断 - AI开发平台ModelArts

VICE侧产生的AICPU、HCCP的日志，这些日志会被回传到HOST侧。 CANN日志：CANN日志是昇腾（Ascend）计算架构中用于记录CANN（Compute Architecture for Neural Networks）模块运行时信息的日志。在模型转换过程中，如果遇到“Convert

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。执行性能测试脚本前，需先安装相关依赖。 conda activate python-3.9.10 pip install -r requirements.txt 静态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
MoXing如何访问文件夹并使用get - AI开发平台ModelArts

获取一个OBS文件的大小： import moxing as mox mox.file.get_size('obs://bucket_name/obs_file.txt') 父主题： MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
查看批量服务详情 - AI开发平台ModelArts

展示当前服务使用过程中的关键操作，比如服务部署进度、部署异常的详细原因、服务被启动、停止、更新的时间点等。事件保存周期为1个月，1个月后自动清理数据。查看服务的事件类型和事件信息，请参见查看在线服务的事件日志展示当前服务下每个模型的日志信息。包含最近5分钟、最近30分钟、最近1小时和自定义时间段。自

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
升级Standard专属资源池驱动 - AI开发平台ModelArts

在资源池列表中，选择需要进行驱动升级的资源池，在右侧的操作列，单击“ > 驱动升级”。在“驱动升级”弹窗中，会显示当前专属资源池的驱动类型、实例数量、当前版本、目标版本、升级方式、升级范围和开启滚动开关。目标版本：在目标版本下拉框中，选择一个目标驱动版本。对于资源池新增加的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
推理性能测试 - AI开发平台ModelArts

# 执行静态，动态性能评测脚本执行性能测试脚本前，需先安装相关依赖。 pip install -r requirements.txt 静态benchmark 运行静态benchmark验证脚本benchmark_parallel.py，具体操作命令如下，可以根据参数说明修改参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
msprobe精度比对 - AI开发平台ModelArts

-s配置是否生成堆栈信息。生成结果为advisor_{timestamp}.txt和compare_result_{timestamp}.xlsx文件，advisor_{timestamp}.txt列出了可能存在精度问题的API的专家建议，compare_result_{timestamp}

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
在ModelArts的Notebook中不同规格资源/cache目录的大小是多少？ - AI开发平台ModelArts

盘大小与卡数有关，计算方式为卡数*500G，上限为3T。详细表1所示。表1 不同Notebook规格资源“/cache”目录的大小规格类别 cache盘大小 GPU-0.25卡 500G*0.25 GPU-0.5卡 500G*0.5 GPU-单卡 500G GPU-双卡 500G*2

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

config.json |── generation_config.json |── gitattributes.txt |── LICENSE.txt |── Notice.txt |── pytorch_model-00001-of-00015.bin |── pytorch_model-00002-of-00015

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 准备工作
准备BF16权重 - AI开发平台ModelArts

return dequantized_weight def main(fp8_path, bf16_path): torch.set_default_dtype(torch.bfloat16) os.makedirs(bf16_path, exist_ok=True)

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 准备权重
身份认证与访问控制 - AI开发平台ModelArts

通过IAM为用户组配置细粒度授权策略，使用户获得策略定义的权限，操作对应云服务的资源。基于策略授权时，管理员可以按ModelArts的资源类型选择授权范围。详细的资源权限项可以参见API参考中的权限策略和授权项章节。委托授权为了完成AI计算的各种操作，ModelArts在AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

在华为云MRS服务下查看自己账号下可用的MRS集群，如果没有，则需要创建，当前需要集群有Spark组件，安装时，注意勾选上。您可以使用MrsStep来创建作业类型节点。定义MrsStep示例如下。指定启动脚本与集群 from modelarts import workflow as wf # 通过

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
ma-cli configure鉴权命令 - AI开发平台ModelArts

--help Show this message and exit. 表1 鉴权命令参数说明参数名参数类型是否必选参数说明 -auth / --auth String 否鉴权方式，支持PWD（用户名密码）、AKSK（access key和secret

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考

总条数： 1745

上一页
1
...
81
82
83
...
88
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在Lite Cluster资源池上使用Ascend FaultDiag工具完成日志诊断 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

MoXing如何访问文件夹并使用get - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

在ModelArts的Notebook中不同规格资源/cache目录的大小是多少？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备BF16权重 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线