搜索_华为云

自定义引擎创建模型规范 - AI开发平台ModelArts

自定义引擎的规范可以在安装有docker的本地机器上通过以下步骤提前验证：将自定义引擎镜像下载至本地机器，假设镜像名为custom_engine:v1。将模型包文件夹复制到本地机器，假设模型包文件夹名字为model。在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

自定义引擎的规范可以在安装有docker的本地机器上通过以下步骤提前验证：将自定义引擎镜像下载至本地机器，假设镜像名为custom_engine:v1。将模型包文件夹复制到本地机器，假设模型包文件夹名字为model。在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

429; proxy_pass http://127.0.0.1:8501; } } 准备启动脚本。启动前先创建ssl证书，然后启动TFServing的启动脚本。启动脚本run.sh示例代码如下： #!/bin/bash mkdir -p /etc/nginx/ssl/server

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

dpkg -l | grep nvidia-fabricmanager 卸载并重新安装正确版本的nvidia-fabricmanager，验证CUDA成功。处理方法查看nvidia-fabricmanager的版本，如果nvidia-fabricmanager版本与当前NVI

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
从OBS目录导入数据规范说明 - AI开发平台ModelArts

记录数据集信息的文件及路径信息(相对路径) ├── train.txt # 训练集中各图片路径信息(相对路径) ├── valid.txt # 验证集中各图片路径信息(相对路径) │ ├── obj_train_data/ # 训练集的图片与对应的标注文件所在目录 │

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
在Workflow中更新已部署的服务 - AI开发平台ModelArts

001,20:0.0001代表0-10个epoch学习率0.001，10-20epoch学习率0.0001),如果不指定epoch, 会根据验证精度情况自动调整学习率，并当精度没有明显提升时，训练停止")), wf.AlgorithmParameters(name="batch_size"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

“确定”完成授权。创建用户并加入用户组。在IAM控制台创建用户，并将其加入步骤1中创建的用户组。用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单

 帮助中心 > AI开发平台ModelArts > 常见问题 > 权限相关
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

“确定”完成授权。创建用户并加入用户组。在IAM控制台创建用户，并将其加入步骤1中创建的用户组。用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > FAQ
创建数据集导出任务 - AI开发平台ModelArts

ratio_sample_usage 否 Boolean 指定切分比例后，是否按指定比例随机分配训练-验证集。可选值如下： true：主动随机分配训练集-验证集 false：不主动随机分配训练集-验证集（默认值） sample_state 否 String 样本状态。可选样本状态如下： __ALL__：已标注

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

由于权限配置需要等待15-30分钟生效，建议在配置完成后，等待30分钟，再执行如下验证操作。使用用户组02中任意一个子账号登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。首次登录会提示修改密码，请根据界面提示进行修改。验证ModelArts权限。在左上角的服务列表中，选

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step3 制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step3 制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
查询数据集导出任务的状态 - AI开发平台ModelArts

ratio_sample_usage Boolean 指定切分比例后，是否按指定比例随机分配训练-验证集。可选值如下： true：主动随机分配训练集-验证集 false：不主动随机分配训练集-验证集（默认值） sample_state String 样本状态。可选样本状态如下： __ALL__：已标注

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
（可选）Session鉴权 - AI开发平台ModelArts

储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以password保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_PASSWORD。 __PASSWORD = os.envi

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
语言模型推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤三：上传代码包和权重文件中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
语言模型推理性能测试 - AI开发平台ModelArts

requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
投机推理使用说明 - AI开发平台ModelArts

式地推理（Speculative Inference）。即每次先使用小模型试探性地推理多步，再将这些推理结果收集到一起，一次交由LLM进行验证。如下图所示，在投机模式下，先由小模型依次推理出token 1、2、3，并将这3个token一次性输入大模型LLM推理，得到1'、2'、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

将子用户子账号加入用户组。在“加入用户组”步骤中，选择“用户组”，然后单击“创建用户”。系统将前面设置的多个用户加入用户组中。用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

如果遇到“rmmod: ERROR: Module nvidia is in use”，执行以下命令： sudo lsof /dev/nvidia* 并再次验证： lsmod | grep nvidia 再次执行“nvidia-smi”，显示成功，且是最新安装的NVIDIA驱动。父主题： Lite

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server

总条数： 363

上一页
1
...
4
5
6
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义引擎创建模型规范 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线