检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install -y docker-engine
modelarts/ma-cli-profile.yaml配置文件; -P表示鉴权文件中的某一组鉴权信息,默认是DEFAULT; -D表示是否开启debug模式(默认关闭),当开启debug模式后,命令的报错堆栈信息将会打印出来,否则只会打印报错信息; -h表示显示命令的帮助提示信息。
/v2/{project_id}/training-jobs/{training_job_id}/metrics/{task_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id
--num-prompts:某个频率下请求数,默认80。 --output_len:输出长度,默认是1024。 --trust-remote-code:是否相信远程代码。 脚本运行完后,测试结果保存在终端输出。 单条请求性能测试 针对openai的/v1/completions以及/v1/ch
--num-prompts:某个频率下请求数,默认80。 --output_len:输出长度,默认是1024。 --trust-remote-code:是否相信远程代码。 脚本运行完后,测试结果直接在终端输出。 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6
如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install -y docker-engine.aarch64
在查询列表时,返回list的同时,会打印模型列表的详细信息,如表2和表3所示。 当前支持最大获取150个模型对象。 表1 查询检索参数说明 参数 是否必选 参数类型 说明 model_name 否 String 模型名称,可支持模糊匹配。 model_version 否 String 模型版本。
ining-jobs/{training_job_id}/tasks/{task_id}/logs/preview 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id
DK代码示例调试功能。 URI POST /v1/{project_id}/notebooks/{id}/stop 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String Notebook实例ID,可通过调用查询Notebook实例列表接口获取。 project_id
例,并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/notebooks/{id} 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String Notebook实例ID,可通过调用查询Notebook实例列表接口获取。 project_id
提供SDK代码示例调试功能。 URI DELETE /v1/{project_id}/notebooks/{id} 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String Notebook实例ID,可通过调用查询Notebook实例列表接口获取。 project_id
1-pytorch_1.8.0-cuda_10.2-py_3.7-ubuntu_18.04-x86_64 cuda_10.2 不同区域支持的AI引擎有差异,请以实际环境为准。 推理支持的AI引擎 在ModelArts创建AI应用时,若使用预置镜像“从模板中选择”或“从OBS中选择”导入模型,则支持如下常用引擎及版本的模型包。
选填,推理服务提供的端口,缺省值为8080。只支持部署HTTP服务。 自定义镜像可以通过是否上传自定义推理参数文件“gallery_inference/inference_params.json”决定镜像在部署推理服务时是否支持设置推理参数。 如果在自定义镜像的“模型文件”下上传了“galler
Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/images/{id} 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String 镜像ID。 project_id 是 String 用户项目ID,获取方法请参见获取项目ID和名称。
可以使用v2的${MA_VJ_NAME}-${MA_TASK_NAME}-{N}.${MA_VJ_NAME}:6666替换。 分析代码中是否存在并发读写同一文件的逻辑,如有则进行修改。 如用户使用多卡的作业,那么可能每张卡都会有同样的读写数据的代码,可参考如下代码修改。 import
和用户组,您直接使用即可。 用户只需要设置uid为1000的用户ma-user和gid为100的用户组ma-group,并使ma-user有对应目录的读写执行权限,其他如启动cmd不需要关心,无需设置或更改。 vim一个Dockerfile文件,添加第三方镜像(即非ModelAr
码示例调试功能。 URI GET /v1/{project_id}/networks/{network_name} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 network_name 是
K代码示例调试功能。 URI PUT /v1/{project_id}/dev-servers/{id}/stop 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String DevServer ID。 project_id 是 String 用户项目ID,获取方法请参见获取项目ID和名称。
SDK代码示例调试功能。 URI DELETE /v1/{project_id}/dev-servers/{id} 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String DevServer ID。 project_id 是 String 用户项目ID,获取方法请参见获取项目ID和名称。
--help Show this message and exit. 表1 鉴权命令参数说明 参数名 参数类型 是否必选 参数说明 -auth / --auth String 否 鉴权方式,支持PWD(用户名密码)、AKSK(access key和secret