搜索_华为云

ECS中上传新镜像 - AI开发平台ModelArts

在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图1 复制登录指令 Step2 修改并上传镜像在ECS服务器中输入登录指令后，使用下列示例命令将Standard镜像上传至SWR： docker tag ${dockerfile_image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
部署模型为在线服务 - AI开发平台ModelArts

未操作自动断开，此时可单击“重新连接”重新登录实例容器。图5 CloudShell界面部分用户登录Cloud Shell界面时，可能会出现路径显示异常情况，此时在Cloud Shell中单击回车键即可恢复正常。图6 路径异常父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
扩缩容模型服务实例数 - AI开发平台ModelArts

置完成后，单击“确认”提交扩缩容任务。在“扩缩容服务”对话框，单击“确定”。在“我的服务”页签，单击服务名称，进入服务详情页，可以查看修改后的实例数是否生效。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

{image_url}参见表2。 docker pull {image_url} 启动容器镜像。启动前请先按照参数说明修改${}中的参数。可以根据实际需要增加修改参数。训练默认使用单机8卡。 docker run -itd --net=host \ --device=/dev/davinci0

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查询Workflow待办事项 - AI开发平台ModelArts

"workflow_name" : "wf-test-service-xiahou", "execution_id" : "837f989e-ff44-4089-90f5-ec6d790d339d", "step_name" : "service_step", "step_title"

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

理残留目录导致，即：镜像里面“/var/lib/cloud/instances”残留了制作镜像机器（后面称模板机）的实例ID信息，如果制作镜像不清理“/var/lib/cloud/*”就会导致用该镜像再重装模板机时，cloud-init根据残留目录（含实例ID）判断已经执行过一

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

表31 advanced_config 参数参数类型描述 auto_search auto_search object 超参搜索策略。表32 auto_search 参数参数类型描述 skip_search_params String 需要排除的超参组合。 reward_attrs

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练精度测试 - AI开发平台ModelArts

ceval_validation或mmlu_test results.log results.json 目前只支持以上超参，客户修改其他参数则需手动修改yaml文件内容执行精度比较脚本进入test-benchmark目录目录执行命令。 ascendfactory-cli accuracy

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

建议您按以下步骤排查处理：确认部署在线服务时是否选择了GPU规格。在customize_service.py中添加一行代码os.system('nvcc -V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练启动脚本说明和参数配置 - AI开发平台ModelArts

parquet 必须修改。训练时指定的输入数据路径。请根据实际规划修改。 ORIGINAL_HF_WEIGHT /home/ma-user/ws/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。 SHELL_FOLDER

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
查询服务列表 - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 service_id 否 String 服务ID，在创建服务时即可在返回体中获取，也可通过查询服务列表接口获取当前用户拥有的服务，其中service_id字段即为服务ID。默认不过滤服务ID。 service_name 否 String 服务名

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

tensorflow包含所有的接口，对TensorFlow做了优化，里面的实际接口还是TensorFlow的原生接口。当非MoXing代码中没有Adam名称范围时，需要修改非MoXing代码，在其中增加如下内容： with tf.variable_scope("Adam"): 在增加代码时不建议使用自定义“global_step”，推荐使用tf

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
服务预测失败 - AI开发平台ModelArts

当使用推理的镜像并且出现MR.XXXX类型的错误时，表示已进入模型服务，一般是模型推理代码编写有问题。请根据构建日志报错信息，定位服务预测失败原因，修改模型推理代码后，重新导入模型进行预测。经典案例：在线服务预测报错MR.0105 出现其他情况，优先检查客户端和外部网络是否有问题。以上方法均未解决问题，请联系系统管理员。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
将数据预热到SFS Turbo - AI开发平台ModelArts

# 安装模型运行环境 │ └── qwen-vl.patch # 使用git apply修改模型相关代码 │ └── models └── Qwen-VL-Chat 父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
ECS中上传新镜像 - AI开发平台ModelArts

在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图1 复制登录指令 Step2 修改并上传镜像在ECS服务器中输入登录指令后，使用下列示例命令将Standard镜像上传至SWR： docker tag ${dockerfile_image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
分离部署推理服务 - AI开发平台ModelArts

返回多条正常结果。约束与限制：不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
开发环境的应用示例 - AI开发平台ModelArts

2-cudnn7-ubuntu18.04", "resource_categories": [ "CPU", "GPU" ], "service_type": "COMMON", "status": "ACTIVE", "swr_path": "swr.cn-north-4

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
非分离部署推理服务 - AI开发平台ModelArts

返回多条正常结果。约束与限制：不使用beam_search场景下，n取值建议为1≤n≤10。如果n>1时，必须确保不使用greedy_sample采样。也就是top_k > 1; temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

查询工作空间列表，响应消息体中包含详细信息。创建工作空间创建工作空间。查询工作空间详情查询工作空间详情。修改工作空间修改工作空间。删除工作空间删除工作空间。查询工作空间配额查看工作空间配额。修改工作空间配额修改工作空间配额。

帮助中心 > AI开发平台ModelArts > API参考
推理性能测试 - AI开发平台ModelArts

hmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

总条数： 1044

上一页
1
...
26
27
28
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS中上传新镜像 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

查询Workflow待办事项 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

ECS中上传新镜像 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线