搜索_华为云

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

${User}@${HostName} -p ${Port} rm -rf /home/ma-user/.vscode-server/bin/ 参数说明： - IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号 vscode-

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
训练作业运行失败排查指导 - AI开发平台ModelArts

0:29500 (errno: 98 - Address already in use).”。原因：训练作业的端口号有冲突。处理建议：更改代码中的端口号，重启训练作业。查看训练作业的“日志”，出现报错“WARNING: root: Retry=7, Wait=0.4, Times

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
在推理生产环境中部署推理服务 - AI开发平台ModelArts

0.0.0。 --port：服务部署的端口8080。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config.json里面定义的“max_position_embeddings”和“seq_length”；如果设置过大，会占用过多显存，影响kvc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
在Notebook中如何实现IAM用户隔离？ - AI开发平台ModelArts

在Notebook中如何实现IAM用户隔离？开发环境如果需要实现IAM用户隔离，即多个IAM用户之间无法查看、修改和删除他人创建的Notebook。目前有两种方案：方案一：删除modelarts:notebook:listAllNotebooks细粒度权限。方案二：使用工

 帮助中心 > AI开发平台ModelArts > 常见问题 > 权限相关
分离部署推理服务 - AI开发平台ModelArts

例、增量推理实例的信息交互。该参数入参为形如{port1},{port2},{portn}的字符串，与全量或增量推理实例启动的--port参数相关。--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(`--port`)启动服务，并按照global rank_t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

例、增量推理实例的信息交互。该参数入参为形如{port1},{port2},{portn}的字符串，与全量或增量推理实例启动的--port参数相关。--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(`--port`)启动服务，并按照global rank_t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
返回结果 - AI开发平台ModelArts
返回结果 - AI开发平台ModelArts

"error_code": "AS.0001" } 其中，error_code表示错误码，error_msg表示错误描述信息，具体请参见错误码。父主题：如何调用API

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
如何上传数据至OBS？ - AI开发平台ModelArts

您在创建OBS桶时，需保证您的OBS桶与ModelArts在同一个区域。如何查看OBS桶与ModelArts的所处区域，请参见查看OBS桶与ModelArts是否在同一区域。建议根据业务情况及使用习惯，选择OBS使用方法。如果您的数据量较小（小于100MB）或数据文件少（少于100个），建

 帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

报错信息 ECS、BMS节点创建失败？查看资源池失败报错信息：包含错误码，如：Ecs.0000时，可查看弹性云服务器 ECS_错误码查看详细的错误信息及处理措施。包含错误码，如：BMS.0001时，可查看裸金属服务器 BMS_错误码查看详细的错误信息及处理措施。包含错误码，如：CCE

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

环境系统变量中。重新打开CMD，并执行ssh，结果如下图即说明安装成功，如果还未装成功则执行5和6。 OpenSSH默认端口为22端口，开启防火墙22端口号，在CMD执行以下命令： netsh advfirewall firewall add rule name=sshd dir=in

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
分离部署推理服务 - AI开发平台ModelArts

例、增量推理实例的信息交互。该参数入参为形如{port1},{port2},{portn}的字符串，与全量或增量推理实例启动的--port参数相关。--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(`--port`)启动服务，并按照global rank_t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志问题现象用户通过OBS导入模型时，选择使用基础镜像，用户自己编写了部分推理代码实现自己的推理逻辑，出现故障后希望通过故障日志排查定位故障原因，但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
分离部署推理服务 - AI开发平台ModelArts

例、增量推理实例的信息交互。该参数入参为形如{port1},{port2},{portn}的字符串，与全量或增量推理实例启动的--port参数相关。--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(`--port`)启动服务，并按照global rank_t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
如何在ModelArts训练作业中加载部分训练好的参数？ - AI开发平台ModelArts

如何在ModelArts训练作业中加载部分训练好的参数？在训练作业时，需要从预训练的模型中加载部分参数，初始化当前模型。请您通过如下方式加载：通过如下代码，您可以查看所有的参数。 from moxing.tensorflow.utils.hyper_param_flags import

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
准备推理环境 - AI开发平台ModelArts

启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。启动后容器默认端口是8080。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

热门案例为什么项目删除完了，仍然还在计费? 如何获取访问密钥？如何在Notebook中读写OBS文件？在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？如何查看ModelArts中正在收费的作业？如何查看ModelArts消费详情？更多自动学习

 帮助中心 > AI开发平台ModelArts > 成长地图
服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败如何处理？问题现象服务部署、启动、升级和修改时，拉取镜像失败。原因分析节点磁盘不足，镜像大小过大。解决方法首先考虑优化镜像，减小节点磁盘的占用。优化镜像无法解决问题，请联系系统管理员处理。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

在模型详情页面，查看“事件”页签中的事件信息。根据事件信息分析模型失败原因，进行处理。如果模型状态为“构建失败”，可以在模型详情页面，查看“事件”页签中的“查看构建日志”。构建日志中有对应的构建镜像失败的详细原因，根据构建失败的原因进行排查处理。图1 查看构建日志常见问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
PD分离部署使用说明 - AI开发平台ModelArts

例、增量推理实例的信息交互。该参数入参为形如{port1},{port2},{portn}的字符串，与全量或增量推理实例启动的--port参数相关。--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(--port)启动服务，并按照global rank_tab

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

功。单击“名称/ID”，进入服务器详情页面，查看虚拟私有云配置信息。图4 购买弹性云服务器时选择VPC 图5 查看虚拟私有云配置信息获取在线服务的IP和端口号可以通过使用图形界面的软件（以Postman为例）获取服务的IP和端口号，也可以登录弹性云服务器（ECS），创建Py

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1561

上一页
1
...
6
7
8
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在Notebook中如何实现IAM用户隔离？ - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

返回结果 - AI开发平台ModelArts

如何上传数据至OBS？ - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

如何在ModelArts训练作业中加载部分训练好的参数？ - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线