搜索_华为云

ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？ - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？在同一区域，ModelArts通过OBS的API访问OBS中的文件属于内网通信，不消耗公网流量费。如果是通过互联网从OBS下载数据到本地，这时候会产生OBS公网流量费。OBS的详细计费说明可以参见计费项。

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？当前训练任务排队的逻辑是先进先出，前面的任务没运行完后面的任务不会运行，有可能会造成小任务被“饿死”，需要用户注意。饿死指的是前面的任务被一个大的任务堵着（例如是64卡），需要等空闲64卡这个任务才能运行，64卡的任务后面跟着1卡的。即使现在空出来30卡，这个1卡的任务也排不上。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
出现“save error”错误，可以运行代码，但是无法保存 - AI开发平台ModelArts

error”错误，可以运行代码，但是无法保存如果当前Notebook还可以运行代码，但是无法保存，保存时会提示“save error”错误。大多数原因是华为云WAF安全拦截导致的。当前页面，即用户的输入或者代码运行的输出有一些字符被华为云拦截，认为有安全风险。出现此问题时，请提交工单，联系专业的工程师帮您核对并处理问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments - AI开发平台ModelArts

根据报错日志分析，模型目录下存在多余文件“/home/mind/model/v0432/cdn_short.pt”。处理方法在模型目录中删除“/home/mind/model/v0432/cdn_short.pt”文件，重新导入模型后进行部署在线服务即可正常预测。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
API/SDK - AI开发平台ModelArts
API/SDK - AI开发平台ModelArts

SDK和MoXing的区别是什么？ ModelArts的API或SDK支持模型下载到本地吗？ ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？

帮助中心 > AI开发平台ModelArts > 常见问题
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

跟服务端都要基于Socket.IO），地址栏中填入从服务详情页“调用指南”页签中获取“API接口调用公网地址”后面的地址。如果自定义镜像中有更细粒度的地址，则在地址后面追加该URL。如果有queryString，那么在params栏中添加参数。在header中添加认证信息（不同认

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
日志提示"write line error" - AI开发平台ModelArts

5T存储空间满了，具体规格的空间大小可参见训练环境中不同规格资源“/cache”目录的大小。处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。 import os os.system("ulimit -c 0") 排查数据集大小，checkp

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
ECS中上传新镜像 - AI开发平台ModelArts

rfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<版本名称>：定义镜像名称。示例：pytorch_2_1_ascend:20240606

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
ECS中上传新镜像 - AI开发平台ModelArts

rfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<版本名称>：定义镜像名称。示例：pytorch_2_1_ascend:20240606

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

跟服务端都要基于Socket.IO），地址栏中填入从服务详情页“调用指南”页签中获取“API接口调用公网地址”后面的地址。如果自定义镜像中有更细粒度的地址，则在地址后面追加该URL。如果有queryString，那么在params栏中添加参数。在header中添加认证信息（不同认

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

lost token or incorrect token……”。原因分析原因是由于其他人没有此账号的令牌导致。解决方案在此url后面加上Notebook拥有者的token。父主题：实例故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
构建条件节点控制分支执行 - AI开发平台ModelArts

的执行流程。主要应用场景如下：可以用于需要根据不同的输入值来决定后续执行流程的场景。例如：需要根据训练节点输出的精度信息来决定是重新训练还是进行模型的注册操作时可以使用该节点来实现流程的控制。属性总览您可以使用ConditionStep来构建条件节点，ConditionStep结构如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

OBS连接不稳定可能会出现报错，“Unable to connect to endpoint”。处理方法对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读取和写入可以通过本地缓存的方式中转解决： import moxing.tensorflow

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

增加这个配置，3次发包均无响应会断开连接比如防火墙配置是2小时空闲就关闭连接，那客户端配置ServerAliveInterval小于2小时（比如1小时），就可以避免防火墙将连接断开。服务器端配置（Notebook当前已经配置，24h应该是长于防火墙的断连时间配置，该配置无需用户手工修改

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
Step1 创建用户组并加入用户 - AI开发平台ModelArts

请根据界面提示，填写必选参数，然后单击“下一步”。在“加入用户组”步骤中，选择“用户组02”，然后单击“创建用户”。系统将逐步创建好前面设置的2个用户。父主题：配置ModelArts基本使用权限

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

Browser+进行相关操作）。上传本地数据至“data”文件夹。复制此OBS路径，此时输入路径应为“obs://xxx-project/data”，（此路径后面标记为输入路径）。安装VS Code插件并登录本地打开VS Code软件，单击左侧导航栏的图标，将插件包拖入到扩展区空白处，即可自动安装。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
训练网络迁移总结 - AI开发平台ModelArts

程中分析问题并发挥NPU的优势。由于构造和运行机制的差别，整个迁移过程并非是完全平替，GPU在灵活性上有其独特的优势，而NPU上的执行目前还是依赖于算子的下发，对于NPU构造的理解是昇腾训练迁移中必备的知识，只有对于昇腾有基础理解，配合一些诊断工具，面对复杂问题时，才能进行进一步诊断与定位，进而发挥NPU的能力。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

和数据层的安全入侵行为。 ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防范Web安全风险，并且通过WAF进行安全防护。所有承载ModelArts服务的主机部署了主机安全防护产品。包括不限于华为自研HSS或计算安全平台CSP。 ModelAr

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

kubectl delete pod -n kube-system ${pod_scheduler_name} 图3 scheduler 如果重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）

总条数： 169

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？ - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

出现“save error”错误，可以运行代码，但是无法保存 - AI开发平台ModelArts

使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments - AI开发平台ModelArts

API/SDK - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

ECS中上传新镜像 - AI开发平台ModelArts

ECS中上传新镜像 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

Step1 创建用户组并加入用户 - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

训练网络迁移总结 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线