搜索_华为云

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

Summary数据上传到Notebook路径/home/ma-user/work/下的方式，请参见上传本地文件至JupyterLab。 Summary数据如果是通过OBS并行文件系统挂载到Notebook中，请将模型训练时产生的Summary文件先上传到OBS并行文件系统，并确保OBS并行文件系统与M

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

ModelArts自动学习-文本分类正式下线后，所有用户将无法使用自动学习的文本分类功能创建项目，但仍可查看历史使用文本分类功能创建的作业。如您有任何问题，可随时通过工单或者服务热线（+86-4000-955-988或+86-950808）与我们联系。感谢您对华为云的支持！父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
显存溢出错误 - AI开发平台ModelArts

max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
multi-step - AI开发平台ModelArts
multi-step - AI开发平台ModelArts

用率不足，开启multi-step调度可以有效解决这个问题，开启multi-step调度后会在执行一次调度和输入准备后，连续n步运行模型。通过NPU在n步之间连续处理，而无需等待CPU，可以将CPU开销分散到n步中，从而显著减少NPU空闲时间，提升整体性能。约束限制暂不支持Multi-Lora和投机推理场景。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Ascend-vLLM介绍 - AI开发平台ModelArts

Multi-lora 多lora挂载，多个不同微调模型共用一份权重同时部署。控制输出 Guided Decoding 通过特定模式控制模型输出。 Beam search 通过beamsearch输出多个候选结果。分离部署 PD分离部署全量、增量分离部署，提高资源利用率，提升体验。剪枝

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

eb server的keep-alive的参数值，尽量避免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。其他方式导入的模型，服务内部已做处理。协议错误请求报错：{"error_code":"ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理通过patch操作对服务进行更新查询服务监控信息查询服务列表部署服务查询支持的服务部署规格查询服务详情更新服务配置删除服务更新模型服务的单个属性查询专属资源池列表查询服务事件日志启动停止边缘节点服务实例查询服务更新日志添加资源标签删除资源标签

 帮助中心 > AI开发平台ModelArts > API参考
上传OBS文件到JupyterLab - AI开发平台ModelArts

在Notebook的JupyterLab中，支持将OBS中的文件下载到Notebook。注意：文件大小不能超过10GB，否则会上传失败。通过JupyterLab打开一个运行中的Notebook。单击JupyterLab窗口上方导航栏的ModelArts Upload File

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
训练脚本参数说明 - AI开发平台ModelArts

orithm目录下集成了多个多模态模型的适配脚本，用户可通过不同模型中的xxx_install.sh脚本一键适配。在用户通过Dockerfile构建模型的环境镜像时会执行该脚本，这会从github上拉取模型的官方源码，并通过git apply qwen-vl.patch的方式进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
显存溢出错误 - AI开发平台ModelArts

max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
Chunked Prefill - AI开发平台ModelArts

填充，降低仅decode组batch的成本。其优势主要包括：提升效率：通过合理组合长短prompt，保持模型高吞吐量运行。增强一致性：统一前向传递大小，降低延迟波动，使生成频率更稳定。降低时延：通过平衡prefill和decode的计算利用率，降低请求P90_ttft（time

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
发布ModelArts模型 - AI开发平台ModelArts

AI Gallery是在ModelArts的基础上构建的开发者生态社区，提供算法、模型、数据集等内容的共享，为高校科研机构、模型开发商、解决方案集成商、企业级个人开发者等群体，提供安全、开放的共享，加速AI资产的开发与落地。发布至AI Gallery的资产是免费的，只需要支付在使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

的可用区，这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比，可用区具有更高的可用性、容错性和可扩展性。 ModelArts通过对DB的数据进行备份，

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
获取APP列表 - AI开发平台ModelArts

否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 iphertext_enabled 否 Boolean 是否明文展示appsecret。 app_ids 否 Array of strings

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型针对ModelArts目前不支持的AI引擎，您可以通过自定义镜像的方式将编写的模型导入ModelArts。约束与限制关于自定义镜像规范和说明，请参见模型镜像规范。使用容器化部署，导入的元模型有大小限制，详情请参见导入模型对于镜像大小限制。前提条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
API/SDK - AI开发平台ModelArts
API/SDK - AI开发平台ModelArts

ModelArts SDK、OBS SDK和MoXing的区别是什么？ ModelArts的API或SDK支持模型下载到本地吗？ ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？

帮助中心 > AI开发平台ModelArts > 常见问题
训练脚本存放目录说明 - AI开发平台ModelArts

orithm目录下集成了多个多模态模型的适配脚本，用户可通过不同模型中的xxx_install.sh脚本一键适配。在用户通过Dockerfile构建模型的环境镜像时会执行该脚本，这会从github上拉取模型的官方源码，并通过git apply qwen-vl.patch的方式进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
执行训练任务 - AI开发平台ModelArts

following packages that were not found in your environment: flash_attn. Run `pip install flash_attn`"请参考附录：训练常见问题问题3小节。大模型参数如（qwen2-72B、llama2-70B）等

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
集成在线服务API至生产环境中应用 - AI开发平台ModelArts

参见《SDK参考》>“场景1：部署在线服务Predictor的推理预测”。除此之外，您还可以使用常见的开发工具及开发语言调用此接口，建议通过互联网搜索并获取调用标准Restful API的指导。父主题：管理同步在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

正式下线后，所有用户将无法使用旧版数据集。为了避免影响您的业务，建议您在2024/10/30 23:59:59（北京时间）前备份数据或切换至新版数据集。如您有任何问题，可随时通过工单或者服务热线（+86-4000-955-988或+86-950808）与我们联系。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告

总条数： 1625

上一页
1
...
66
67
68
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

multi-step - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

上传OBS文件到JupyterLab - AI开发平台ModelArts

训练脚本参数说明 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

Chunked Prefill - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

API/SDK - AI开发平台ModelArts

训练脚本存放目录说明 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

集成在线服务API至生产环境中应用 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线