搜索_华为云

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

使用MindSpore引擎编写训练脚本时，为了保证训练结果中输出Summary文件，您需要在脚本中添加收集Summary相关代码。将数据记录到Summary日志文件中的具体方式请参考收集Summary数据。注意事项在开发环境跑训练作业，在开发环境使用MindInsight，要求先启动MindInsight，后启动训练进程。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
创建训练任务 - AI开发平台ModelArts

在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： cd /home/ma-user/work/code/Swin-Transformer

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
Standard推理部署 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发从0-1制作自定义镜像并创建模型使用AppCode认证鉴权方式进行在线预测

 帮助中心 > AI开发平台ModelArts > 最佳实践
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

WebSocket协议本身不提供额外的认证方式。不管自定义镜像里面是ws还是wss，经过ModelArts平台出去的WebSocket协议都是wss的。同时wss只支持客户端对服务端的单向认证，不支持服务端对客户端的双向认证。可以使用ModelArts提供的以下认证方式： token认证 AK/SK

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
非分离部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

启动前配置。有两种方式修改配置文件：方式一：可以参考解压出来的default_config.yaml或者deepspeed_default_config.yaml文件，再通过在启动脚本命令中增加--config_file=xxx.yaml参数来指定其为配置文件。方式二：通过命令accelerate

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
部署模型为在线服务 - AI开发平台ModelArts

B-3通道的图片。该功能为调测使用，实际生产建议使用API调用。根据鉴权方式的不同，可以根据实际情况选择通过Token认证的方式访问在线服务、通过AK/SK认证的方式访问在线服务或者通过APP认证的方式访问在线服务。针对您部署上线的服务，您可以在服务详情页面的“调用指南”中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读取和写入可以通过本地缓存的方式中转解决： import moxing.tensorflow as mox mox.cache() 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
扩缩容Standard专属资源池 - AI开发平台ModelArts

据本身业务诉求进行调整。增加目标实例数量即表示扩容，减少目标实例数量即表示缩容。如果购买资源池时，节点数量采用整柜方式购买（部分规格支持），则在扩缩容时为整柜方式扩缩容，目标实例总数等于“数量*整柜”。“整柜”参数为创建资源池时选择，扩缩容时不可修改。用户通过增减“数量”来改变“目标总实例数”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
获取用户绑定APP的api列表 - AI开发平台ModelArts

分页展示时，一页展示多少项。默认为1000。 offset 否 String 分页展示时，从第几页开始。默认为0。 order 否 String 返回的APP列表排序方式，可选值包括asc、desc。默认为asc。 service_name 否 String API所属服务名称，支持模糊查找。 sort_by

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

Ascend）硬件由于存在一定细小的差别，很难确保完全一致，较难达成生成图片100%匹配，建议通过盲测的方式对效果进行验证。模型精度有问题怎么办？首先考虑通过FP16的方式进行转换和执行，再通过精度诊断工具来进行分析，更进一步可以到华为云官网上提交工单处理。模型转换失败时如何查看日志和定位原因？

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
快速配置ModelArts委托授权 - AI开发平台ModelArts

对委托授权的权限范围进行精确控制，请使用定制化委托授权。更多权限控制的内容请参见权限管理章节。本章节主要介绍一键式自动授权方式。一键式自动授权方式支持给IAM子用户、联邦用户（虚拟IAM用户）、委托用户和所有用户授权。约束与限制华为云账号只有华为云账号可以使用委托授权，可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
配置ModelArts委托授权 - AI开发平台ModelArts

功能中，快速完成委托授权，由ModelArts为用户自动创建委托并配置到ModelArts服务中。本章节主要介绍一键式自动授权方式。一键式自动授权方式支持给IAM子用户、联邦用户（虚拟IAM用户）、委托用户和所有用户授权。约束与限制华为云账号只有华为云账号可以使用委托授权

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。其他方式导入的模型，服务内部已做处理。协议错误请求报错：{"error_code":"ModelArts.4503", "error_msg":"Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用AWQ量化工具转换权重 - AI开发平台ModelArts

16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。运行“examples/quantize

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
查询APP的API认证信息 - AI开发平台ModelArts

AuthTypeApiBasicInfo 参数参数类型描述 api_id String API编号。 api_method String 请求方式包含GET、POST、PUT、DELETE、HEAD、PATCH、OPTIONS、ANY，固定返回ANY。 api_name String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

odelArts监控服务。设置告警规则有多种方式。您可以根据实际应用场景，选择设置告警规则的方式。对ModelArts服务设置告警规则对单个服务设置告警规则对模型版本设置告警规则对服务或模型版本的单个指标设置告警规则方式一：对整个ModelArts服务设置告警规则登录管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务

总条数： 745

上一页
1
...
16
17
18
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

查询APP的API认证信息 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线