搜索_华为云

推理性能测试 - AI开发平台ModelArts

动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
语言模型推理性能测试 - AI开发平台ModelArts

动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型使用预置框架构建自定义镜像原理介绍如果先前基于预置框架且通过指定代码目录和启动文件的方式来创建的训练作业；但是随着业务逻辑的逐渐复杂，您期望可以基于预置框架修改或增加一些软件依赖的时候，可以使用预置框架构建自定义镜像，即在创建训练作业页面选择预置框架名称后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
修改模型服务QPS - AI开发平台ModelArts

应速度和处理效率。不当的QPS配置可能导致用户等待时间延长，影响满意度。因此，能够灵活调整模型的QPS对于保障服务性能、优化用户体验、维持业务流畅及控制成本至关重要。 ModelArts Studio大模型即服务平台支持手动修改模型服务的实例流量限制QPS，该操作不会影响部署服务的正常运行。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
推理性能测试 - AI开发平台ModelArts

动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
语言模型推理性能测试 - AI开发平台ModelArts

动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
扩缩容模型服务实例数 - AI开发平台ModelArts

扩缩容模型服务实例数在使用大型模型进行推理时，其业务需求会呈现出明显的峰谷波动。因此，模型服务必须具备灵活的扩缩容能力，以适应不同时间段内的用户负载变化，确保服务的高可用性和资源的高效利用。 ModelArts Studio大模型即服务平台支持手动扩缩容模型服务的实例数，该操作不会影响部署服务的正常运行。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
管理AI Gallery模型 - AI开发平台ModelArts

编辑模型基础设置和模型描述。表1 模型介绍的参数说明参数名称说明基础设置中文名称显示模型的名称，不可编辑。许可证模型遵循的使用许可协议，根据业务需求选择合适的许可证类型。语言选择使用模型时支持的输入输出语言。框架选择构建模型使用的AI开发框架。任务类型选择模型支持的任务类型，不同任务类型支持的AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
VS Code一键连接Notebook - AI开发平台ModelArts

框，请单击“Reload Window and Open”。本文以VS Code 1.78.2版本的操作为例，其他版本的VS Code可能不会弹出“Reload Window and Open”，请直接执行5。图6 Reload Window and Open 在弹出的提示中，勾选“Don't

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

如果您使用的是专属资源池，则训练作业就不再进行单独计费。由专属资源池进行收费。 Standard中模型部署为服务后如何收费？ ModelArts支持将模型按照业务需求部署为服务。训练类型不同，部署后的计费方式不同。将模型部署为服务时，根据数据集大小评估模型的计算节点个数，根据实际编码情况选择计算模式。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
Standard镜像相关 - AI开发平台ModelArts

配有哪些注意事项？镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？如何保证自定义镜像能不因为超过35G而保存失败？如何减小本地或ECS构建镜像的目的镜像的大小？镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？在Mo

帮助中心 > AI开发平台ModelArts > 常见问题
创建模型不同方式的场景介绍 - AI开发平台ModelArts

将自动上传至模型列表中。但是自动学习生成的模型无法下载，只能用于部署上线。创建模型、管理模型版本等功能目前是免费开放给所有用户，使用此功能不会产生费用。创建模型的几种场景从训练作业中导入模型文件创建模型：在ModelArts中创建训练作业，并完成模型训练，在得到满意的模型后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
重建、停止或删除训练作业 - AI开发平台ModelArts

当您需要修改训练作业的算法时，可以在训练作业详情页面右上角，单击“另存为算法”。在“创建算法”页面中，会自动填充上一次训练作业的算法参数配置，您可以根据业务需求在原来算法配置基础上进行修改。订阅算法不支持另存为算法。重建训练作业当对创建的训练作业不满意时，您可以单击操作列的重建，重新创建

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在ModelArts的Notebook中如何查看GPU使用情况？ - AI开发平台ModelArts

打开文件“/resource_info/gpu_usage.json”，可以看到有哪些进程在使用GPU。如果当前没有进程使用GPU，该文件可能不存在或为空。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
管理AI Gallery数据集 - AI开发平台ModelArts

编辑数据集基础设置和数据集描述。表1 数据集介绍的参数说明参数名称说明基础设置中文名称显示数据集的名称，不可编辑。许可证数据集遵循的使用许可协议，根据业务需求选择合适的许可证类型。语言选择使用数据集时支持的输入输出语言。任务类型选择数据集支持用于什么类型的训练模型。运行平台选择数据集额外支持的运行平台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

用户自行安装了Jupyterlab服务导致冲突的，需要用户本地使用Jupyterlab命令罗列出相关的静态文件路径，删除并且卸载镜像中的Jupyterlab服务；用户自己业务占用了开发环境官方的8888、8889端口的，需要用户修改自己的进程端口号；用户的镜像指定了PYTHONPATH、sys.path导致服

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
推理性能测试 - AI开发平台ModelArts

动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

责任共担华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击，华为云在遵从法律法规业界标准的基础上，以安全生态圈为护城河，依托华为独有的软硬件优势，构建面向不同区域和行业的完善云服务安全保障体系。安全性是华为云与您的共同责任，如图1所示。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
推理性能测试 - AI开发平台ModelArts

动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

定期针对镜像进行安全扫描，及时安装补丁修复漏洞。增加健康检查接口，确保健康检查可以正常返回业务状态，便于告警和故障恢复。容器应该采用https的安全传输通道，并使用业界推荐的加密套件保证业务数据的安全性。部署上线部署服务时，需要注意为服务设置合适计算节点规格，防止服务因资源不

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全

总条数： 335

上一页
1
...
9
10
11
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

Standard镜像相关 - AI开发平台ModelArts

创建模型不同方式的场景介绍 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

在ModelArts的Notebook中如何查看GPU使用情况？ - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线