搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

ype类型不影响int8的scale系数的抽取和加载。启动kv-cache-int8-per-tensor量化服务。在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8_pertensor #只支持int8，表示kvint8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
推理性能测试 - AI开发平台ModelArts

benchmark_parallel.csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务部署的IP。 --port：推理服务端口8080。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
如何购买或开通ModelArts？ - AI开发平台ModelArts

能才涉及计费，公共资源池全部为按需模式，根据选用规格以及作业运行时长收费。专属资源池可按需购买，也可选择包年包月购买，在运行训练作业或部署服务时，选择专属资源池，无需另外付费。父主题：一般性问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

登录ModelArts管理控制台，在“总览”页中，单击“购买套餐包”，进入“购买套餐包”页面。可根据需要，自行购买适用规格的套餐包。适用场景 ModelArts服务支持购买套餐包，根据用户选择使用的资源不同进行收费。您可以根据业务需求选择使用不同规格的套餐包。 ModelArts提供了AI全流程开发的

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
使用kv-cache-int8量化 - AI开发平台ModelArts

ype类型不影响int8的scale系数的抽取和加载。启动kv-cache-int8-per-tensor量化服务。在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8_pertensor #只支持int8，表示kvint8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

产品优势 ModelArts服务具有以下产品优势。稳定安全的算力底座，极快至简的模型训练支持万节点计算集群管理大规模分布式训练能力，加速大模型研发提供高性价比国产算力多年软硬件经验沉淀，AI场景极致优化加速套件，训练、推理、数据访问多维度加速一站式端到端生产工具链，一致性开发体验

 帮助中心 > AI开发平台ModelArts > 产品介绍
AI Gallery功能介绍 - AI开发平台ModelArts

AI Gallery功能介绍面向开发者提供了AI Gallery大模型开源社区，通过大模型为用户提供服务，普及大模型行业。AI Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
线上训练得到的模型是否支持离线部署在本地？ - AI开发平台ModelArts

获取训练输出位置单击“输出路径”，跳转至OBS对象路径，下载训练得到的模型。在本地环境进行离线部署。具体请参见模型调试章节在本地导入模型，参见服务调试章节，将模型离线部署在本地并使用。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

数据集。前提条件本地或对象存储服务（OBS）中已准备好待发布的数据集，或ModelArts的数据集列表存在待发布的数据集。发布数据集进入AI Gallery首页，选择“资产集市 > 数据集”，进入数据页面。单击“发布”弹出“选择云服务区域”，选择区域后单击“确定”进入发布数据集页面，填写相关信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
Finetune训练 - AI开发平台ModelArts

ing）以优化模型性能。启动SD1.5 Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_finetune_train.sh 启动SDXL Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh di

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host ${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。 --to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

String 原因描述。 suggestion String 处理建议。表6 Worker 参数参数类型描述 create_time Long 创建时间。 description String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 email String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
自动学习为什么训练失败？ - AI开发平台ModelArts

求：此OBS目录下未存放其他文件夹。文件名称中无特殊字符，如~`@#$%^&*{}[]:;+=<>/ 如果OBS路径符合要求，请您按照服务具体情况执行3。自动学习项目不同导致的失败原因可能不同。图像识别训练失败请检查是否存在损坏图片，如有请进行替换或删除。物体检测训练失

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh run_lora.sh 所有数据保存在auto_log/avg_step_time.txt文本中 auto_log/log/目录下存放各个shapes的数据。启动SDXL LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
查询样本列表 - AI开发平台ModelArts

String 原因描述。 suggestion String 处理建议。表6 Worker 参数参数类型描述 create_time Long 创建时间。 description String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 email String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。上面命令中使用vllm举例。 --host ${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。 --tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

), wf.policy.Scene( scene_name="服务部署", scene_steps=[model_step, service_step]

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

set_compile_mode(jit_compile=False) 启动服务用ifconfig命令获取容器ip（若无效可使用ip addr，或者自行寻找其他方式获取到容器ip）。首先进入目录。 cd /home/ma-user/ComfyUI 启动服务命令如下。 python main.py --port

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
推理业务迁移评估表 - AI开发平台ModelArts

性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
认证证书 - AI开发平台ModelArts
认证证书 - AI开发平台ModelArts

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全

总条数： 1943

上一页
1
...
91
92
93
...
98
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

如何购买或开通ModelArts？ - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

线上训练得到的模型是否支持离线部署在本地？ - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

自动学习为什么训练失败？ - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

认证证书 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线