搜索_华为云

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI Gallery工具链服务部署完成后将一直处于“运行中”。指定时长：设置作业运行几小时后停止，当AI Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

根据业务需求和数据集类型选择合适的许可证类型。单击许可证类型后面的感叹号可以查看许可证详情。说明：部分许可证网站说明地址是海外网站，用户可能会因网络限制无法访问。谁可以看设置此数据集的公开权限。可选值有： “公开”：表示所有使用AI Gallery的用户都可以查看且使用该资产。 “指定

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
推理精度测试 - AI开发平台ModelArts

试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
配置ModelArts委托授权 - AI开发平台ModelArts

中。本章节主要介绍一键式自动授权方式。一键式自动授权方式支持给IAM子用户、联邦用户（虚拟IAM用户）、委托用户和所有用户授权。约束与限制华为云账号只有华为云账号可以使用委托授权，可以为当前账号授权，也可以为当前账号下的所有IAM用户授权。多个IAM用户或账号，可使用同一个委托。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
训练启动脚本说明和参数配置 - AI开发平台ModelArts

obs_data_dir) 不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

专属资源池需单独创建，不与其他租户共享。公共资源池实例规格选择实例规格，规格中描述了服务器类型、型号等信息。 xxx 流量限制（QPS）设置待部署模型的流量限制QPS。 3 实例数设置服务器个数。 1 更多选项内容审核选择是否打开内容审核，默认启用。开关打开（默认打开），

帮助中心 > AI开发平台ModelArts > 快速入门
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

Turbo的VPC网段，推荐网段为10.X.X.X。具体操作请参见修改虚拟私有云网段。如果满足条件，则继续下一步。查看SFS Turbo的VPC网段的安全组是否被限制了。在所选专属资源池中新建一个未挂载的SFS Turbo的训练作业，当训练作业处于“运行中”时，通过Cloud Shell功能登录训练作业worker-0实例，使用curl

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

ModelArts服务具备资源池和隔离能力，避免单租户资源被攻击导致爆炸半径过大风险。 ModelArts服务定义并维护了性能规格用于自身的抗攻击性。例如：设置API访问限制，防止恶意接口调用等场景。 ModelArts服务在攻击场景下，具备告警能力及自我保护能力。 ModelArts服务提供了业务异常行为感知

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
推理精度测试 - AI开发平台ModelArts

试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
工具介绍及准备工作 - AI开发平台ModelArts

#训练启动脚本 ├── data.tgz # 样例数据 ├── setup.py # 构建工具包约束限制目前仅支持以下模型： qwen2.5-7b qwen2-7b qwen1.5-7b llama3.2-3b llama3.1-8b llama3-8b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
开发Workflow的核心概念介绍 - AI开发平台ModelArts

描述是否必填数据类型 name 工作流的名称，命名规范(只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64位字符是 str desc 工作流的描述信息是 str steps 工作流包含的节点列表是 list[Step] storages

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
推理场景介绍 - AI开发平台ModelArts

程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.905版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

创建新的作业。旧版训练管理是否停止新购？是的，旧版训练管理将于2023年6月30日 00:00(北京时间)正式退市。旧版训练管理如何升级到新版训练？请参考新版训练指导文档（模型训练）来体验新版训练。旧版训练迁移至新版训练需要注意哪些问题？新版训练和旧版训练的差异主要体现在以下3点。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

请求的时间差，如果时间差超过15分钟，API网关将拒绝请求。约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。获取AK/SK 如果已生成过

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
获取Workflow工作流列表 - AI开发平台ModelArts

object 订阅信息。 consume_limit Long 订阅限制。 current_consume Long 当前订阅。 current_date String 当前时间。 limit_enable Boolean 限制标记。 created_at String 创建时间。表22

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

BS桶名称）。预下载至本地目录选择“不下载”。 “资源类型”：选择GPU单卡的规格。如果有免费GPU规格，可以选择免费规格进行训练。其他参数保持默认即可。本样例代码为单机单卡场景，选择GPU多卡规格会导致训练失败。单击“提交”，确认训练作业的参数信息，确认无误后单击“确定”。

帮助中心 > AI开发平台ModelArts > 快速入门
创建导入任务 - AI开发平台ModelArts

导入Manifest时，path必须精确到具体Manifest文件。导入为目录时，目前仅支持数据集类型为图片分类、物体检测、图像分割、文本分类、声音分类和表格数据集。字符限制：不允许出现的特殊字符有换行符(\n)、回车符(\r)、制表符(\t)。 annotation_config 否表4 数据标注格式的说明

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 导入任务管理
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

W8A16量化什么是W8A16量化使用W8A16的量化不仅可以保证精度在可接受的范围内，同时也有一定的性能收益。约束限制只支持GPTQ W8A16 perchannel量化，只支持desc_act=false。 GPTQ W8A16量化支持的模型请参见支持的模型列表。步骤一：量化模型权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化

总条数： 702

上一页
1
...
25
26
27
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线