搜索_华为云

基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

Cherry Studio是一款开源的多模型桌面客户端，支持Windows、macOS和Linux系统。它集成了多种主流大语言模型（例如OpenAI、DeepSeek、Gemini等），并支持本地模型运行。此外，它还具备丰富的功能，例如对话知识库、AI绘画、翻译、多模型切换等。 ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用
Eagle投机小模型训练 - AI开发平台ModelArts

ma2系列和Qwen2系列模型。步骤一：安装Eagle Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 投机推理
将模型部署为批量推理服务 - AI开发平台ModelArts

"url": "/", "request": { "Content-type": "multipart/form-data", "data": { "type": "object"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite的DevServer。请参考本文档要求准备DevServer机器。资源规格要求计算规格：单机训练需要使用单机8卡，多机训练需要使用2机16卡。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

方式二：使用Java语言发送预测请求 AK/SK签名认证方式，仅支持Body体12M以内，12M以上的请求，需使用Token认证。客户端须注意本地时间与时钟服务器的同步，避免请求消息头X-Sdk-Date的值出现较大误差。因为API网关除了校验时间格式外，还会校验该时间值与网关收到请求的时间差，如果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
推理场景介绍 - AI开发平台ModelArts

at main (huggingface.co) 注意：Qwen2-VL 开源vllm依赖特定transformers版本，请手动安装： pip install git+https://github.com/huggingface/transformers.git@21fac7ab

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
创建生产训练作业（新版页面） - AI开发平台ModelArts

请参见表4。表3 选择公共资源池参数名称说明资源来源必选，选择“公共资源池”。实例规格必选，选择资源规格，规格名称中体现了服务器类型、型号等信息。当训练代码中已定义资源类型时，则根据算法的约束条件选择合适的资源类型。例如，训练代码中定义的资源类型为CPU，这里选择其他类型时会导致训练失败。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
Yaml配置文件参数配置说明 - AI开发平台ModelArts

采取lora策略方法的目标模块，默认为all dataset 指令微调/ppo：alpaca_en_demo rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo，identity 【可选】注册在dataset_info.json文件数据集名称。如选用自定义数据则需配置dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练脚本说明
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite的DevServer。请参考本文档要求准备DevServer机器。资源规格要求计算规格：单机训练需要使用单机8卡，多机训练需要使用2机16卡。推理部署如果是376T规格，推荐使用单机单卡；280T规格推荐使用单机2卡。硬盘空间：至少200GB。 Ascend资源规格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
查询团队标注任务统计信息 - AI开发平台ModelArts

project_id}/datasets/WxCREuCkBSAlQr9xrde/workforce-tasks/tY330MHxV9dqIPVaTRM/data-annotations/stats?sample_state=__unreviewed__ 响应示例状态码： 200

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Lite的Cluster或DevServer。请参考本文档要求准备资源环境。资源规格要求计算规格：对于Qwen-7B和Qwen-14B单机训练需要使用单机8卡，多机训练需要使用2机16卡。对于Qwen-72B至少需要5机40卡才能训练，建议使用8机64卡执行训练相关任务。硬盘空间：至少200GB。 Ascend资源规格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Lite的DevServer。请参考本文档要求准备资源环境。资源规格要求计算规格：对于Llama2-7B和Llama2-13B单机训练需要使用单机8卡，多机训练需要使用2机16卡。对于Llama2-70B至少需要4机32卡才能训练，建议使用8机64卡执行训练相关任务。硬盘空间：至少200GB。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 准备工作
查询处理任务详情 - AI开发平台ModelArts

数据处理的创建时间。 data_source ProcessorDataSource object 数据处理任务的输入，与inputs二选一。 description String 数据处理任务描述。 duration_seconds Integer 数据处理的运行时间，单位秒。 error_msg

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

--name TEXT Job name. --description TEXT Job description. --image-url TEXT Full swr custom

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
订阅免费算法 - AI开发平台ModelArts

订阅免费算法在AI Gallery中，您可以查找并订阅免费满足业务需要的算法，直接用于创建训练作业。 AI Gallery中分享的算法支持免费订阅，但在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
Ascend-vLLM介绍 - AI开发平台ModelArts

Kv-cache量化，提高吞吐，支持更长序列。高效解码 Auto-prefix-caching 前缀缓存，降低首token时延。在system prompt较长或多轮对话场景收益明显 Chunked-prefill 又名split-fuse。全量增量同时推理，提高资源利用率，提升吞吐。 Speculative

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
Ascend-vLLM介绍 - AI开发平台ModelArts

Kv-cache量化，提高吞吐，支持更长序列。高效解码 Auto-prefix-caching 前缀缓存，降低首token时延。在system prompt较长或多轮对话场景收益明显 Chunked-prefill 又名split-fuse。全量增量同时推理，提高资源利用率，提升吞吐。 Speculative

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

统一管理AI开发全流程，提升开发效率，记录模型构建实验全流程。多场景部署，灵活满足业务需求支持云端/边端部署等多种生产环境。支持在线推理、批量推理、边缘推理多形态部署。 AI工程化能力，支持AI全流程生命周期管理支持MLOps能力，提供数据诊断、模型监测等分析能力，训练智能日志分析与诊断。容错能力强，故障恢复快

 帮助中心 > AI开发平台ModelArts > 产品介绍
使用前必读 - AI开发平台ModelArts

使用前必读在调用ModelArts API之前，请确保已经充分了解ModelArts相关概念，详细信息请参见产品介绍。 ModelArts提供了REST（Representational State Transfer）风格API，支持您通过HTTPS请求调用，调用方法请参见如何调用API。

帮助中心 > AI开发平台ModelArts > API参考
从Manifest文件导入规范说明 - AI开发平台ModelArts

11:30:30" }, { "type":"modelarts/text_triplet", "name":"Author", "id":"R1",

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集

总条数： 1886

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

创建生产训练作业（新版页面） - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

查询处理任务详情 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线