搜索_华为云

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

GB时，至少需要2张卡运行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

GB时，至少需要2张卡运行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

GB时，至少需要2张卡运行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
模型推理代码编写说明 - AI开发平台ModelArts

label = json.load(f) 预处理方法、实际推理请求方法和后处理方法中的接口传入“data”当前支持两种content-type，即“multipart/form-data”和“application/json”。 “multipart/form-data”请求 curl

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
身份认证与访问控制 - AI开发平台ModelArts

远程接入管理使用本地IDE远程SSH连接ModelArts的Notebook开发环境时，需要用到密钥对进行鉴权认证。同时支持白名单访问控制，即设置允许远程接入访问这个Notebook的IP地址。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询模型详情 - AI开发平台ModelArts

schema_doc String 模型schema文档的下载地址。 image_address String 模型的执行镜像地址，镜像未构建之前（即当前模型从未发布成服务），显示为空。 input_params params结构数组模型的输入参数集，默认为空 output_params

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

GitHub开源仓库地址：https://github.com/jupyterlab/extension-examplesitHub，单击，输入仓库地址，单击确定后即开始克隆，克隆完成后，JupyterLab左侧导航出现代码库文件夹。图2 使用git插件克隆GitHub的开源代码仓库克隆GitHub的私有仓库

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
托管模型到AI Gallery - AI开发平台ModelArts

文件上传完成前，请不要刷新或关闭上传页面，防止意外终止上传任务，导致数据缺失。当模型的“任务类型”是除“文本问答”和“文本生成”之外的类型（即自定义模型）时，上传的模型文件要满足自定义模型规范，否则该模型无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。当托管

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
从OBS目录导入数据到数据集 - AI开发平台ModelArts

导入已标注的文件，导入完成后，请检查您导入的数据是否为已标注状态。表格数据集从OBS导入操作 ModelArts支持从OBS导入表格数据，即csv文件。表格数据集导入说明：导入成功的前提是，数据源的schema需要与创建数据集指定的schema保持一致。其中schema指表格

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
Notebook Cache盘告警上报 - AI开发平台ModelArts

单击“创建主题”填写主题名称，选择企业项目后，单击确定即可创建一个主题。单击主题名称“操作”列的“更多 > 设置主题策略”。选择APM，即允许AOM的告警触发SMN服务。图5 设置主题策略单击主题名称“操作”列的“添加订阅”。订阅成功后，一旦满足告警条件，那么就会收到通知。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
标注文本分类数据 - AI开发平台ModelArts

完成标注。当“标注对象列表”内容较多时，其区域下方将呈现翻页，请务必在本页完成标注后，单击“保存当前页”保存后再翻页。如果您未完成保存即翻页，将导致前一页的标注信息丢失，需重新标注。图2 数据标注-文本分类添加或删除数据自动学习项目中，数据来源为数据集中输入位置对应的O

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--speculative-model ${container_draft_model_path}：投机草稿模型地址，模型格式是HuggingFace的目录格式。即Step2 准备权重文件上传的HuggingFace权重文件存放目录。投机草稿模型为与--model入参同系列，但是权重参数远小于--mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--speculative-model ${container_draft_model_path}：投机草稿模型地址，模型格式是HuggingFace的目录格式。即Step2 准备权重文件上传的HuggingFace权重文件存放目录。投机草稿模型为与--model入参同系列，但是权重参数远小于--mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
VS Code手动连接Notebook - AI开发平台ModelArts

程访问模块获取的端口号。 User：登录用户只支持ma-user进行登录。 IdentityFile: 存放在本地的云上开发环境私钥文件，即前提条件准备好密钥对中准备的密钥对。再回到SSH Targets页面，选择远程开发环境名称，单击右侧的Connect to Host in

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智能边缘平台，在边缘节点将模型部署为一个Web Service，需提前在IEF（智能边缘服务）创建好节点。 vpc_id 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新服务配置 - AI开发平台ModelArts

2u/modelarts.vm.gpu.p4(需申请)/modelarts.vm.ai1.a310(需申请)，需申请权限才能使用的规格请在华为云创建工单，由ModelArts运维工程师添加权限。 instance_count 是 Integer 模型部署的实例数，当前限制最大实例数

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
切换Lite Server服务器操作系统 - AI开发平台ModelArts

当前裸金属服务器状态为停止状态。目标操作系统必须是该Region下的IMS公共镜像或者私有共享镜像。在BMS控制台切换操作系统获取操作系统镜像。由华为云官方提供给客户操作系统镜像，在IMS镜像服务的共享镜像处进行接收即可，参考如下图操作。图1 共享镜像切换操作系统。对Lite Ser

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
日志提示"Permission denied" - AI开发平台ModelArts

v1训练作业环境变量迁移v2说明： v1的DLS_TASK_NUMBER环境变量，可以使用v2的MA_NUM_HOSTS环境变量替换，即选择的训练节点数。 v1的DLS_TASK_INDEX环境变量，当前可以使用v2的VC_TASK_INDEX环境变量替换，下一步使用MA_T

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
训练中的权重转换说明 - AI开发平台ModelArts

/home/ma-user/ws/xxx-Ascend/llm_train/AscendSpeed/tokenizers/Llama2-13B tokenizer路径，即：原始Hugging Face模型路径 MODEL_SAVE_PATH /home/ma-user/ws/xxx-Ascend/llm_tr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
使用Notebook进行代码调试 - AI开发平台ModelArts

“描述” 对Notebook的简要描述。 “自动停止” 默认开启，且默认值为“1小时”，表示该Notebook实例将在运行1小时之后自动停止，即1小时后停止规格资源计费。开启自动停止功能后，可选择“1小时”、“2小时”、“4小时”、“6小时”或“自定义”几种模式。选择“自定义”模式时，可指定1~24小时范围内任意整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡

总条数： 964

上一页
1
...
40
41
42
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

从OBS目录导入数据到数据集 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

标注文本分类数据 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线