搜索_华为云

部署推理服务 - AI开发平台ModelArts

与--model入参同系列，但是权重参数远小于--model指定的模型。如果未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。如果未使用投机推理功能，则无需配置。参数--num-speculative-tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

与--model入参同系列，但是权重参数远小于--model指定的模型。如果未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。如果未使用投机推理功能，则无需配置。参数--num-speculative-tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
查询APP是否存在 - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

ts.6786。更新密钥对具体操作请参见修改Notebook SSH远程连接配置。具体的错误信息提示：ModelArts.6789: 在ECS密钥对管理中找不到指定的ssh密钥对xxx，请更新密钥对并重试。父主题：典型场景配置实践

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
在推理生产环境中部署推理服务 - AI开发平台ModelArts

与--model入参同系列，但是权重参数远小于--model指定的模型。如果未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。如果未使用投机推理功能，则无需配置。参数--num-speculative-tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查找Notebook实例 - AI开发平台ModelArts

ts.6786。更新密钥对具体操作请参见修改Notebook SSH远程连接配置。具体的错误信息提示：ModelArts.6789: 在ECS密钥对管理中找不到指定的ssh密钥对xxx，请更新密钥对并重试。父主题：管理Notebook实例

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用AWQ量化工具转换权重 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
创建网络资源 - AI开发平台ModelArts

用户指定的network名称。 os.modelarts/workspace.id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表5 NetworkSpec 参数是否必选参数类型描述 cidr

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ANNGraph图模式目前支持llama和qwen2系列大语言模型单卡场景，包含该系列AWQ量化模型，其他场景(如Multi-lora)暂未支持。小模型如Qwen2-1.5B和Qwen2-0.5B推荐不设置该参数。 --disable-async-output-proc：关闭异步后处理特性，关闭后性能会下降。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查询API - AI开发平台ModelArts
查询API - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
模型训练计费项 - AI开发平台ModelArts

对象存储OBS 用于存储模型训练的输入和输出数据。具体费用可参见对象存储价格详情。注意：存储到OBS中的数据需在OBS控制台进行手动删除。如果未删除，则会按照OBS的计费规则进行持续计费。按需计费包年/包月创建桶不收取费用，按实际使用的存储容量和时长收费弹性文件服务SFS Turbo

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
在推理生产环境中部署推理服务 - AI开发平台ModelArts

与--model入参同系列，但是权重参数远小于--model指定的模型。如果未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。如果未使用投机推理功能，则无需配置。参数--num-speculative-tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
释放Lite Server资源 - AI开发平台ModelArts

鼠标移动至节点名称上，复制需要退订的实例ID。图3 复制实例ID Server购买订单里绑定的资源ID为Server ID，与Server产品所封装的BMS/ECS ID不同，若要退订Server，需要在ModelArts控制台的“资源管理 > AI专属资源池 > 弹性节点Server”中查询对应ID。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
执行训练任务【旧】 - AI开发平台ModelArts

/scripts_modellink/install.sh; sh ./scripts_modellink/llama2/0_pl_sft_13b.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/work/llm_train/AscendFactory;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
发布Workflow到ModelArts - AI开发平台ModelArts

wf.AlgorithmParameters(name="save_model_secs", value=wf.Placeholder(name="save_model_secs", placeholder_type=wf.PlaceholderType.INT, default=60

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
资源选择推荐 - AI开发平台ModelArts

桶（存放代码）”，采用分布式训练。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买。（并行文件系统） × 免费。免费。包月购买。免费。 × 按需购买。单机多卡 × 包月购买。（HPC型500G）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
查询AI应用列表 - AI开发平台ModelArts

asc: 递增排序 desc: 递减排序，默认值 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 model_type 否 String 模型类型，查询属于该类型的

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

device)) img_secs.append(img_sec) # Results img_sec_mean = np.mean(img_secs) img_sec_conf = 1.96 * np.std(img_secs) log('Img/sec per %s:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
部署推理服务 - AI开发平台ModelArts

为与--model入参同系列，但是权重参数远小于--model指定的模型。若未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。若未使用投机推理功能，则无需配置。参数--num-speculative-toke

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

Gallery工具链服务运行时长达到指定时长时，系统将会暂停作业。时长设置不能超过计算资源的剩余额度。说明：如果选择付费资源，则请确认账号未欠费，且余额高于所选计算规格的收费标准，否则可能会导致AI Gallery工具链服务异常中断。AI Gallery的计算规格的计费说明请参见计算规格说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用

总条数： 602

上一页
1
...
20
21
22
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查询APP是否存在 - AI开发平台ModelArts

给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查找Notebook实例 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询API - AI开发平台ModelArts

模型训练计费项 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线