搜索_华为云

投机推理使用说明 - AI开发平台ModelArts

平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

&& cd ${container_work_dir}/data # 下载pretrain_clip场景的数据集 git clone https://huggingface.co/datasets/liuhaotian/LLaVA-Pretrain cd LLaVA-Pretrain

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
创建ModelArts委托 - AI开发平台ModelArts

s_agency的委托。响应参数无请求示例创建ModelArts委托。设置委托名称后缀为“iam-user01”。 POST https://{endpoint}/v2/{project_id}/agency { "agency_name_suffix" : "iam-user01"

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
查询团队标注任务成员的进度信息 - AI开发平台ModelArts

Map<String,Map<String,Integer>> 团队标注任务成员标注情况的统计信息。请求示例查询团队标注任务成员的进度信息 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/workforce-tasks/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
MaaS使用场景和使用流程 - AI开发平台ModelArts

配置方案，有效避免了资源闲置与浪费，降低了进入AI领域的门槛。架构强调高可用性，多数据中心部署确保数据与任务备份，即使遭遇故障，也能无缝切换至备用系统，维持模型训练不中断，保护长期项目免受时间与资源损耗，确保进展与收益。大模型应用开发，帮助开发者快速构建智能Agents 在企

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
配置Lite Server网络 - AI开发平台ModelArts

款”。虚拟私有云和子网和Server资源的网络保持一致。配置SNAT规则。 SNAT功能通过绑定弹性公网IP，实现私有IP向公有IP的转换，可实现VPC内跨可用区的多个云主机共享弹性公网IP、安全高效地访问互联网。公网NAT网关页面，单击创建的NAT网关名称，进入NAT网关详情页。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ocker命令基本一致，可用于后续镜像构建步骤中。 # 下载 nerdctl 工具，注意使用的是1.7.6 arm64版本 wget https://github.com/containerd/nerdctl/releases/download/v1.7.6/nerdctl-1.7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
语言模型推理性能测试 - AI开发平台ModelArts

可以根据实际需求设置。 --num-requests：输出数据集的数量，可以根据实际需求设置。进入benchmark_tools目录下，切换一个conda环境。 cd benchmark_tools conda activate python-3.9.10 执行脚本benchmark_serving

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
查询可视化作业列表 - AI开发平台ModelArts

String 可视化作业的计费资源ID。请求示例如下以查询正在部署中的作业，按递增排序，显示第1页前10个可视化作业为例。 GET https://endpoint/v1/{project_id}/visualization-jobs ?status=7&per_page=10

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
查询镜像详情 - AI开发平台ModelArts

该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Noteboo

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
重启可视化作业 - AI开发平台ModelArts

error_message String 调用失败时的错误信息。调用成功时无此字段。请求示例如下以重启作业ID为10的可视化作业为例。 POST https://endpoint/v1/{project_id}/visualization-jobs/10/restart 响应示例成功响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
更新训练作业描述 - AI开发平台ModelArts

-879d-24b05d997347的训练作业为例。修改成功后再调用查询训练作业接口即可看到description已被修改。 PUT https://endpoint/v2/{project_id}/training-jobs/3faf5c03-aaa1-4cbe-879d-24b05d997347

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除标注团队 - AI开发平台ModelArts

success Boolean 操作是否执行成功。可选值如下： true：执行成功 false：执行失败请求示例删除标注团队 DELETE https://{endpoint}/v2/{project_id}/workforces/{workforce_id} 响应示例状态码： 204

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询运行中的Notebook可用时长 - AI开发平台ModelArts

timing：自动停止。 idle：空闲停止。 update_at Long 实例最后更新（不包括探活心跳）的时间，UTC毫秒。请求示例 GET https://{endpoint}/v1/{project_id}/notebooks/{id}/lease 响应示例状态码：200 OK {

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

式是HuggingFace的目录格式。即上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址，还需要有Tokenizer原始文件。 --max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

job id is 6ABxxx [2022/08/12 00:03:25 GMT+0800][INFO]Request url is https://modelarts.xxx.xxx.com/v1/88exxxta/models?model_name=query_vec_recall_model

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
启动停止边缘节点服务实例 - AI开发平台ModelArts

启动。 stopped：stopped为停止节点实例，只有处于running状态的节点实例支持停止。响应参数无请求示例 PUT https://{endpoint}/v1/{project_id}/services/{service_id}/nodes/{node_id}/status

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新可视化作业描述 - AI开发平台ModelArts

调用成功时无此字段。请求示例如下以更新作业ID为10的作业描述为“This is a ModelArts job”为例。 PUT https://endpoint/v1/{project_id}/visualization-jobs/10 { "job_desc": "This

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
查询标注团队详情 - AI开发平台ModelArts

String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求示例查询标注团队详情 GET https://{endpoint}/v2/{project_id}/workforces/{workforce_id} 响应示例状态码： 200

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
获取超参敏感度分析结果 - AI开发平台ModelArts

如下查询training_job_id为04f679b17380d32a2f32c00335c4b5ba作业的超参敏感度分析结果。 GET https://endpoint/v2/{project_id}/training-jobs/04f679b17380d32a2f32c00335

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 951

上一页
1
...
41
42
43
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

投机推理使用说明 - AI开发平台ModelArts

LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

查询团队标注任务成员的进度信息 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

查询可视化作业列表 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

重启可视化作业 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

删除标注团队 - AI开发平台ModelArts

查询运行中的Notebook可用时长 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

启动停止边缘节点服务实例 - AI开发平台ModelArts

更新可视化作业描述 - AI开发平台ModelArts

查询标注团队详情 - AI开发平台ModelArts

获取超参敏感度分析结果 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线