搜索_华为云

查询支持的镜像列表 - AI开发平台ModelArts

AARCH64：ARM体系架构。 create_at Long 镜像创建的时间，UTC毫秒。 description String 该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：图1 抽取kv-cache量化系数注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：图1 抽取kv-cache量化系数注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：图1 抽取kv-cache量化系数注意： 1、抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。 2、当前社区vllm只支持float8的kv_cache量化，抽取脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
服务启动失败 - AI开发平台ModelArts

为模型启动失败。需要检查两个地方：自定义镜像中的代码开放的端口和创建模型界面上配置的端口。确认两处端口保持一致。模型创建界面如果不填端口信息，则ModelArts会默认监听8080端口，即镜像代码中启用的端口必须是8080。图2 自定义镜像中的代码开放的端口图3 创建模型界面上配置的端口

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用kv-cache-int8量化 - AI开发平台ModelArts

kv_cache_scales.json文件，里面是提取的per-tensor的scale值。内容示例如下：注意： 1、抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。 2、当前社区vllm只支持float8的kv_cache量化，抽取脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：图1 抽取kv-cache量化系数注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
实时推理的部署及使用流程 - AI开发平台ModelArts

效期为24小时，需要使用同一个Token鉴权时，可以缓存起来，避免频繁调用。 AK/SK认证：使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从而通过身份认证。AK/SK签名认证方式仅支持消息体大小12M以内，12M以上的请求请使用Token认证。 APP认证：在请

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在Notebook上安装配置Grafana - AI开发平台ModelArts

Notebook”，在Notebook实例列表里找到对应的实例，选择“更多 > 保存镜像”。在保存镜像对话框中，设置组织、镜像名称、镜像版本和描述信息。单击“确定”保存镜像。镜像会以快照的形式保存，保存过程约5分钟，请耐心等待。此时不可再操作实例。镜像保存成功后，实例状态变为“运行中”，重启Notebook实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

获取路径：Support-E，在此路径中查找下载ModelArts 6.3.910 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。修改代码将AscendSpeed代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

Notebook”，进入“Notebook”管理页面。单击右上角“创建”，进入“创建Notebook”页面，请参见如下说明填写参数。填写Notebook基本信息，包含名称、描述、是否自动停止。填写Notebook详细参数，如选择镜像、资源规格等。 “镜像”：选择统一镜像tensorflow_2.1-cuda_10

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
更新模型服务的单个属性 - AI开发平台ModelArts

表8 响应Body参数参数参数类型描述 error_code String 服务内部错误码。 error_msg String 错误信息。请求示例更新模型服务单个属性。 PUT https://{endpoint}/v1/{project_id}/services/{service_id}/property

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新团队标注任务 - AI开发平台ModelArts

划线和下划线，长度为1-64位。 workforces_config 否 WorkforcesConfig object 团队标注任务团队信息：委托团队管理员分配，或指定团队自行分配。表3 WorkforcesConfig 参数是否必选参数类型描述 agency 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

update -y”，“yum update -y”命令是用于在Linux操作系统上更新软件包的命令。其中，选项-y表示在更新时自动确认所有提示信息，而不需要手动输入“y”确认。请注意，使用此命令将会检查您系统中已安装的软件包并更新至最新版本。图1 yum命令历史查看NetworkManager配置：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
ECS中构建新镜像 - AI开发平台ModelArts

/llm_train/AscendSpeed 编辑llm_train/AscendSpeed中的Dockerfile文件，修改git命令，填写自己的git账户信息。 git config --global user.email "you@example.com" && \ git config --global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：图1 抽取kv-cache量化系数注意： 1、抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。 2、当前社区vllm只支持float8的kv_cache量化，抽取脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：图1 抽取kv-cache量化系数注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
人工标注视频数据 - AI开发平台ModelArts

执行步骤3完成整个视频的标注。单击界面右上角的“标注列表”，在“当前文件标签”的详情页将呈现当前视频带标注的时间点。图3 当前文件标签信息单击页面左上角“返回数据标注预览”，页面将自动返回标注作业详情页面，同时，标注好的视频将呈现在“已标注”页签下。常见问题 Q：视频数据集无法显示或者无法播放视频？

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
模型配置文件编写说明 - AI开发平台ModelArts

需要注意的是，如果您的模型需指定CPU或GPU上运行时，请根据runtime的后缀信息选择，当runtime中未包含cpu或gpu信息时，请仔细阅读“推理支持的AI引擎”中每个runtime的说明信息。 metrics 否 object数据结构模型的精度信息，包括平均数、召回率、精确率、准确率，metrics

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
查询作业资源规格 - AI开发平台ModelArts

响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 spec_total_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口

总条数： 1098

上一页
1
...
43
44
45
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询支持的镜像列表 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

更新团队标注任务 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

人工标注视频数据 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

查询作业资源规格 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线