搜索_华为云

部署在线服务 - AI开发平台ModelArts

服务名称，支持1-64位可见字符（含中文），只能以英文大小写字母或者中文字符开头，名称可以包含字母、中文、数字、中划线、下划线。 description 否 String 服务备注，默认为空，不超过100个字符。 infer_type 否 String 推理方式，取值为real-t

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询服务列表 - AI开发平台ModelArts

service结构参数参数类型描述 service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用SmoothQuant量化 - AI开发平台ModelArts

本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

方式二：使用AutoAWQ量化工具进行量化。 AutoAWQ量化工具的适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/AutoAWQ目录下。 1、使用该量化工具，需要切换conda环境，运行以下命令。 conda create --name

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建资源池 - AI开发平台ModelArts

自定义节点名称前缀。表6 PoolAnnotationsCreation 参数是否必选参数类型描述 os.modelarts/description 否 String 资源池的描述信息。 os.modelarts/billing.mode 否 String 计费模式，可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

–json-key标志来选择用于训练的列。 { 'id': '1', 'url': 'https://simple.wikipedia.org/wiki/April', 'title': 'April', 'text': 'April is the

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

/home/mind/model路径下。--tensor-parallel-size：并行卡数。 --hostname：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口8080。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

home/mind/model路径下。 --tensor-parallel-size：并行卡数。 --hostname：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口8080。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
启动智能任务 - AI开发平台ModelArts

19：基于gaussianblur的数据增强与原图预测结果不一致。 20：基于fliplr的数据增强与原图预测结果不一致。 21：基于crop的数据增强与原图预测结果不一致。 22：基于flipud的数据增强与原图预测结果不一致。 23：基于scale的数据增强与原图预测结果不一致。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建团队标注任务 - AI开发平台ModelArts

<>=&"'，长度为0-1024位。表5 Worker 参数是否必选参数类型描述 create_time 否 Long 创建时间。 description 否 String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 email 否 String 标注成员邮箱。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询APP详情 - AI开发平台ModelArts

否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 iphertext_enabled 否 Boolean 是否明文展示。请求参数表3 请求Header参数参数是否必选参数类型描述 Content-Type

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
VS Code手动连接Notebook - AI开发平台ModelArts

单击页面上方的“Terminal > New Terminal”，此时打开的命令行界面即为远端容器环境命令行。进入引擎后，通过执行如下命令安装依赖包。 pip install spacy 父主题：通过VS Code远程使用Notebook实例

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

方式二：使用AutoAWQ量化工具进行量化。 AutoAWQ量化工具的适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/AutoAWQ目录下。 1、使用该量化工具，需要切换conda环境，运行以下命令。 conda create --name

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
查询模型详情 - AI开发平台ModelArts

模型大小，单位为字节数。 model_status String 模型状态，取值为：publishing/published/failed。 description String 模型描述信息。 execution_code String 执行代码存放的OBS地址，名称固定为“customize_service

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询服务对象列表 - AI开发平台ModelArts

service结构参数参数类型描述 service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

元模型使用的推理引擎，选择训练作业后会自动匹配。 “运行时依赖” 罗列选中模型对环境的依赖。例如依赖“tensorflow”，安装方式为“pip”，其版本必须为1.8.0及以上版本。 “模型说明” 为了帮助其他模型开发者更好的理解及使用您的模型，建议您提供模型的说明文档。单击“添加

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
删除资源池 - AI开发平台ModelArts

资源池的租户id，记录资源池创建在哪个租户账号下。表6 PoolMetaAnnotations 参数参数类型描述 os.modelarts/description String 资源池的描述信息。 os.modelarts/billing.mode String 计费模式。可选值如下： 0：按需计费

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建导入任务 - AI开发平台ModelArts

导入表格数据集，数据库名字。 input 否 String 表格数据集，HDFS路径。例如/datasets/demo。 ip 否 String 用户GaussDB(DWS)集群的IP地址。 port 否 String 用户GaussDB(DWS)集群的端口。 queue_name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

–json-key标志来选择用于训练的列。 { 'id': '1', 'url': 'https://simple.wikipedia.org/wiki/April', 'title': 'April', 'text': 'April is the

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1132

上一页
1
...
52
53
54
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署在线服务 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

查询APP详情 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线