搜索_华为云

使用GPTQ量化 - AI开发平台ModelArts

damp_percent=0.01, desc_act=False, sym=True, use_exllama=False) 您也可以将自己的数据集作为字符串列表传递，但强烈建议使用GPTQ论文中的相同数据集。 dataset = ["auto-gptq is an easy-to-use model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建训练作业版本 - AI开发平台ModelArts

请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 job_desc 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 config 是 Object 创建训练作业需要的参数。详情参见表3。表3 config属性列表参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

更加确定性，较高的值使模型更加随机。0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
使用GPTQ量化 - AI开发平台ModelArts

damp_percent=0.01, desc_act=False, sym=True, use_exllama=False) 您也可以将自己的数据集作为字符串列表传递，但强烈建议使用GPTQ论文中的相同数据集。 dataset = ["auto-gptq is an easy-to-use model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description 否 String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 workspace_id 否 String 指定算法所处的工作空间，默认值为“0”。“0” 为默认的工作空间。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description 否 String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 workspace_id 否 String 指定算法所处的工作空间，默认值为“0”。“0” 为默认的工作空间。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询作业引擎规格 - AI开发平台ModelArts

调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 engines engines结构数组引擎规格参数列表，如表4所示。表4 engines属性列表说明参数参数类型说明 engine_type integer 训练作业的引擎类型。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
部署推理服务 - AI开发平台ModelArts

更加确定性，较高的值使模型更加随机。0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
查询服务监控信息 - AI开发平台ModelArts

String 服务ID。 service_name String 服务名称。 monitors 服务的infer_type对应的monitor结构数组监控信息详情。表2 real-time monitor结构参数参数类型描述 model_id String 模型ID。 model_name

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

t，每个元素都是一个字典，包含"name"和"value"两个字段，以"–name=value"的形式传递给训练启动文件。value支持字符串，整数，布尔等类型。对于布尔类型，建议用户在训练脚本中使用action='store_true'的形式来解析。 framework_typ

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
部署推理服务 - AI开发平台ModelArts

更加确定性，较高的值使模型更加随机。0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
创建Workflow数据集节点 - AI开发平台ModelArts

DatasetProperties 属性描述是否必填数据类型 dataset_name 数据集的名称，只能是中文、字母、数字、下划线或中划线组成的合法字符串，长度为1-100位。是 str、Placeholder dataset_format 数据集格式，默认为0，表示文件类型。否 0：文件类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
PD分离部署使用说明 - AI开发平台ModelArts

NODE_PORTS：仅在服务入口实例生效，用于与全量推理实例、增量推理实例的信息交互。该参数入参为形如{port1},{port2},{portn}的字符串，与全量或增量推理实例启动的--port参数相关。--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(--port)启动服务，并按照global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
创建ModelArts人工标注作业 - AI开发平台ModelArts

别”可添加多个标签类别，一个标签类别可以包含多个标签。“标签类别”和“标签名”只能是中文、字母、数字、英文句号、下划线或中划线组成的合法字符串。长度为1～256字符。设置标签类别：在“标签类别”输入标签类别的名称。设置标签名称：在“标签名”输入标签名称。添加标签：单击“添加标签”可增加多个标签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

String 工作流的一次执行中一个节点的执行ID。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 [数组元素] Array of WorkflowStepMetric objects 工作流节点度量信息。表3 WorkflowStepMetric

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询模型列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总模型数量。 count Integer 模型数量。 models model结构数组模型元数据信息。表3 model结构参数参数类型描述 model_id String 模型ID。 model_name String

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

更加确定性，较高的值使模型更加随机。0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

whl" } ] } ] 模型配置文件的“dependencies”支持多个“dependency”结构数组以list形式填入。示例如下： "dependencies": [ { "installer": "pip", "packages":

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
部署推理服务 - AI开发平台ModelArts

更加确定性，较高的值使模型更加随机。0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
查询算法详情 - AI开发平台ModelArts

算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 workspace_id String 指定算法所处的工作空间，默认值为“0”。“0” 为默认的工作空间。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 182

上一页
1
...
5
6
7
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用GPTQ量化 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

创建ModelArts人工标注作业 - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

查询模型列表 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线