搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

也需要检查是否需要增加新的标签。在图片都标注完成后，单击右上角“开始训练”，在“训练设置”中，在“增量训练版本”中选择之前已完成的训练版本，在此版本基础上进行增量训练。其他参数请根据界面提示填写。设置完成后，单击“确定”，即进行增量训练。系统将自动跳转至“模型训练”页面，待训练完成

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
删除APP - AI开发平台ModelArts
删除APP - AI开发平台ModelArts

表3 请求Header参数参数是否必选参数类型描述 Content-Type 否 String 消息体的类型。设置为text/plain，返回临时预览链接。设置为application/octet-stream，返回临时下载链接。 X-Auth-Token 是 String 用户token。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建Workflow训练作业节点 - AI开发平台ModelArts

JobEngine(image_url="fake_image_url"), # 自定义镜像的url，格式为：组织名/镜像名称:版本号，不需要携带相应的域名地址；如果image_url需要设置为运行态可配置，则使用如下方式：image_url=wf.Placeholder(name="image_url", placeholder_type=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
查询资源池列表 - AI开发平台ModelArts

用户在cbc选择的折扣信息。 os.modelarts/service.console.url String 订购订单支付完成后跳转的url地址。 os.modelarts/order.id String 订单id，包周期资源池创建或者计费模式变更的时候该参数必需。 os.modelarts/flavor

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用AWQ量化 - AI开发平台ModelArts

transformers sentencepiece #安装量化工具依赖 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py 详细说明可以参考vLLM官网：https://docs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
开发Workflow的核心概念介绍 - AI开发平台ModelArts

swr_path 容器镜像的SWR路径是 str 示例： example = SWRImage(swr_path = "**") # 容器镜像地址，用于模型注册节点的输入表9 GalleryModel 属性描述是否必填数据类型 subscription_id 订阅模型的订阅ID

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
附录：大模型推理常见问题 - AI开发平台ModelArts

zer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

transformers sentencepiece #安装量化工具依赖 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py 详细说明可以参考vLLM官网：https://docs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

最多支持100档配置，每一档通过英文逗号分隔。如果用户设置的dim数值过大或档位过多，可能会导致模型编译失败，此时建议用户减少档位或调低档位数值。如果用户设置了动态维度，实际推理时，使用的输入数据的shape需要与设置的档位相匹配。父主题：应用迁移

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

模型基本信息参数说明参数名称说明名称模型名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建模型的版本。第一次导入时，默认为0.0.1。说明：模型创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述模型的简要描述。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

选择续费时长，并根据需要设置自动续费次数，单击“开通”。图2 开通自动续费在续费管理页面修改自动续费进入“费用中心 > 续费管理”页面。选择需要修改自动续费的专属资源池，单击操作列“修改自动续费”。设置续费方式，选择续费时长，并根据需要设置自动续费次数，单击“确认”。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
查询服务列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、limit查询参数时，count与total相同。 services service结构数组查询到的服务集合。表3 service结构

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
advisor调优总体步骤 - AI开发平台ModelArts

stage的计算量存在差异，advisor会自动对不同stage进行计算维度的分析，因此在Advanced Setting中设置分析进程为2（不建议设置太大，避免占用过多CPU资源导致OOM类问题）使能并行分析，加快分析速度，如下图4所示。图4 基于performance advisor进行性能劣化分析

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

用。 “计算节点规格”：在下拉框中选择限时免费的CPU资源，如果限时免费资源售罄，建议选择收费CPU资源进行部署。 “计算节点个数”，默认设置为“1”。其他参数可使用默认值。选择CPU资源部署模型会收取少量费用，具体费用以界面信息为准。如果需要使用GPU资源部署上线，需要进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
查找Workflow工作流 - AI开发平台ModelArts

在工作流列表上方的搜索框中，根据您需要的属性类型，例如名称、状态、当前节点、启动时间、运行时长或标签等，过滤出相应的工作流。图1 属性类型单击搜索框右侧的按钮，可设置Workflow列表页需要展示的内容和展示效果。表格内容折行：默认为关闭状态。启用此功能可以让Workflow列表页中的内容在显示时自动

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
创建开发环境实例 - AI开发平台ModelArts

NoDiscount instance_num Integer 当前用户创建的该规格实例的数量。 duration Integer 启动后设置的自动停止时间，单位为秒。 store_time Integer 该规格实例处于非活跃状态，在数据库最长保存的时长。单位为小时。默认为“-1”

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询训练作业参数详情 - AI开发平台ModelArts

参数参数类型说明 id String SFS Turbo 文件系统 ID。 src_path String SFS Turbo 文件系统地址。 dest_path String 训练作业的本地路径。 read_only Boolean dest_path 是否为只读权限，默认为读写权限。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
资源池监控 - AI开发平台ModelArts

取值范围大于0并且大于等于(endTimeInMillis - startTimeInMillis) / (60 * 1000) - 1 当开始时间与结束时间都设置为-1时，系统会将结束时间设置为当前时间UTC毫秒值，并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如：-1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

在“专属资源池扩缩容”页面，设置“资源配置 > 可用区”，可用区可选择“随机分配”和“指定AZ”。选择随机分配时，扩缩容完成后，节点的可用区分布由系统后台随机选择。选择指定AZ时，可指定扩缩容完成后节点的可用区分布。修改容器引擎空间大小扩容资源池时，可以设置新建节点的容器引擎空间

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理

总条数： 1306

上一页
1
...
52
53
54
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

删除APP - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

查询资源池列表 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

查找Workflow工作流 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线