搜索_华为云

推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
升级模型服务 - AI开发平台ModelArts

Studio左侧导航栏中，选择“模型部署”进入服务列表。选择“我的服务”页签。选择模型服务，单击操作列的“更多 > 服务升级”。在服务升级页面，配置升级参数。 “模型设置”：单击“更换”，选择原模型下的其他模型版本。其他参数不可修改，但可以了解原模型服务的配置。配置完成后，单击“提交”启动服务升级。父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

-R ma-user:100 {Python软件包路径} # 设置容器镜像预置环境变量。 # 请务必设置 PYTHONUNBUFFERED=1, 以免日志丢失。 ENV PYTHONUNBUFFERED=1 # 设置容器镜像默认用户与工作目录。 USER ma-user WORKDIR

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询工作空间配额 - AI开发平台ModelArts

工作空间配额数据。表4 WorkspaceQuotasResponse 参数参数类型描述 max_quota Integer 配额允许设置的最大值。 update_time Integer 最后修改时间，UTC。如用户未修改过该资源配额,则该值默认为该工作空间的创建时间。 resource

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
获取智能任务的信息 - AI开发平台ModelArts

inf_cluster_id String 专属集群ID，默认为空，不使用专属集群；使用专属集群部署服务时需确保集群状态正常；配置此参数后，则使用集群的网络配置，vpc_id参数不生效。 inf_config_list Array of InfConfig objects 运行推理任务需要的配置列表，可选填，默认为空。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
开发用于预置框架训练的代码 - AI开发平台ModelArts

器的本地目录。请保证您设置的桶路径有读取权限。在训练作业启动后，ModelArts会挂载硬盘至“/cache”目录，用户可以使用此目录来存储临时文件。“/cache”目录大小请参考训练环境中不同规格资源“/cache”目录的大小。训练输出路径参数建议设置一个空目录为训练输出路

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
在MaaS中创建模型 - AI开发平台ModelArts

说明：百川和Llama系列模型只支持自定义权重。自定义权重存储路径当“权重设置与词表”选择“自定义权重”时，需要选择存放模型权重文件的OBS路径，必须选择到模型文件夹。权重校验当“权重设置与词表”选择“自定义权重”时，需要选择是否开启权重文件校验。默认是开启的。当开启

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查看日志和性能 - AI开发平台ModelArts

time per iteration)×1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
查看日志和性能 - AI开发平台ModelArts

time per iteration)*1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911）
查看日志和性能 - AI开发平台ModelArts

time per iteration)×1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911）
精度问题处理 - AI开发平台ModelArts

精度问题处理设置高精度并重新转换模型在转换模型时，默认采用的精度模式是fp16，如果转换得到的模型和标杆数据的精度差异比较大，可以使用fp32精度模式提升模型的精度（精度模式并不总是需要使用fp32，因为相对于fp16，fp32的性能较差。因此，通常只在检测到某个模型精度存在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
使用AWQ量化工具转换权重 - AI开发平台ModelArts

size参数，指定-1时为per-channel权重量化，W4A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-ha

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ ModelArts训练好后的模型如何获取？ AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ TPE算法优化的超参数必须是分类特征（categorical features）吗模型可视化作业中各参数的意义？如何在ModelA

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
修改工作空间配额 - AI开发平台ModelArts

工作空间配额数据。表6 WorkspaceQuotasUpdateResponse 参数参数类型描述 max_quota Integer 配额允许设置的最大值。 update_time Integer 最后修改时间，UTC。如用户未修改过该资源配额,则该值默认为该工作空间的创建时间。 resource

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
使用AWQ量化工具转换权重 - AI开发平台ModelArts

size参数，指定-1时为per-channel权重量化，W4A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-ha

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用自动分组智能标注作业 - AI开发平台ModelArts

任务的历史记录，了解任务状态。查看自动分组结果在数据集详情页面的“全部”页签中，展开“筛选条件”，将“样本属性”设置为自动分组任务中的“属性名称”，并通过设置样本属性值，筛选出分组结果。图2 查看自动分组结果查看自动分组的历史任务在数据集详情页面的“全部”页签中，单击“自动分组

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
管理员和开发者权限分离 - AI开发平台ModelArts

"ecs:serverKeypairs:list", "ecs:serverKeypairs:get", "ecs:serverKeypairs:delete", "ecs:serverKeypairs:create"

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

单击“创建”，进入创建AI应用界面，元模型选择“从容器镜像中选择”，选择自定义镜像；配置“容器调用接口”和端口号，端口号与模型配置文件中的端口保持一致；图1 修改端口号设置完成后，单击“立即创建”，等待AI应用状态变为“正常”；重新部署在线服务。父主题：导入模型

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型

总条数： 1253

上一页
1
...
48
49
50
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

查询工作空间配额 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

修改工作空间配额 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用自动分组智能标注作业 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线