搜索_华为云

推理场景介绍 - AI开发平台ModelArts

各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。支持的rope scaling类型本方案支持的rope scaling类型包括linear、dynamic和yarn，其中linear方法只支持传入一个固定的scaling factor值，暂不支持传入列表。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
查看诊断报告 - AI开发平台ModelArts

dataloader 数据加载维度（Slow Dataloader Issues）通常包含如下几类问题：数据放在读写性能较差的存储盘上，如云上的EVS和EFS。多卡训练时使用单进程dataloader，即num_workers参数默认为0。存在其他多进程操作影响了数据多进程读取。数据格式问题，例如zip、tar

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
标注文本分类数据 - AI开发平台ModelArts

除数据。添加文件在“未标注”页签下，可单击页面左上角的“添加数据”，您可以在弹出对话框中，选择本地文件上传。上传文件格式需满足文本分类型的数据集要求。删除文本对象在“已标注”页签或“未标注”页签下，选中需要删除的文本对象，单击页面左上角的“删除”，在弹出的对话框中，确认删除信息后，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

Lite过程中遇到问题时，可参考MindSpore Lite官网提供的问题定位指南进行问题定位。迁移路线介绍当前推理迁移时，不同的模型类型可能会采取不同的迁移技术路线。主要分为以下几类： CV类小模型例如yolov5，以及部分AIGC场景的模型迁移，目前推荐使用MindSpo

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

产管理 > 镜像管理”，然后在“镜像管理”页面右上角单击“注册镜像”。在“注册镜像”页面，选择已上传的镜像源，“架构”选择“ARM”，“类型”选中“ASCEDN”和“CPU”，按需选择规格，单击“立即注册”。图4 选择已上传的镜像源父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
身份认证与访问控制 - AI开发平台ModelArts

通过IAM为用户组配置细粒度授权策略，使用户获得策略定义的权限，操作对应云服务的资源。基于策略授权时，管理员可以按ModelArts的资源类型选择授权范围。详细的资源权限项可以参见API参考中的权限策略和授权项章节。委托授权为了完成AI计算的各种操作，ModelArts在AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查看批量服务详情 - AI开发平台ModelArts

展示当前服务使用过程中的关键操作，比如服务部署进度、部署异常的详细原因、服务被启动、停止、更新的时间点等。事件保存周期为1个月，1个月后自动清理数据。查看服务的事件类型和事件信息，请参见查看在线服务的事件日志展示当前服务下每个模型的日志信息。包含最近5分钟、最近30分钟、最近1小时和自定义时间段。自

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

产管理 > 镜像管理”，然后在“镜像管理”页面右上角单击“注册镜像”。在“注册镜像”页面，选择已上传的镜像源，“架构”选择“ARM”，“类型”选中“ASCEDN”和“CPU”，按需选择规格，然后单击“立即注册”。图4 选择已上传的镜像源父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
推理性能测试 - AI开发平台ModelArts

--prompt-tokens 1024 2048 --benchmark-csv benchmark_parallel.csv 参数说明： --backend：服务类型，支持tgi、vllm、mindspore等。本文档使用的推理接口是vllm。 --host：服务IP地址，如127.0.0.1。 --p

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

M的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。 --dtype：模型推理的数据类型。仅支持FP16和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。推理启动脚本必须名为run_vllm.sh，不可修改其他名称。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
托管数据集到AI Gallery - AI开发平台ModelArts

如果填写了“中文名称”，则资产发布后，在数据集页签上会显示该“中文名称”。许可证数据集资产遵循的使用协议，根据业务需求选择合适的许可证类型。描述填写资产简介，数据集发布后将作为副标题显示在数据集页签上，方便用户快速了解资产。支持0~90个字符，请勿在描述中输入涉政、迷信

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

开发用于自定义镜像训练的代码当ModelArts Standard提供的预置框架不满足您的诉求时，ModelArts Standard支持用户构建自定义镜像用于模型训练。自定义镜像的制作要求用户对容器相关知识有比较深刻的了解，除非订阅算法和预置框架无法满足需求，否则不推荐使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
发布Workflow到ModelArts - AI开发平台ModelArts

PlaceholderType.ENUM, default="NCHW", enum_list=["NCHW", "NHWC"], description="输入数据类型，NHWC表示channel在最后，NCHW表channel在最前，默认值NCHW（速度有提升）")), wf.A

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
推理精度测试 - AI开发平台ModelArts

--datasets：评测的数据集及评测方法，其中 mmlu 是数据集，ppl 是评测方法。 --hf-type：HuggingFace模型权重类型(base,chat)，默认为chat，依据实际的模型选择。 --hf-path：本地 HuggingFace 权重的路径，比如/home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
Lite Server资源开通 - AI开发平台ModelArts

Server”，进入“节点”列表。单击“购买AI专属节点”，进入“购买AI专属节点”页面，在该页面填写相关参数信息。表2 基础配置参数说明参数名称说明资源类型裸金属服务器是一款兼具弹性云服务器和物理机性能的计算类服务器，为您和您的企业提供专属的云上物理服务器。弹性云服务器是一种可随时自助获取

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
订阅免费算法 - AI开发平台ModelArts

下载对应代码。在“代码”页签，单击右侧的“下载”将完整代码下载到本地，您也可以单击下方列表中的文件名称进行预览。目前如下后缀结尾的文件类型支持代码预览：txt、py、h、xml、html、c、properties、yml、cmake、sh、css、js、cpp、json、md、sql、bat、conf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

kerBaseSize不一致，可能会使得部分任务在不同节点的运行情况不一致，请谨慎操作。存量节点不支持修改容器引擎空间大小。修改容器引擎类型。容器引擎是Kubernetes最重要的组件之一，负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
自动模型优化介绍 - AI开发平台ModelArts

说明取值参考 num_samples 搜索尝试的超参组数 int，一般在10-20之间，值越大，搜索时间越长，效果越好 kind 采集函数类型 string，默认为'ucb'，可能取值还有'ei'、'poi'，一般不建议用户修改 kappa 采集函数ucb的调节参数，可理解为上置信边界

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
使用CodeLab免费体验Notebook - AI开发平台ModelArts

往Notebook，创建一个收费的实例进行使用。切换规格。 CodeLab支持CPU和GPU两种规格，在右侧区域，单击切换规格，修改规格类型。图3 切换规格资源监控。在使用过程中，如果想了解资源使用情况，可在右侧区域选择“Resource Monitor”，展示“CPU使用率”和“内存使用率”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
准备Notebook - AI开发平台ModelArts

Turbo中的数据执行编辑操作。创建Notebook 创建开发环境Notebook实例，具体操作步骤请参考创建Notebook实例。镜像选择已注册的自定义镜像，资源类型选择创建好的专属资源池，规格推荐选择“Ascend: 8*ascend-snt9b”。图1 Notebook中选择自定义镜像与规格存储

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作

总条数： 1137

上一页
1
...
48
49
50
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

标注文本分类数据 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

自动模型优化介绍 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线