搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。数据集下载本教程使用Alpaca数据集，数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令数据可以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。 Alpaca数据集本教程使用Alpaca数据集，数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
推理精度测试 - AI开发平台ModelArts

-w {output_path} --debug 参数说明如下: --datasets, 评测的数据集及评测方法，其中 mmlu 是数据集，ppl 是评测方法 --hf-type, HuggingFace模型权重类型(base,chat), 默认为chat, 依据实际的模型选择 --hf-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

1434 SQL Server的TCP端口，用于返回SQLServer使用了哪个TCP/IP端口。 Oracle 1521 Oracle通信端口，弹性云服务器上部署了Oracle SQL需要放行的端口。 MySQL 3306 MySQL数据库对外提供服务的端口。 Windows Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

图片亮度 Brightness 图片亮度，值越大代表观感上亮度越高。一般呈正态分布，可根据分布中心判断数据集整体偏亮还是偏暗。可根据使用场景调整，比如使用场景是夜晚，图片整体应该偏暗。图片饱和度 Saturation 图片的色彩饱和度，值越大表示图片整体色彩越容易分辨。一般

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
推理精度测试 - AI开发平台ModelArts

-w {output_path} --debug 参数说明如下： --datasets：评测的数据集及评测方法，其中 mmlu 是数据集，ppl 是评测方法。 --hf-type：HuggingFace模型权重类型(base,chat), 默认为chat, 依据实际的模型选择。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
推理精度测试 - AI开发平台ModelArts

-w {output_path} --debug 参数说明如下： --datasets：评测的数据集及评测方法，其中 mmlu 是数据集，ppl 是评测方法。 --hf-type：HuggingFace模型权重类型(base,chat), 默认为chat, 依据实际的模型选择。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
启动智能任务 - AI开发平台ModelArts

OR：或操作 AND：与操作 property 否 Map<String,Array<String>> 标签属性，是Object格式，存放任意的键值对；key是属性名称，value是取值列表，如value为null表示不根据值搜索，否则搜索的值满足列表中任意一个即可。 type 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建Standard专属资源池 - AI开发平台ModelArts

ModelArts网络是承载ModelArts资源池节点的网络连接，基于华为云的VPC进行封装，对用户仅提供网络名称以及CIDR网段的选择项，为了防止在打通VPC的时候有网段的冲突，因此提供了多个CIDR网段的选项，用户可以根据自己的实际情况进行选择。虚拟私有云VPC是一套为实例构建的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
ModelArts数据集新建的版本找不到怎么办？ - AI开发平台ModelArts

ModelArts数据集新建的版本找不到怎么办？版本列表是可以缩放的，请缩小页面后查找。单击数据集名称，进入数据集概览页，在概览页选择“版本管理”，可对页面进行缩小。父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
AI开发基本流程介绍 - AI开发平台ModelArts

AI开发基本流程介绍什么是AI开发 AI（人工智能）是通过机器来模拟人类认识能力的一种科技能力。AI最核心的能力就是根据给定的输入做出判断或预测。 AI开发的目的是什么 AI开发的目的是将隐藏在一大批数据背后的信息集中处理并进行提炼，从而总结得到研究对象的内在规律。对数据进行

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

Gallery也支持使用SDK构建自定义模型接入AI Gallery。 Transformers库介绍 AI Gallery使用的Transformers机器学习库是一个开源的基于Transformer模型结构提供的预训练语言库。Transformers库注重易用性，屏蔽了大量AI模型开发使用过程中的技术

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
从Manifest文件导入规范说明 - AI开发平台ModelArts

audio_content：声音内容 audio_segmentation：声音起止点 name 是/否对于分类是必选字段，对于其他类型为可选字段，本示例为图片分类名称。 id 是/否标签ID。对于三元组是必选字段，对于其他类型为可选字段。三元组的实体标签ID格式为“E+数字”，比如“E1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
批量添加样本 - AI开发平台ModelArts

-annotations/samples 表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json，可参考表2.请求服务json参数说明 docker_ip 是 str 启动多模态openAI服务的主机ip served_port 是 str 启动多模态openAI服务的端口号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
数据准备使用流程 - AI开发平台ModelArts

数据准备使用流程 ModelArts是面向AI开发者的一站式开发平台，能够支撑开发者从数据到模型的全流程开发过程，包含数据处理、算法开发、模型训练、模型部署等操作。并且提供AI Gallery功能，能够在市场内与其他开发者分享数据、算法、模型等。为了能帮用户快速准备大量高质量的数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
使用PyCharm上传数据至Notebook - AI开发平台ModelArts

使用PyCharm上传数据至Notebook 不大于500MB数据量，直接复制至本地IDE中即可。大于500MB数据量，请先上传到OBS中，再从OBS下载到云上Notebook。图1 数据通过OBS中转上传到Notebook 上传数据至OBS，具体操作请参见上传文件至OBS桶。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
准备数据（可选） - AI开发平台ModelArts

准备数据（可选）此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新dataset_info.json文件；请务必在dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
训练作业进程异常退出 - AI开发平台ModelArts

原因分析日志显示训练进程的退出码为137。训练进程表示用户的代码启动后的进程，所以这里的退出码是用户的训练作业代码返回的。常见的错误码还包括247、139等。退出码137或者247 可能是内存溢出造成的。请减少数据量、减少batch_size，优化代码，合理聚合、复制数据。请注

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
Lite Cluster使用流程 - AI开发平台ModelArts

Cluster资源管理。表1 相关名词解释名词含义容器容器技术起源于Linux，是一种内核虚拟化技术，提供轻量级的虚拟化，以便隔离进程和资源。尽管容器技术已经出现很久，却是随着Docker的出现而变得广为人知。Docker是第一个使容器能在不同机器之间移植的系统。它不仅简化了打包应用的流程，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读

总条数： 942

上一页
1
...
4
5
6
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

ModelArts数据集新建的版本找不到怎么办？ - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

使用PyCharm上传数据至Notebook - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

训练作业进程异常退出 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线