搜索_华为云

预训练数据处理 - AI开发平台ModelArts

预训练数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。 Alpaca数据处理说明数据预处理脚本preprocess_data.py存放在代码包的“llm_train/AscendSpeed/ModelLink/tools”目录中，脚本样

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
预训练数据处理 - AI开发平台ModelArts

预训练数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。这里以Llama2-70B为例，对于Llama2-7B和Llama2-13B，操作过程与Llama2-70B相同，只需修改对应参数即可。 Alpaca数据处理说明数据预处理脚本preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

timeout = 120 在华为开源镜像站https://mirrors.huaweicloud.com/home中，搜索pypi，可以查看pip.conf文件内容。准备可用的apt源文件Ubuntu-Ports-bionic.list。本示例使用华为开源镜像站提供的apt源，执行如下命令获取apt源文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
预训练数据处理 - AI开发平台ModelArts

预训练数据处理训练前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。 Alpaca数据处理说明数据预处理脚本preprocess_data.py存放在代码包的“llm_train/AscendSpeed/ModelLink/tools/”目录中，脚本具体内容如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
Lite Cluster使用流程 - AI开发平台ModelArts

能被打包成一个简单的可移植的包，这个包可以被用来在任何其他运行Docker的机器上使用。 Kubernetes Kubernetes是一个开源的容器编排部署管理平台，用于管理云平台中多个主机上的容器化应用。Kubernetes的目标是让部署容器化的应用简单并且高效，Kuberne

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
准备预测分析数据 - AI开发平台ModelArts

准备预测分析数据使用ModelArts自动学习构建预测分析模型时，您需要将数据上传至对象存储服务（OBS）中。OBS桶需要与ModelArts在同一区域，例如OBS桶区域为“北京四”时，必须保证ModelArts管理控制台区域也在“北京四”区域，否则会导致无法获取到相关数据。数据集要求

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
SFT全参微调数据处理 - AI开发平台ModelArts

SFT全参微调数据处理 SFT全参微调（SFT fine-tuning）前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。下载数据 SFT全参微调涉及的数据下载地址：https://huggingface.co/datasets/silk-road/a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
JupyterLab常用功能介绍 - AI开发平台ModelArts

例，单击操作列的“打开”，访问JupyterLab。进入JupyterLab页面后，自动打开Launcher页面，如下图所示。您可以使用开源支持的所有功能，详细操作指导可参见JupyterLab官网文档。图1 JupyterLab主页不同AI引擎的Notebook，打开后L

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

使用从训练或者从OBS中选择创建AI应用，推荐用户使用动态加载的方式导入，动态加载实现了模型和镜像的解耦，便于进行模型资产的保护。用户需要及时更新AI应用的相关依赖包，解决开源或者第三方包的漏洞。AI应用相关的敏感信息，需要解耦开，在“在线服务”部署时进行相应配置。请选择ModelArts推荐的运行时环境，旧的运

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
SFT全参微调数据处理 - AI开发平台ModelArts

SFT全参微调数据处理 SFT微调（Supervised Fine-Tuning）前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。这里以LLama2-70B为例，对于LLama2-7B和LLama2-13B，操作过程与LLama2-70B相同，只需修改对应参数即可。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
SFT全参微调数据处理 - AI开发平台ModelArts

SFT全参微调数据处理 SFT全参微调（Supervised Fine-Tuning）前需要对数据集进行预处理，转化为.bin和.idx格式文件，以满足训练要求。下载数据 SFT全参微调涉及的数据下载地址：https://huggingface.co/datasets/tats

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

get-docker.sh 准备名为context的文件夹。 mkdir -p context 准备可用的pip源文件pip.conf 。本示例使用华为开源镜像站提供的pip源，其pip.conf文件内容如下。 [global] index-url = https://repo.huaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

Administrator 数据湖探索DLI DLI FullAccess MapReduce服务MRS MRS Administrator 数据仓库服务GaussDB(DWS) DWS Administrator 云审计服务CTS CTS Administrator AI开发平台ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

规格中带有ARM字样的显示，为ARM CPU架构。规格中未带有ARM字样的显示，为X86 CPU架构。 ModelArts后台暂不支持下载开源安装包，建议用户在自定义镜像中安装训练所需的依赖包。自定义镜像需上传至容器镜像服务（SWR）才能在ModelArts上用于训练。父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在MaaS中创建模型 - AI开发平台ModelArts

inconsistent with standard open source. config.json中缺少描述模型结构的关键字段，或其值与标准开源不一致。检查“config.json”文件中的配置是否与模型官方一致。 Error loading tokenizer in transformers

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备镜像环境 - AI开发平台ModelArts

载地址：https://huggingface.co/madebyollin/sdxl-vae-fp16-fix/tree/main 下载开源数据集pokemon-dataset并上传到宿主机上，官网下载地址：https://huggingface.co/datasets/say

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

本案例适用于华为云-北京四Region。约束限制制作自定义镜像时，Base镜像需满足如下规范：基于昇腾、Dockerhub官网等官方开源的镜像制作，开源镜像需要满足如下操作系统约束： x86：Ubuntu18.04、Ubuntu20.04 ARM：Euler2.8.3、Euler2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
准备镜像环境 - AI开发平台ModelArts

载地址：https://huggingface.co/madebyollin/sdxl-vae-fp16-fix/tree/main 下载开源数据集pokemon-dataset并上传到宿主机上，官网下载地址：https://huggingface.co/datasets/say

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
数据处理场景介绍 - AI开发平台ModelArts

数据处理场景介绍 ModelArts平台提供的数据处理功能，基本目的是从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的人们来说是有价值、有意义的数据。当数据采集和接入之后，数据一般是不能直接满足训练要求的。为了保障数据质量，以免对后续操作（如数据标注、模型训练等）带

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版数据集下线公告华为云计划于2024/10/31 00:00（北京时间）用AI开发平台ModelArts的新版数据集全面替代旧版数据集，旧版数据集正式下线。下线范围下线区域：华北-北京四（其他区域已下线）受影响服务 ModelArts旧版数据集。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告

总条数： 570

上一页
1
...
21
22
23
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

预训练数据处理 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线