搜索_华为云

Notebook中使用Conda安装Keras 2.3.1报错 - AI开发平台ModelArts

1报错问题现象使用Conda安装Keras 2.3.1版本报错。原因分析可能是Conda网络不通，请使用pip install命令安装。解决方法执行 !pip install keras==2.3.1命令安装Keras。父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
推理性能测试 - AI开发平台ModelArts

理接口是vllm，而llava多模态推理接口是openai-chat。 --host ${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

source /home/ma-user/anaconda3/envs/pytorch/bin/activate && \ pip install ipykernel==6.7.0 --trusted-host https://repo.huaweicloud.com -i https://repo

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

evServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

同样功能的PyTorch Pipeline，因为指导要求适配onnx pipeline，两个pipeline本身功能就有差别，如何适配？由于Diffusers社区的“single model file policy”设计原则，不同的pipeline是不同路径在独立演进的。先确保应用输出符合预期后，再进入到MindSpore

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
语言模型推理性能测试 - AI开发平台ModelArts

--backend：服务类型，如tgi，vllm，mindspore、openai。 --host ${docker_ip}：服务部署的IP地址，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --dataset：数据集路径。 --dataset-type：支持三种

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

startOrStopService 启停边缘服务节点 service startOrStopNodesService 添加用户访问密钥 service addAkSk 删除用户访问密钥 service deleteAkSk 创建专属资源池 cluster createCluster 删除专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
删除训练作业参数 - AI开发平台ModelArts

{config_name} 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 config_name 是 String 训练作业参数的名称。请求消息无请求参数。响应消息

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
训练启动脚本说明和参数配置 - AI开发平台ModelArts

换的过程。如果用户进行自定义数据集预处理以及权重转换，可通过编辑 1_preprocess_data.sh 、2_convert_mg_hf.sh 中的具体python指令运行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。如果用户希望自定义参数进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

evServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。如果机器与容器镜像仓库不在同一区域，则上传镜像走公网链路，机器需要绑定弹性公网IP。约束与限制使用客户端上传镜像，镜像的每个layer大小不能大于10G。上传镜像的容器引擎客户端版本必须为1.11.2及以上。操作步骤连接容器镜像服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
获取训练作业日志的文件名 - AI开发平台ModelArts

og/file-names 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。 version_id 是 Long 训练作业的版本ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询数据集导出任务列表 - AI开发平台ModelArts

查询数据集导出任务列表功能介绍分页查询数据集导出任务列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datase

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
SD WebUI推理方案概览 - AI开发平台ModelArts

Server和ModelArts Standard环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。约束限制本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。适配的Cann版本是cann_8.0.rc3。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward 如果net.ipv4.ip_forward配置项的值不为1，执行以下命令配置IP转发。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
配置Lite Server存储 - AI开发平台ModelArts

如高性能计算、企业核心集群应用、企业应用系统和开发测试等。说明：高性能计算：主要是高速率、高IOPS的需求，用于作为高性能存储，比如工业设计、能源勘探这些。容量 PB级别 EB级别 TB级别时延 3~10ms 10ms 亚毫秒级 IOPS/TPS 单文件系统 10K 千万级单盘 128K

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
训练启动脚本说明和参数配置 - AI开发平台ModelArts

parallel size)=1 PP(pipeline model parallel size)=4 1*节点 & 4*Ascend SEQ_LEN=8192 TP(tensor model parallel size)=2 PP(pipeline model parallel size)=4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
SD WebUI推理方案概览 - AI开发平台ModelArts

Server和ModelArts Standard环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。约束限制本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。适配的Cann版本是cann_8.0.rc2。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.907）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示context并行，默认为1。应用于训练长序列文本的模型。如果训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查看Standard专属资源池详情 - AI开发平台ModelArts

进行的操作不一致，具体以控制台显示为准。在“基本信息”的“网络”中，可单击关联的资源池中的数字，查看关联的资源池。可以查看该网络中可用的IP数量。在扩展信息中可以查看监控、作业、节点、规格、事件、标签，详细介绍见下文。查看资源池中的作业在资源池详情页，切换到“作业”页签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 2009

上一页
1
...
40
41
42
...
101
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Notebook中使用Conda安装Keras 2.3.1报错 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

ModelArts支持云审计的关键操作 - AI开发平台ModelArts

删除训练作业参数 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

获取训练作业日志的文件名 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

SD WebUI推理方案概览 - AI开发平台ModelArts

SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

SD WebUI推理方案概览 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线