搜索_华为云

pipeline应用准备 - AI开发平台ModelArts

e_host/work/runwayml/onnx_models”。执行推理脚本进行测试，此处使用的推理硬件是CPU。由于CPU执行较慢，验证待迁移的代码可能需要大约15分钟左右才能完成。 cd modelarts-ascend/examples/AIGC/stable_diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

端。 python test.py 图2 部署在线服务在XShell中新建一个终端，参考步骤5~7进入容器，该容器为客户端。执行以下命令验证自定义镜像的三个API接口功能。当显示如图所示时，即可调用服务成功。 curl -X POST -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
MaaS使用场景和使用流程 - AI开发平台ModelArts

在MaaS中创建模型 3 模型调优完成数据集的准备后，可以在ModelArts Studio大模型即服务平台开始模型调优。模型调优，即使用训练数据集和验证数据集训练模型。使用MaaS调优模型模型压缩在ModelArts Studio大模型即服务平台支持对自定义模型进行模型压缩，以此提升推理服务性能、降低部署成本。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
从OBS目录导入数据规范说明 - AI开发平台ModelArts

记录数据集信息的文件及路径信息(相对路径) ├── train.txt # 训练集中各图片路径信息(相对路径) ├── valid.txt # 验证集中各图片路径信息(相对路径) │ ├── obj_train_data/ # 训练集的图片与对应的标注文件所在目录 │

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
推理性能测试 - AI开发平台ModelArts

变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/llm_evaluation目录下。代码目录如下:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

具体而言，云服务提供商应该提供以下服务和功能：建立和维护安全的基础设施，包括网络、服务器和存储设备等。提供安全的底层基础平台，保证底层环境的运行时安全。提供安全的身份验证和访问控制机制，以确保只有授权用户可以访问云服务，保证租户之间的相互隔离。提供可靠的备份和灾难恢复机制，以确保数据不会因为硬件故障或自然灾害等原因而丢失。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
附录：训练常见问题 - AI开发平台ModelArts

function error” 错误截图：报错原因：开启虚拟内存导致，虚拟内存不兼容某些训练场景如PPO、基于lora微调增量训练等解决措施：关闭虚拟内存使用历史版本demo.sh启动训练时，任务前容器中执行以下命令： # 历史版本demo.sh启动,： export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
部署推理服务 - AI开发平台ModelArts

com/SafeAILab/EAGLE/ 版本实现 export ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入 lm_tools/spec_decode/EAGLE 文

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/llm_evaluation目录下。代码目录如下:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查看在线服务详情 - AI开发平台ModelArts

性化配置按钮，单击“查看配置”修改服务个性化配置。服务流量限制服务流量限制是指每秒内一个服务能够被访问的次数上限。运行日志输出默认关闭，在线服务的运行日志仅存放在ModelArts日志系统。启用运行日志输出后，在线服务的运行日志会输出存放到云日志服务LTS。LTS自动创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。 414 Request-URI Too Large 请求

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 #打开词表切分开关 unset USE_VOCAB_PARALLEL #关闭词表切分开关配置后重启服务生效。 Matmul_all_reduce融合算子。使用Matmul_all_reduce融合算子能提升全量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

在ModelArts服务页面的左侧导航选择“权限管理 ”，单击“添加授权”。授权对象选择子账号，在已有委托中选择新建的委托，然后单击“创建”。验证权限是否配置成功。登录子账号，如果用户能跑通在开发环境中构建并调试推理镜像的案例，在Notebook中制作自定义镜像，然后将调试完成的镜

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
发布本地AI应用到AI Gallery - AI开发平台ModelArts

CLI工具。CLI工具的获取和使用请参见Gallery CLI配置工具指南。文件合集大小不超过50GB。文件上传完成前，请不要刷新或关闭上传页面，防止意外终止上传任务，导致数据缺失。如果上传的文件名称和已有文件重名，系统会自动用新文件内容覆盖已有文件内容。运行文件上传完

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
查询预置算法 - AI开发平台ModelArts

{\"label\":\"eval_frequence\",\"value\":\"1\",\"placeholder_cn\":\"对模型做验证的频率，默认为每个epoch都做\",\"placeholder_en\":\"\",\"required\":true},{\"label\":\"mom\"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
Standard开发环境 - AI开发平台ModelArts

开发环境提供的预置镜像版本是依据用户反馈和版本稳定性决定的。当用户的功能开发基于ModelArts提供的版本能够满足的时候，建议用户使用预置镜像，这些镜像经过充分的功能验证，并且已经预置了很多常用的安装包，用户无需花费过多的时间来配置环境即可使用。开发环境提供的预置镜像主要包含：常用预置包，基于标准的Co

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

如果显示WRONG_VERSION_NUMBER等关键字，检查自定义镜像的端口和ws跟wss的配置是否正确。连接成功后结果如下：图5 连接成功优先验证自定义镜像提供的websocket服务的情况，不同的工具实现的websocket服务会有不同，可能出现连接建立后维持不住，可能出现请求一次

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

在ModelArts服务页面的左侧导航选择“权限管理 ”，单击“添加授权”。授权对象选择子账号，在已有委托中选择新建的委托，然后单击“创建”。验证权限是否配置成功。登录子用户账号，如果用户能在控制台上成功创建使用自定义镜像创建训练作业（如单机单卡场景下创建训练作业），则表示权限配置成功。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
MoXing常用操作的样例代码 - AI开发平台ModelArts

文件的性能比较低。如果以写入模式或追加模式打开文件，当调用write方法时，待写入内容只是暂时的被存在的缓冲区，直到关闭文件对象（退出with语句时会自动关闭文件对象）或者主动调用文件对象的close()方法或flush()方法时，文件内容才会被写入。列举操作列举一个OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令

总条数： 372

上一页
1
...
13
14
15
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pipeline应用准备 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线