搜索_华为云

非分离部署推理服务 - AI开发平台ModelArts

${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/ma-user目

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
应用场景 - AI开发平台ModelArts
应用场景 - AI开发平台ModelArts

内容审核深入业务场景，提供完备成熟的内容审核/CV场景快速昇腾迁移的方案，高效解决业务内容审核的算力/国产化需求，助力企业业务稳健发展。政府提高公共服务的效率和质量，加强公共安全，优化政策方案和决策过程等。金融为金融机构带来更加高效、智能、精准的服务。矿山提供端到端AI生

 帮助中心 > AI开发平台ModelArts > 产品介绍
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

Standard创建模型部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入模型时，需要支持动态调整租户存储配额；模型加载、启动慢，部署时需要灵活的超时配置；当负载异常重启，模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
推理精度测试 - AI开发平台ModelArts

模型代码能力，请执行此步骤，否则忽略这一步。原因是通过opencompass使用humaneval数据集时，需要执行模型生成的代码。请仔细阅读human_eval/execution.py文件第48-57行的注释，内容参考如下。了解执行模型生成代码可能存在的风险，如果接受这些风险

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

需要在ModelArts控制台打开严格授权模式，单击“权限管理 > 启用严格模式”。如果打开严格模式前没有为子账号配置过ModelArts权限，开启严格授权模式后可能会导致子账号无法使用ModelArts功能，请根据您的业务需求配置需要的ModelArts服务的权限（参见依赖和委托中ModelArts服务对应的依赖策略项）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
ModelArts中常用概念 - AI开发平台ModelArts

端-边-云端-边-云分别指端侧设备、智能边缘设备、公有云。推理指按某种策略由已知判断推出新判断的思维过程。人工智能领域下，由机器模拟人类智能，使用构建的神经网络完成推理过程。在线推理在线推理是对每一个推理请求同步给出推理结果的在线服务（Web Service）。批量推理

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
附录：大模型推理常见问题 - AI开发平台ModelArts

max_model_len。解决方法：修改config.json文件中的"seq_length"的值，"seq_length"需要大于等于 --max-model-len的值。config.json存在模型对应的路径下，例如：/data/nfs/benchmark/tokenize

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

开发者的新特性需求。基于服务演进，ModelArts团队已于2021年上线新版训练，力求解决存在的历史问题，并为新特性提供高性能、高易用、可扩展、可演进的底座，给用户提供更好的AI训练体验，打造易用、高效的AI平台。下线旧版训练管理对现有用户的使用是否有影响？正在使用的训练作

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

在MaaS服务的“模型部署”页面，选择“我的服务”页签，在服务列表选择模型服务“service-1122”，单击操作列的“更多 > 删除”，在弹窗中输入“DELETE”，单击“确定”，删除服务。在MaaS服务的“我的模型”页面，选择模型“Qwen2-7B”，单击操作列的“更多 >

帮助中心 > AI开发平台ModelArts > 快速入门
调用MaaS部署的模型服务 - AI开发平台ModelArts

每个输出序列要生成的最大Tokens数量。 top_k 否 -1 Int 控制要考虑的前几个Tokens的数量的整数。设置为“-1”表示考虑所有Tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个Tokens的累积概率的浮点数。取值范围：0~1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
推理精度测试 - AI开发平台ModelArts

模型代码能力，请执行此步骤，否则忽略这一步。原因是通过opencompass使用humaneval数据集时，需要执行模型生成的代码。请仔细阅读human_eval/execution.py文件第48-57行的注释，内容参考如下。了解执行模型生成代码可能存在的风险，如果接受这些风险

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
什么是Workflow - AI开发平台ModelArts

Graph，DAG）的开发。一个DAG是由节点和节点之间的关系描述组成的。开发者通过定义节点的执行内容和节点的执行顺序定义DAG。绿色的矩形表示为一个节点，节点与节点之间的连线则是节点的关系描述。整个DAG的执行其实就是有序的任务执行模板。图3 工作流 Workflow提供的样例 Mod

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
推理场景介绍 - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。软件配套版本本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
镜像方案说明 - AI开发平台ModelArts

镜像方案说明准备大模型训练适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
网络调整公告 - AI开发平台ModelArts

网络调整公告 ModelArts针对网络进行安全加固和优化，新的网络模式可以为用户的资源提供更好的隔离性，提升云上资源的安全。为保障您的网络安全，建议您后续使用新网络创建Standard资源池。表1 上线局点上线局点上线时间华东二 2024年10月29日 20:00 父主题：

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
推理精度测试 - AI开发平台ModelArts

8B。 --max-seq-len：模型的最大序列长度。 --max-out-len：模型的最大输出长度。 --hf-num-gpus：需要使用的卡数。 --batch-size：推理每次处理的输入数目。 -w：存放输出结果的目录。步骤二：查看精度测试结果默认情况下，评测结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

max_model_len 解决方法：修改config.json文件中的"seq_length"的值，"seq_length"需要大于等于 --max-model-len的值。config.json存在模型对应的路径下，例如：/data/nfs/benchmark/tokenize

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
Lite Server资源配置流程 - AI开发平台ModelArts

不同镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。当Server服务器中预装的软件无法满足业务需求时，您可在Server服务器中配置所需要的软件环境。父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
Standard推理部署 - AI开发平台ModelArts

Standard创建模型部署在线服务第三方推理框架迁移到ModelArts Standard推理自定义引擎 ModelArts Standard推理服务支持VPC直连的高速访问通道配置 ModelArts Standard的WebSocket在线服务全流程开发从0-1制作自定义镜像并创建模型

 帮助中心 > AI开发平台ModelArts > 最佳实践
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 访问Notebook的途径，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理

总条数： 1373

上一页
1
...
10
11
12
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

非分离部署推理服务 - AI开发平台ModelArts

应用场景 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

网络调整公告 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线