搜索_华为云

推理场景介绍 - AI开发平台ModelArts

Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理场景介绍 - AI开发平台ModelArts

Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6.3版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

华为云：负责云服务自身的安全，提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS各类各项云服务自身的安全，涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身，也包括运维运营安全，以及更广义的安全合规遵从。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
升级模型服务 - AI开发平台ModelArts

高性能、增加功能、修复缺陷，并适应新的业务需求。更新模型版本作为服务升级的一部分，涉及用新训练的模型版本替换原来的模型，以提高预测的准确性和模型的环境适应性。登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
订阅免费算法 - AI开发平台ModelArts

在详情页面您可以查看算法的“描述”、“交付、”“限制”、“版本”、“关联资产”和“评论”等信息。为方便您的使用，在订阅算法时，建议您查看算法详情页“版本”页签中关于算法对应版本的“使用约束”，准备对应的数据和资源规格后进行使用。对于开放代码的算法，您也可以在详情页面预览或者下载对应代码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

用场景的AI解决方案。MaaS提供的模型服务和华为云各AI应用层构建工具之间相互连通，通过灵活的组合方案，来帮助客户快速解决模型落地应用时所面临的业务及技术挑战。 MaaS应用实践中心结合KooSearch企业搜索服务、盘古数字人大脑和Dify，为具体的客户应用场景提供一整套解决方案。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

释放Standard专属资源池和删除网络删除资源池当AI业务开发不再需要使用专属资源池时，您可以删除专属资源池，释放资源。专属资源池删除后，将导致使用此资源的开发环境、训练作业和推理服务等不可用，且删除后不可恢复，请谨慎操作。登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
修改模型服务QPS - AI开发平台ModelArts

修改模型服务QPS 流量限制QPS是评估模型服务处理能力的关键指标，它指示系统在高并发场景下每秒能处理的请求量。这一指标直接关系到模型的响应速度和处理效率。不当的QPS配置可能导致用户等待时间延长，影响满意度。因此，能够灵活调整模型的QPS对于保障服务性能、优化用户体验、维持业务流畅及控制成本至关重要。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
配置Lite Server存储 - AI开发平台ModelArts

如高性能计算、媒体处理、文件共享和内容管理和Web服务等。说明：高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。说明：高

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
扩缩容模型服务实例数 - AI开发平台ModelArts

在使用大型模型进行推理时，其业务需求会呈现出明显的峰谷波动。因此，模型服务必须具备灵活的扩缩容能力，以适应不同时间段内的用户负载变化，确保服务的高可用性和资源的高效利用。 ModelArts Studio大模型即服务平台支持手动扩缩容模型服务的实例数，该操作不会影响部署服务的正常运行。约束限制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
管理AI Gallery数据集 - AI开发平台ModelArts

管理AI Gallery数据集编辑数据集介绍资产发布上架后，准确、完整的资产介绍有助于提升资产的排序位置和访问量，能更好的支撑用户使用该资产。在数据集详情页，选择“数据集介绍”页签，单击右侧“编辑介绍”。编辑数据集基础设置和数据集描述。表1 数据集介绍的参数说明参数名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
MA-Advisor使用指导 - AI开发平台ModelArts

变量设置知识库的本地路径。工具扫描结果解读 AI CPU算子分析和处理 MA-Advisor工具分析结果的html文件中会有下述链接，提供AI CPU算子相关问题的修复指导和案例。图17 AI CPU算子分析和处理亲和API替换 MA-Advisor工具分析结果的html文

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > MA-Advisor自动诊断工具使用指导
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

扩散模型在噪音和随机数上的生成，本身就有一定的随机性，GPU和NPU（Ascend）硬件由于存在一定细小的差别，很难确保完全一致，较难达成生成图片100%匹配，建议通过盲测的方式对效果进行验证。模型精度有问题怎么办？首先考虑通过FP16的方式进行转换和执行，再通过精度诊断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
发布ModelArts模型 - AI开发平台ModelArts

AI专区汇聚优质的人工智能服务提供商，提供丰富的人工智能解决方案、应用、API及算法模型，助力用户快速部署、接入、调用相关应用，方便地购买和使用算法模型。发布至云商店AI专区的模型为商业售卖资产。买家需购买商品的使用配额进行有偿使用。云商店仅支持企业级卖家发布商品，请在首次发布商品前入驻华为云商店成为企业级卖家。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

自行配置环境的复杂度。范围本文涉及PyTorch训练的单卡和分布式业务迁移到昇腾的业务范围。当前针对常见的开源LLM/AIGC等领域的开源模型，ModelArts已经提供了迁移好的开箱即用模型，且保证了较优的精度和性能。如果用户业务同样使用这些开源模型，建议直接使用Model

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
什么是区域、可用区？ - AI开发平台ModelArts

什么是区域、可用区？区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

在资源池列表中，选择需要进行驱动升级的资源池“ > 驱动升级”。在“驱动升级”弹窗中，会显示当前专属资源池的驱动类型、实例数、当前版本、目标版本、升级方式、升级范围和开启滚动开关。目标版本：在目标版本下拉框中，选择一个目标驱动版本。升级方式：可选择安全升级或强制升级。安全升级：待节点上没有作业时再升级，升级周期可能比较长。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
人工标注文本数据 - AI开发平台ModelArts

标注作业对应的“实体标签”和“关系标签”已定义好。“关系标签”需设置对应的“起始实体”和“终止实体”。“关系标签”只能添加至其设置好的“起始实体”和“终止实体”之间。支持设置多个“实体标签”和“关系标签”。一个文本数据中，也可以标注多个“实体标签”和“关系标签” 创建数据集时定义的“实体标签”，不支持删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
推理业务迁移评估表 - AI开发平台ModelArts

当前推理业务的操作系统及版本，如：Ubuntu 22.04。是否使用容器化运行业务，以及容器中OS版本，HostOS中是否有业务软件以及HostOS的类型和版本。需要评估是否愿意迁移到华为云的通用OS。 - AI引擎及版本当前引擎（TF/PT/LibTorch），是否接受切换MindSpore。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

当前推理业务的操作系统及版本，如：Ubuntu 22.04。是否使用容器化运行业务，以及容器中OS版本，HostOS中是否有业务软件以及HostOS的类型和版本。需要评估是否愿意迁移到华为云的通用OS。 - AI引擎及版本当前引擎（TF/PT/LibTorch），是否接受切换MindSpore。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 485

上一页
1
...
17
18
19
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

MA-Advisor使用指导 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

什么是区域、可用区？ - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

人工标注文本数据 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线