搜索_华为云

查询样本列表 - AI开发平台ModelArts

@modelarts:size Array of objects 内置属性：图像尺寸（图像的宽度、高度、深度），类型为List<Integer>。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100,200,3]和[100,200]均合法。说

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
语言模型推理性能测试 - AI开发平台ModelArts

token的耗时 model_prefill_latency（模型计算首token时延）：服务从开始计算首token到生成首token的耗时 avg_decode_latency（平均增量token时延）：服务计算增量token的平均耗时 time_in_queue（请求排队时间

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

token的耗时 model_prefill_latency（模型计算首token时延）：服务从开始计算首token到生成首token的耗时 avg_decode_latency（平均增量token时延）：服务计算增量token的平均耗时 time_in_queue（请求排队时间

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
查询Notebook实例详情 - AI开发平台ModelArts

NOTEBOOK：计费规格实例。 billing_items Array of strings 计费资源类型。枚举值： STORAGE：存储资源计费。 COMPUTE：计算资源计费。 ALL：所有计费类型 user user object 账号信息表3 JobProgress 参数参数类型描述 notebook_id

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建训练任务 - AI开发平台ModelArts

requirements.txt && /bin/sh run.sh 资源池：在“专属资源池”页签选择GPU规格的专属资源池。规格：选择所需GPU规格。计算节点个数：选择需要的节点个数。 SFS Turbo：增加挂载配置，选择SFS名称，云上挂载路径为“/home/ma-user/work”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

客服存在着人工成本高昂、数据收集和分析困难、难以24小时提供服务等痛点。随着AI大模型的崛起，如何利用先进的大语言模型构建AI智能体并应用于智能客服系统，提供更加自然、流畅的对话体验，提高用户使用效率，实现24*7的无间断服务，降低企业在客服场景下的投入成本，提升用户满意度成为企业和用户关注的热门领域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 使用MaaS DeepSeek API搭建AI应用
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

客服存在着人工成本高昂、数据收集和分析困难、难以24小时提供服务等痛点。随着AI大模型的崛起，如何利用先进的大语言模型构建AI智能体并应用于智能客服系统，提供更加自然、流畅的对话体验，提高用户使用效率，实现24*7的无间断服务，降低企业在客服场景下的投入成本，提升用户满意度成为企业和用户关注的热门领域。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用
停止Notebook实例 - AI开发平台ModelArts

NOTEBOOK：计费规格实例。 billing_items Array of strings 计费资源类型。枚举值： STORAGE：存储资源计费。 COMPUTE：计算资源计费。 ALL：所有计费类型 user user object 账号信息表3 JobProgress 参数参数类型描述 notebook_id

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建生产训练作业（默认页面） - AI开发平台ModelArts

必填，选择训练代码文件所在的OBS目录。需要提前将代码上传至OBS桶中，目录内文件总大小要小于或等于5GB，文件数要小于或等于1000个，文件深度要小于或等于32。训练代码文件会在训练作业启动的时候被系统自动下载到训练容器的“${MA_JOB_DIR}/demo-code”目录中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注意：CPU架构必须选择鲲鹏计算，镜像推荐选择EulerOS。图1 购买ECS Step2 安装Docker 检查docker是否安装。 docker -v #检查docker是否安装

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.910 版本。说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendFactory是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
推理精度测试 - AI开发平台ModelArts

py 中的 fix_id_list, 将最大值适当调低。 ppl困惑度评测一般用于base权重测评，会将n个选项上拼接上下文，形成n个序列，再计算这n个序列的困惑度(perplexity)。其中，perplexity最小的序列所对应的选项即为这道题的推理结果。运行时间比较长，例如llama3_8b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理精度测试 - AI开发平台ModelArts

py 中的 fix_id_list, 将最大值适当调低。 ppl困惑度评测一般用于base权重测评，会将n个选项上拼接上下文，形成n个序列，再计算这n个序列的困惑度(perplexity)。其中，perplexity最小的序列所对应的选项即为这道题的推理结果。运行时间比较长，例如llama3_8b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
查看在线服务详情 - AI开发平台ModelArts

”相对应，如果修改服务或服务异常，实例数会有变化。如果存在某个实例异常希望重建实例，您可单击“删除”按钮，该实例被删除后会自动新建一个相同计算规格的实例。配置更新记录展示“当前配置”详情和“历史更新记录”。 “当前配置”：展示模型名称、版本、状态、实例规格、分流、实例数、部署

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
语言模型推理性能测试 - AI开发平台ModelArts

token的耗时 model_prefill_latency（模型计算首token时延）：服务从开始计算首token到生成首token的耗时 avg_decode_latency（平均增量token时延）：服务计算增量token的平均耗时 time_in_queue（请求排队时间

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理服务性能评测
启动Notebook实例 - AI开发平台ModelArts

NOTEBOOK：计费规格实例。 billing_items Array of strings 计费资源类型。枚举值： STORAGE：存储资源计费。 COMPUTE：计算资源计费。 ALL：所有计费类型 user user object 账号信息表4 JobProgress 参数参数类型描述 notebook_id

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。如果通过排查计算，发现资源确实足够，则考虑可能由于资源碎片化导致的。例如，集群共2个节点，每个节点都空闲了4张卡，总剩余卡数为8张卡，但用户的作业要求为1节点8张卡，因此无法调度上。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池

总条数： 693

上一页
1
...
26
27
28
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询样本列表 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

创建生产训练作业（默认页面） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线