搜索_华为云

SFT全参微调超参配置 - AI开发平台ModelArts

本章节介绍SFT全参微调前的超参配置，可以根据实际需要修改。 SFT全参微调脚本baichuan2.sh，存放在6.3.904-Ascend/llm_train/AscendSpeed/scripts/baichuan2目录下。可以根据实际需要修改超参配置。微调任务配置，操作同预训练配置类

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
获取帐号名和帐号ID - AI开发平台ModelArts

获取帐号名和帐号ID 在调用接口的时候，部分请求中需要填入帐号名（domain name）和帐号ID（domain_id）。获取步骤如下：注册并登录管理控制台。鼠标移动至用户名，在下拉列表中单击“我的凭证”。在“API凭证”页面的查看“帐号名”和“帐号ID”。图1 获取帐号名和ID

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？在使用MoXing构建模型时，如果您对前一次训练结果不满意，可以在更改部分数据和标注信息后，进行增量训练。 “mox.run”添加增量训练参数在完成标注数据或数据集的修改后，您可以在“mox.run”中，修改“log_dir”参数，并新增“checkpoint_path”参数

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
推理性能测试 - AI开发平台ModelArts

务开始到生成首token的耗时 model_prefill_latency（模型计算首token时延）：服务从开始计算首token到生成首token的耗时 avg_decode_latency（平均增量token时延）：服务计算增量token的平均耗时 time_in_queue

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
服务状态一直处于“部署中” - AI开发平台ModelArts

AI应用的端口没有配置，默认为8080，如您在自定义镜像配置文件中修改了端口号，需要在部署AI应用时，配置对应的端口号，使新的AI应用重新部署服务。如何修改默认端口号，请参考使用自定义镜像创建在线服务，如何修改默认端口。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
语言模型推理性能测试 - AI开发平台ModelArts

务开始到生成首token的耗时 model_prefill_latency（模型计算首token时延）：服务从开始计算首token到生成首token的耗时 avg_decode_latency（平均增量token时延）：服务计算增量token的平均耗时 time_in_queue

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
重试/停止/运行Workflow节点 - AI开发平台ModelArts

当单个节点运行失败时，用户可以通过重试按钮重新执行当前节点，无需重新启动工作流。在当前节点的运行状况页面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
重建、停止或删除训练作业 - AI开发平台ModelArts

重建、停止或删除训练作业另存为算法当您需要修改训练作业的算法时，可以在训练作业详情页面右上角，单击“另存为算法”。在“创建算法”页面中，会自动填充上一次训练作业的算法参数配置，您可以根据业务需求在原来算法配置基础上进行修改。订阅算法不支持另存为算法。重建训练作业当对创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
同步Lite Server服务器状态 - AI开发平台ModelArts

云服务器页面修改了裸金属服务器状态后，您可通过“同步”功能，同步其状态至ModelArts。登录ModelArts管理控制台。在左侧导航栏中，选择“AI专属资源池 > 弹性节点 Server”，进入“弹性节点 Server”列表页面。在弹性节点Server列表中，单击操作列

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
查看训练作业事件 - AI开发平台ModelArts

[worker-0] [耗时：秒] 预检完成 [worker-0] [耗时：秒] 检查失败。发现异常： [worker-0] [耗时：秒] 检查失败。发现错误： [worker-0] 训练代码下载中 [worker-0] [耗时：秒] 训练代码下载完成 [worker-0] [耗时：秒]

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
表格类型的数据集如何标注 - AI开发平台ModelArts

表格类型的数据集如何标注表格类型的数据集适合表格等结构化数据处理。数据格式支持csv。不支持标注，支持对部分表格数据进行预览，但是最多支持100条数据预览。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

--cosineDistanceThreshold=0.99 其中，--accuracyThreshold=5表示平均绝对误差的容忍度最大为5%，--cosineDistanceThreshold =0.99表示余弦相似度至少为99%，--inputShapes可将模型放入到netron官网中查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

model_baseline_performance表示调优前模型执行时间，单位为ms。 model_performance_improvement表示调优后模型执行时间减少百分比。 model_result_performance表示调优后模型执行时间。 repo_summary中的信息表示调优过程中使用到的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
批量更新样本标签 - AI开发平台ModelArts

SSS”(其中hh表示小时，mm表示分钟，ss表示秒，SSS表示毫秒)。 @modelarts:feature 否 Object 物体检测标签专用内置属性：形状特征，类型为List。以图片的左上角为坐标原点[0, 0]，每个坐标点的表示方法为[x, y]，x表示横坐标，y表示纵坐标(x和y均>=0)。每种形状的格式如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

在当前安全组的入方向规则中添加一条规则，基本协议选择ICMP协议，详细配置如下表所示，添加规则步骤请参考添加安全组规则。表1 入方向规则方向协议/应用端口源地址入方向 ICMP 全部 0.0.0.0/0 华为云安全组支持的协议参考可参考下表。表2 入方向规则协议端口说明协议端口说明

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
编排Workflow - AI开发平台ModelArts

default="NCHW", enum_list=["NCHW", "NHWC"], description="输入数据类型，NHWC表示channel在最后，NCHW表channel在最前，默认值NCHW（速度有提升）")), wf.AlgorithmParamet

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
Standard模型部署 - AI开发平台ModelArts

例如，智慧交通项目中，在获得训练好的模型后，需要部署到云、边、端多种场景。如果在端侧部署，需要一次性部署到不同规格、不同厂商的摄像机上，这是一项非常耗时、费力的巨大工程，ModelArts支持将训练好的模型一键部署到端、边、云的各种设备上和各种场景上，并且还为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式部署方式。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
在线服务预测报错DL.0105 - AI开发平台ModelArts

subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码中的x[0][i]修改为x[i]，重新部署服务进行预测。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

登录ModelArts管理控制台。在左侧导航栏中，选择“模型训练 > 训练作业”进入训练作业列表。单击“创建训练作业”，进入创建训练作业页面，填写作业信息，创建方式参考表1，其他参数填写请参考创建训练作业。表1 创建训练作业的创建方式（使用自定义镜像）参数名称说明创建方式必选，选择“自定义算法”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
训练作业运行失败排查指导 - AI开发平台ModelArts

or bucket not found.')”。原因：Moxing在进行文件复制时，未找到train_data_obs目录。处理建议：修改train_data_obs目录为正确地址，重新启动训练作业。另外在Moxing下载OBS对象过程中，不要删除相应OBS目录下的对象，否

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败

总条数： 1470

上一页
1
2
3
4
5
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SFT全参微调超参配置 - AI开发平台ModelArts

获取帐号名和帐号ID - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

服务状态一直处于“部署中” - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

同步Lite Server服务器状态 - AI开发平台ModelArts

查看训练作业事件 - AI开发平台ModelArts

表格类型的数据集如何标注 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线