检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ModelArts在线服务的API接口组成规则是什么? 模型部署成在线服务后,用户可以获取API接口用于访问推理。 API接口组成规则如下: https://域名/版本/infer/服务ID 示例如下: https://6ac81cdfac4f4a30be95xxxbb682.apig.xxx.xxx.com/v1/
选择“开发空间>Notebook”,进入Notebook页面。 在Notebook列表中,单击操作列的“删除”,在弹出的确认对话框中,确认信息无误,然后输入“DELETE”,单击“确定”,完成删除操作。 Notebook删除后不可恢复,请谨慎操作。实例删除后,挂载目录下的数据也将一并删除,请谨慎操作。
确保在线服务一直处于“运行中”状态,否则会导致生产环境应用不可用。 集成方式 ModelArts在线服务提供的API是一个标准的Restful API,可使用HTTPS协议访问。ModelArts提供了SDK用于调用在线服务API,SDK调用方式请参见《SDK参考》>“场景1:部署在线服务Predictor的推理预测”。
服务器在进行过“切换或者重置操作系统”操作后,EVS系统盘ID发生变化,和下单时订单中的EVS ID已经不一致, 因此EVS系统盘将不支持扩容,并显示信息:“当前订单已到期,无法进行扩容操作,请续订”。 中 切换或者重置操作系统后,建议通过挂载数据盘EVS或挂载SFS盘等方式进行存储扩容。 父主题:
signal: Killed. 日志中有报错“RuntimeError: CUDA out of memory. ”,如下图所示: 图1 错误日志信息 Tensorflow引擎日志中出现“Dst tensor is not initialized”。 原因分析 按照之前支撑的经验,出现该问题的可能原因如下:
参数类型 描述 error_code String 调用失败时的错误码。 调用成功时无此字段。 error_msg String 调用失败时的错误信息。 调用成功时无此字段。 父主题: OBS管理
执行训练启动命令后,等待模型载入,当出现“training”关键字时,表示开始训练。训练过程中,训练日志会在最后的Rank节点打印。 图1 等待模型载入 更多查看训练日志和性能操作,请参考查看日志和性能章节。 父主题: 主流开源大模型基于Lite Server适配PyTorch NPU训练指导(6.3.905)
m_train/saved_dir_for_output/llama2-13b/saved_models/。 训练完成后,请参考查看日志和性能章节查看LoRA微调训练的日志和性能。 父主题: 主流开源大模型基于Lite Server适配PyTorch NPU训练指导(6.3.906)
响应Body参数 参数 参数类型 描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 批量重启节点。 POST /v2/{project_id}/pools/{pool_name}/nodes/batch-reboot
问题:服务退出显存未完全释放 解决方法:重启机器。 MindIE和vLLM在深度思考返回接口差异 对于DeepSeek-R1这类模型,其返回信息包含深度思考的内容。 当前MindIE接口深度思考内容和问题回答都在content字段中,类似“xxx</think>xxx“,通常</t
其他参数请根据界面提示填写。 设置完成后,单击“确定”,即进行增量训练。系统将自动跳转至“模型训练”页面,待训练完成后,您可以在此页面中查看训练详情,如“训练精度”、“评估结果”、“训练参数”等。 图1 选择增量训练版本 父主题: Standard自动学习
获取“repo_id”和待下载的文件名。 获取“repo_id” 在AI Gallery页面的资产详情页,单击复制完整的资产名称,如图1所示,获取到的信息即为“repo_id”。例如,复制出的信息为“ur5468675/test_cli_model1”,则该资产的“repo_id”为“ur5468675/test_cli_model1”。
三方开源源码 git clone https://gitee.com/ascend/MindSpeed.git git clone https://github.com/huggingface/transformers.git git clone https://github.com/NVIDIA/Megatron-LM
一个OBS目录,SDK会将notebook目录code_dir打包上传到obs_path中。 准备训练输出,与单机训练作业调试4相同。 查看训练支持的AI框架,与单机训练作业调试5相同。 保存当前Notebook为新镜像,与单机训练作业调试9相同。 Estimator初始化。 from
s/llm_train/saved_dir_for_output/llama2-13b/saved_models/。 更多查看训练日志和性能操作,请参考查看日志和性能章节。 父主题: 主流开源大模型基于Lite Server适配PyTorch NPU训练指导(6.3.906)
ModelArts数据集新建的版本找不到怎么办? 版本列表是可以缩放的,请缩小页面后查找。 单击数据集名称,进入数据集概览页,在概览页选择“版本管理”,可对页面进行缩小。 父主题: Standard数据准备
0:保存到OBS 1:保存到样本 samples 否 Array of SampleLabels objects 需要进行自动标注的样本标注信息列表。 stop_time 否 Integer 超时等待时间(单位是分钟),默认15分钟,此参数仅视频自动标注场景使用。 time 否 String
CV代码包:AscendCloud-CV 算子依赖包:AscendCloud-OPP 获取路径:Support-E 说明: 如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 支持的特性 表1 本版本支持的特性说明 分类 软件包特性说明 参考文档
LabelAttribute 参数 参数类型 描述 default_value String 标签属性默认值。 id String 标签属性ID。可通过调用标签列表查询。 name String 标签属性名称。不能超过64个字符,不能包含字符!<>=&"'。 type String 标签属性类型。可选值如下:
ModelArts统一镜像列表 统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像,包括MindSpore、PyTorch。适用于开发环境,模型训练,服务部署,请参考统一镜像列表。 表1 MindSpore 预置镜像 适配芯片 适用范围 mindspore_2