检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当推理方式为batch/edge时仅支持配置一个模型。 当推理方式为real-time时,可根据业务需要配置多个模型并分配权重,但多个模型的版本号不能相同 schedule 否 schedule结构数组 服务调度配置,仅在线服务可配置,默认不使用,服务长期运行。请参见表6。 cluster_id
复制到本地并获取新的manifest文件路径,然后使用SDK解析新的manifest文件。 ModelArts数据管理模块在重构升级中,对未使用过数据管理的用户不可见。建议新用户将训练数据存放至OBS桶中使用。 1 2 3 4 5 6 7 8 if data_path.startswith('obs://'):
adapter_name_or_path /home/ma-user/ws/xxx/sft_lora/ 基于lora训练完成后生成的lora产物未合并时的权重文件。基于lora微调后模型进行增量训练时,需要传入此权重文件。 train_from_scratch false 用于指示模型
Query参数 参数 是否必选 参数类型 描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数
预测的时间不超过40秒。 前提条件 数据已完成准备:已在ModelArts中创建状态“正常”可用的模型。 由于在线运行需消耗资源,确保账户未欠费。 已获取预测文件的本地路径,可使用绝对路径(如Windows格式"D:/test.png",Linux格式"/opt/data/test