检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
按需配置。 表2 部署上线所需权限 业务场景 依赖的服务 依赖策略项 支持的功能 配置建议 部署服务 ModelArts modelarts:service:* 部署、启动、查新、更新模型服务。 建议配置。 仅在严格授权模式开启后,需要显式配置左侧权限。 LTS lts:logs:list
Command=bootstrap/run Component=ma-training-toolkit Platform=ModelArts-Service time="2023-05-27T07:07:13Z" level=error msg="[detect] ascend-check
务。 ModelArts.4710 OBS权限问题 ModelArts在跟OBS交互时,由于权限相关的问题导致。当界面提示“OBS service Error Message”信息时,表示是由于OBS权限导致的问题,请参考如下步骤排除故障。如果界面错误提示不包含此信息,则是因为后
系统容器异常退出 问题现象 在训练创建后出现“系统容器异常退出”的故障。 [ModelArts Service Log]2022-10-11 19:18:23,267 - file_io.py[1ine:748] - ERROR: stat:404 errorCode:NoSuchKey
表14 advanced_config 参数 参数类型 描述 auto_search auto_search object 超参搜索策略。 表15 auto_search 参数 参数类型 描述 skip_search_params String 需要排除的超参组合。 reward_attrs
steps=[label_step, release_data_step, training_step, model_step, service_step], policy=wf.policy.Policy( scenes=[ wf
session = Session() predictor_instance = Predictor(session, service_id="your_service_id") predict_result = predictor_instance.predict(data=data_path
服务名称 部署模型 1 service--lora-01 Qwen2-7B_01-lora 2 service--lora-02 Qwen2-7B_02-lora 3 service--lora-03 Qwen2-7B_03-lora 4 service--sft-01 Qwen2-7B_01-sft
/v1/{project_id}/services/{service_id}/property 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID。 请求参数
表31 advanced_config 参数 参数类型 描述 auto_search auto_search object 超参搜索策略。 表32 auto_search 参数 参数类型 描述 skip_search_params String 需要排除的超参组合。 reward_attrs
扩缩容模型服务实例数 在使用大型模型进行推理时,其业务需求会呈现出明显的峰谷波动。因此,模型服务必须具备灵活的扩缩容能力,以适应不同时间段内的用户负载变化,确保服务的高可用性和资源的高效利用。 ModelArts Studio大模型即服务平台支持手动扩缩容模型服务的实例数,该操作不会影响部署服务的正常运行。
表16 advanced_config 参数 参数类型 描述 auto_search auto_search object 超参搜索策略。 表17 auto_search 参数 参数类型 描述 skip_search_params String 需要排除的超参组合。 reward_attrs
及Decode阶段的访存密集型特性,通过调节PD节点数量配比来提升Decode节点的batch size来充分发挥NPU卡的算力,进而提升集群整体吞吐。 此外,在Decode平均低时延约束场景,PD分离相比PD混合部署,更加能够发挥性能优势。 分离部署的实例类型启动分为以下三个阶段:
550 mindie-service/lib" "chmod 440 mindie-service/lib/*" "chmod 550 mindie-service/lib/grpc" "chmod 440 mindie-service/lib/grpc/*"
表示创建Notebook实例。 modelarts:trainJob:create:此策略项表示创建训练作业。 modelarts:service:create:此策略项表示创建推理服务。 给子账号配置权限:限制使用公共资源池 使用主用户账号登录管理控制台,单击右上角用户名,在下
String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。 search_type 否 String 过滤方式。可选值如下: equal表示精确匹配。 contain表示模糊匹配。 具体过滤的字段,由各个接
Storage Service,OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力。 在使用ModelArts时存在与OBS的数据交互,您需要使用的数据可以存储至OBS。 弹性云服务器 弹性云服务器(Elastic Cloud Server,
[ModelArts Service Log]2021-01-21 11:35:42,178 - file_io.py[line:658] - ERROR: stat:503 errorCode:None errorMessage:None reason:Service Unavailable
Int 返回多条正常结果。 不使用beam_search场景下,n取值建议为1≤n≤10。如果n>1时,必须确保不使用greedy_sample采样,也就是top_k > 1,temperature > 0。 使用beam_search场景下,n取值建议为1<n≤10。如果n=1,会导致推理请求失败。
json,只允许放置一个 │ │ ├──customize_service.py 必选:模型推理代码,文件名称固定为customize_service.py,只允许放置一个,customize_service.py依赖的文件可以直接放model目录下 示例代码 在ModelArts