检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
i18n_description 参数 参数类型 描述 language String 国际语种,可选值如下: zh-cn(中文) en-us(英文) description String 国际化语种的描述信息。 表25 inputs 参数 参数类型 描述 name String 数据输入通道名称。
//docs.vllm.ai/en/latest/getting_started/quickstart.html。 以下服务启动介绍的是在线推理方式,离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart
i18n_description 参数 参数类型 描述 language String 国际语种,可选值如下: zh-cn(中文) en-us(英文) description String 国际化语种的描述信息。 表25 inputs 参数 参数类型 描述 name String 数据输入通道名称。
//docs.vllm.ai/en/latest/getting_started/quickstart.html。 以下服务启动介绍的是在线推理方式,离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart
//docs.vllm.ai/en/latest/getting_started/quickstart.html。 以下服务启动介绍的是在线推理方式,离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart
加速卡驱动后,可以自动采集的相关指标。此处仅展示NPU相关指标,其他指标项请参考CES Agent支持的指标列表。 表1 NPU指标列表 英文名称 中文名称 说明 单位 维度 npu_device_health NPU健康状况 NPU卡的健康状况 - instance_id,npu
i18n_description 参数 是否必选 参数类型 描述 language 否 String 国际语种,可选值如下: zh-cn(中文) en-us(英文) description 否 String 国际化语种的描述信息。 表21 Input 参数 是否必选 参数类型 描述 name 是 String
i18n_description 参数 参数类型 描述 language String 国际语种,可选值如下: zh-cn(中文) en-us(英文) description String 国际化语种的描述信息。 表12 policies 参数 参数类型 描述 auto_search auto_search
i18n_description 参数 参数类型 描述 language String 国际语种,可选值如下: zh-cn(中文) en-us(英文) description String 国际化语种的描述信息。 表11 policies 参数 参数类型 描述 auto_search auto_search
//docs.vllm.ai/en/latest/getting_started/quickstart.html。 以下服务启动介绍的是在线推理方式,离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart
i18n_description 参数 参数类型 描述 language String 国际语种,可选值如下: zh-cn(中文) en-us(英文) description String 国际化语种的描述信息。 表14 policies 参数 参数类型 描述 auto_search auto_search
务,并按照global rank_table中的全量实例、增量实例的顺序,对全量推理实例、增量推理实例启动的端口号进行排序,端口之间用,(英文逗号)分隔开作为该环境变量的输入。 USE_OPENAI:仅在服务入口实例生效,用于配置api-server服务是否使用openai服务,
务,并按照global rank_table中的全量实例、增量实例的顺序,对全量推理实例、增量推理实例启动的端口号进行排序,端口之间用,(英文逗号)分隔开作为该环境变量的输入。 USE_OPENAI:仅在服务入口实例生效,用于配置api-server服务是否使用openai服务,