检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在推理生产环境中部署推理服务 本章节介绍如何在ModelArts的推理生产环境(ModelArts控制台的在线服务功能)中部署推理服务。 Step1 准备模型文件和权重文件 在OBS桶中,创建文件夹,准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3
查询部署计划列表 功能介绍 查询部署计划列表。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v1/deployments 表1 Query参数 参数 是否必选
使用AI Gallery SDK构建自定义模型 AI Gallery的Transformers库支持部分开源的模型结构框架,并对昇腾系列显卡进行了训练/推理性能优化,可以做到开箱即用。如果你有自己从头进行预训练的模型,AI Gallery也支持使用SDK构建自定义模型接入AI Gallery
更新云硬盘 功能介绍 更新一个云硬盘的名称和描述。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/cloudvolumes/{volume_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID
集群安全组规则配置 CCE作为通用的容器平台,安全组规则的设置适用于通用场景。集群在创建时将会自动为Master节点和Node节点分别创建一个安全组,其中Master节点的安全组名称是:{集群名}-cce-control-{随机ID};Node节点的安全组名称是:{集群名}-cce-node
工具概述 迁移工具Edge是一款用于配合迁移中心进行源端资源发现与采集的工具,同时Edge还提供了工作流模块,用于配合云端迁移工作流任务。 特性开关 Edge所包含的特性开关参见下表。 参数 说明 参数值 参数路径 config.httpclient.verifier 验证主机名特性开关
创建组合任务 概述 FDI支持创建组合任务,组合任务适用于需要持续同步实时数据的场景。实现一个源端多个数据表到一个目标端多个数据表的实时同步及增量同步,提高了数据的集成同步效率。 组合任务支持数据表之间字段(列)级别的灵活映射,例如源端一个数据表中的多个字段可分别映射到目标端的不同数据表中
在推理生产环境中部署推理服务 本章节介绍如何在ModelArts的推理生产环境(ModelArts控制台的在线服务功能)中部署推理服务。 Step1 准备模型文件和权重文件 在OBS桶中,创建文件夹,准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3
创建守护进程集(DaemonSet) 操作场景 云容器引擎(CCE)提供多种类型的容器部署和管理能力,支持对容器工作负载的部署、配置、监控、扩容、升级、卸载、服务发现及负载均衡等特性。 其中守护进程集(DaemonSet)可以确保全部(或者某些)节点上仅运行一个Pod实例,当有节点加入集群时
重置节点 操作场景 您可以通过重置节点修改节点的配置,比如修改节点操作系统、登录方式等。 重置节点会重装节点操作系统,并重新安装节点上Kubernetes软件。如果您在使用过程中修改了节点上的配置等操作导致节点不可用,可以通过重置节点进行修复。 约束与限制 v1.13及以上版本的CCE
Workspace支持的CES操作系统监控指标(安装Agent) 功能说明 通过在云桌面中安装Agent插件,可以为用户提供服务器的系统级、主动式、细颗粒度监控服务。本节定义了云桌面上报云监控的操作系统监控指标。 操作系统监控目前支持的监控指标GPU相关监控项。 操作系统监控目前支持的监控指标有
创建组件实例 功能介绍 此API用来创建组件实例。 调试 您可以在API Explorer中调试该接口。 URI POST /v2/{project_id}/cas/applications/{application_id}/components/{component_id}/instances
PG_THREAD_WAIT_STATUS 通过PG_THREAD_WAIT_STATUS视图可以检测当前实例中工作线程(backend thread)以及辅助线程(auxiliary thread)的阻塞等待情况。多租场景下,non-PDB访问该视图时返回全部信息,PDB访问该视图时仅返回该
Flink常用配置参数 配置文件说明 Flink所有的配置参数都可以在客户端侧进行配置,建议用户直接修改客户端的“flink-conf.yaml”配置文件进行配置,如果通过Manager界面修改Flink服务参数,配置完成之后需要重新下载安装客户端: 配置文件路径:客户端安装路径/
动态资源超卖 当前很多业务有波峰和波谷,部署服务时,为了保证服务的性能和稳定性,通常会按照波峰时需要的资源申请,但是波峰的时间可能很短,这样在非波峰时段就有资源浪费。另外,由于在线作业SLA要求较高,为了保证服务的性能和可靠性,通常会申请大量的冗余资源,因此,会导致资源利用率很低、
进阶实践-面试管理流程 本入门以创建一个面试管理流程为例,向您介绍如何使用AstroFlow中的子表单组件。子表单是一种高级的容器组件,支持在创建后向内部添加多种组件。例如,在填写个人简历表单时,需要录入多条工作经历,录入的数据类型相同,数据的行数不固定,但都属于同一种业务规则数据
出租车发票识别 功能介绍 识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG
步骤1:数据准备 使用DataArts Studio前的准备 如果您是第一次使用DataArts Studio,请参考购买并配置DataArts Studio章节完成注册华为账号、购买DataArts Studio实例(DataArts Studio企业版)、创建工作空间等一系列操作
连接设置 介绍设置客户端和服务器连接方式相关的参数。 light_comm 参数说明:设置服务器是否使用轻量通信方式。 该参数指定服务器是否使用基于轻量锁和非阻塞socket的通信方式。 参数类型:布尔型 参数单位:无 取值范围: on:表示使用轻量通信方式。 off:表示不使用轻量通信方式
执行应用对接测试用例 单点登录成功后,即开始执行应用对接测试用例,测试用例如表1所示。 表1 测试用例 序号 用例名称 用例介绍 测试步骤 测试结果 是否通过 1 MIW企业管理员单点登录 企业管理员成功登录MIW后,可以免密登录应用。 1、企业管理员打开用户工作台,输入账号@企业