检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 多模态模型 多模态模型是指能够处理多种类型数据
业务执行走影子库逻辑与生产库逻辑,通过调用接口来打开,程序必须主动关闭。 执行影子库SQL语句中不要带有生产的库。 TaurusDB在线压测不支持双云切换功能,读写分离功能、权重相关功能。 连接池参数 单击“运行参数值”列中的,可以修改参数取值。 jdbcProperties(MySQL
业务执行走影子库逻辑与生产库逻辑,通过调用接口来打开,程序必须主动关闭。 执行影子库SQL语句中不要带有生产的库。 TaurusDB在线压测不支持双云切换功能,读写分离功能、权重相关功能。 连接池参数 单击“运行参数值”列中的,可以修改参数取值。 jdbcProperties(MySQL
灰度服务配置 本章介绍通过IaC进行灰度服务配置的管理,包括灰度规则的管理及灰度阶段切换。对应的资源类型为WiseCloud::LoadBalancer::GrayConfig。 灰度比例转换为pod个数是通过向下取整法,例如:共6个pod,如果灰度比例配置为10%,灰度pod个数则为6
大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 多模态模型 多模态模型是指能够处理多种类型数据
I,但是该模型能力有限,只能作为问答模型,不能作为思考模型。首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行体验,订购操作请参见购买AppStage。 平台预置了开源模型Qwen系列、DeepSeek系列等,请参考将已有
交付件管理”,进入“交付件管理”页面。 在交付件列表中,单击交付件所在行“操作”列的“创建文档”。 在“上传文档”对话框,选择“交付方式”为“离线文档”,单击“添加文件”将本地已准备好的文档进行上传,并单击“确定”。 创建代码仓。 在左侧导航栏选择“代码仓管理”,进入“代码仓管理”页面。
即可调用子工作流。 调用子工作流节点的输入和输出通常以JSON格式传递,因此,一般在调用子工作流节点前添加一个JSON构造器节点,将对象转换为JSON格式字符串,在调用子工作流节点后添加一个JSON解析动作,用于解析调用子工作流的输出,提供给后续节点使用,如图1所示。 图1 调用子工作流
新建及管理我的卡片 新建卡片分类为卡片分组 使用在线构建方式新建卡片 使用模板构建方式新建卡片 使用离线构建方式新建卡片 管理我的卡片 父主题: 在运营中心自定义运营看板
SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。 变更计费模式 不支持。 不支持。 变更规格 支持变更套餐规格。 不支持。 适用场景 适用于可
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
处理运维中心变更电子流 变更电子流提交后会走给审批人处理,设置的各级审批人审批变更方案的合理性后,会走给变更实施人做变更实施,变更实施人处理后,会走给变更验证人验证变更是否成功。 处理变更电子流 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。
格参数,配置完成后单击“下一步”。 在创建组件变更计划中选择变更资源,创建完成后,单击“确定”。 父主题: 使用部署服务进行自动化变更
创建变更时可复用的集群扩容模板 部署服务支持配置扩容模板,可以在变更环境时直接复用扩容模板,对集群进行扩容。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建扩容模板 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 >
本文介绍如何将微调后的模型或部分平台预置的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
管理我的卡片 所有卡片都可以在“我的卡片”列表中查看。 您还可以在“我的卡片”界面执行如表1的操作。 表1 相关操作 操作 说明 切换卡片显示方式 :以卡片形式展示。默认以卡片形式展示。 :以列表形式展示。 筛选卡片 通过卡片的状态、卡片来源、排序方式筛选卡片。 升级卡片 卡片形式:在需要升级的卡片上,单击“升级”。
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 关于代码仓管理的常见问题请参见代码托管(CodeArts
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性资源服务(ERS)”,进入ERS服务概览页面。 可以在概览页面进入集群列表或者查看更多文档,如图1所示。 图1 概览 父主题: 使用弹性资源服务管理容器集群
JSON构造器 JSON构造器为用户提供构造JSON对象的能力,用户通过界面化操作可以构造出复杂的JSON结构,也可以通过“切换为源码模式”,将复杂的JSON格式数据转换到界面显示,包含“构造JSON对象”执行动作。 构造JSON对象 输入参数 用户配置构造JSON对象源码模式执行动作,相关参数说明如表1所示。