检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识检索流作为知识库检索工具,基于意图识别、Query改写、Query拆解、召回和重排序等,支持可视化RAG检索编排,可以提升检索过程的灵活度与检索结果的质量。 单击,在“知识检索流”弹框中选择知识检索流。 变量 变量用来存储用户的某一行为或偏好,在对话过程中,会自动识别与变量匹配的内容,并存储在变量中。
检索规划包含“Query拆解”、“Query改写”、“意图识别”三个执行动作,执行动作参数配置说明如表1所示。 Query拆解:配置适当的模型将原始查询内容拆解为更简单、易理解的请求。 Query改写:配置适当的模型对原始查询内容进行改写、优化,使得原始请求更准确。 意图识别:配置适当的模型对原始内容进行意图判断。
使用SLB为高访问量业务进行流量分发 对于业务量访问较大的业务,可以通过SLB设置相应的分配策略,将访问量均匀的分到多个后端服务器处理。例如大型门户网站,移动应用市场等。 使用SLB消除单点故障 对可靠性有较高要求的业务,可以在SLB上添加多个后端服务器。SLB会通过健康检查及时发现并屏蔽
购买AppStage运营中心 首次使用需要先购买运营中心专业版,具体操作请参见购买AppStage。 配置服务授权 购买运营中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
运行时引擎依赖于运维中心能力,首次使用需要先购买运维中心,具体操作请参见购买AppStage。 配置服务授权 购买运行时引擎后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
购买AppStage运维中心 首次使用需要先购买运维中心专业版,具体操作请参见购买AppStage。 配置服务授权 购买运维中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
义屏幕构建。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 已创建我的卡片,具体请参见使用在线构建方式新建卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 新建屏幕模板 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心控制台。
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 关于代码仓管理的常见问题请参见代码托管(CodeArts
本文介绍如何将微调后的模型或部分平台预置的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 如果您计划开始一个新项目,那么您可以
AppStage开发中心知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。
支持将平台资产中心预置的部分模型作为微调前基础模型,也可以选择微调后的新模型作为基础模型再次进行微调。 前提条件 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已具备格式为“对话文本”的微调数据集,具体请参考创建微调数据集或收藏预置微调数据集。
实时查看关键指标数据,掌握产品运营中的重要数据,支撑下一步运营动作,提升产品运营效率。 特点 提供丰富的卡片类型,供看板选用。卡片构建方式包括:使用在线构建图表卡片、使用在线构建表单卡片、使用卡片模板新建卡片、使用离线构建新建卡片。 在看板编辑页面,通过拖拉拽的方式,以图表的形式进行呈现,直观展现产品运营看板数据。
仅适用于使用“上传卡片”方式新建的卡片。 编辑卡片 卡片形式:在需要编辑的卡片上,单击“编辑”。 列表形式:在对应的“操作”列下,单击“编辑”。 说明: 适用于使用“在线构建”、“模板构建”方式新建的卡片。 查看卡片详情 卡片形式:单击“更多 > 详情”,可以查看卡片详情。 列表形式:在对应的“版本号”列下,单击版本号。
仅适用于使用“上传卡片”方式新建的卡片。 编辑卡片 卡片形式:在需要编辑的卡片上,单击“编辑”。 列表形式:在对应的“操作”列下,单击“编辑”。 说明: 适用于使用“在线构建”、“模板构建”方式新建的卡片。 查看卡片详情 卡片形式:单击“更多 > 详情”,可以查看卡片详情。 列表形式:在对应的“版本号”列下,单击版本号。
计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。 按需计费 千tokens * 每千tokens单价 大模型微调服务API在线调用-SFT局部调优 根据实际输入和输出tokens总量计费,平台提供算力支持。
登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。 购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 (可选)在应用平台控制台左侧导航,选择“服务授权”,在“服务授权”页面,单击“一键授权”,重
M3-6B服务、大模型调优服务API在线调用。 套餐包单价+按需计费(ChatGLM3-6B服务、大模型调优服务API在线调用) 知识库容量:50GB 智能应用运行时引擎(20实例):2个 ChatGLM3-6B服务、大模型调优服务API在线调用根据实际输入和输出tokens总量计费,计费规则请参考按需计费
登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。 购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 (可选)在应用平台控制台左侧导航,选择“服务授权”,在“服务授权”页面,单击“一键授权”,重