检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。 提示语管理 用户自定义创建的、收藏的以及平台预置的提示语模板进行优化和改进。 大模型微调 提供调整大型语言模型的参数以适应特定任务的过程,通过在与任务相关的数据集上完成模型训练。
并重新选择正确的资源包或保证账户中的余额充足。 未购买资源包,在按需计费模式下账户的余额不足。 欠费影响 包年/包月 对于包年/包月的服务资源,用户已经预先支付了资源费用,因此在账户出现欠费的情况下,已有的包年/包月资源仍可正常使用。然而,对于涉及费用的操作,如添加超出开发中心用
在“我接入的”页签下的服务列表中,单击“操作”列的“取消发布”。 模型调测 在“我接入的”页签的服务列表中,单击“操作”列“模型调测”。 参照调测模型的步骤,完成模型测试。 修改模型服务 在“我接入的”页签下的服务列表中,单击“操作”列的“更多 > 修改”。 删除模型服务 在“我接入的”页签下的服务列表中,单击“操作”列的“更多
工具页签下展示平台预置的第三方工具及租户上架的工具。 平台预置的第三方工具 请参考调用资产中心工具前设置认证鉴权设置鉴权,再进行调用。 租户上架的工具 请参考收藏上架的工具和调用资产中心工具前设置认证鉴权进行收藏及鉴权,再进行调用。 大模型 大模型页签下展示平台预置的大模型和平台接入的第三方模型服务。
务器上的资源,通常使用URL参数指定要删除的资源。 put:put请求,用于更新服务器上的资源,通常将更新的数据放在请求体中。 patch:请求服务器更新资源的部分内容。当资源不存在的时候,patch可能会去创建一个新的资源。 API请求体架构 请求头 HTTP请求消息的组成部分
大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大长度。 温度 较高的数值会使输出更加随机,而较低的数值会使其更
接入运营数据 在运营中心新建数据源 新建数据接入将源端数据迁移到运营中心
描述:根据用户输入的城市,获取该城市的天气状况及空气质量,调用大模型生成旅游过程中的注意事项,最后以短信的形式将注意事项发送到用户手机。 在工作流构建页面,添加节点和执行动作,并配置各节点输入、输出参数。 配置起始节点。 在请求体参数列表中,单击操作列的,定义string类型的变量city,用于存储用户输入的城市名称。
无法选用? 创建Agent(工作流模式)时,所选工作流的起始节点必须引入用户对话输入,包含默认的WISEAGENT_USER_INPUT参数,如图1所示,表示在Agent调用工作流时,以用户在问答对话中输入的内容作为工作流的请求参数。不满足要求的工作流无法选用。 图1 引入用户对话输入
在WiseDBA中查看数据库产生的事件 支持查询GeminiDB(for Cassandra)数据库产生的大Key和热Key事件。 查看大Key事件 单个分区键的行数不能超过10万;单个分区键的大小不超过100MB。 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发
在WiseDBA中查看数据库产生的事件 支持查询GeminiDB(for Cassandra)数据库产生的大Key和热Key事件。 查看大Key事件 单个分区键的行数不能超过10万;单个分区键的大小不超过100MB。 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发
金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。 如果您已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的大模型微调服务API在线调用-SFT
速复制及收藏等。在模型调测时引用提示语模板,可以快速推进引导对话的发展,或者增加故事的复杂性和深度。大模型会基于提示语所提供的信息,生成对应的文本或者图片。 测试提示语 在AI原生应用引擎的左侧导航栏选择“资产中心”。 在资产中心页面,选择“提示语模板”页签。 将鼠标光标移至提示
据源中数据表或数据文件的迁移任务,将源端数据迁移到运营中心,为后续业务做数据准备。 看板管理 通过自定义运营看板,可以把产品运营中的关键数据统一呈现出来,可按人员权限和业务类型展示不同的数据看板,可视化展现产品运营现状。 审计日志 审计日志是记录系统活动的记录,以便检查和审查这些
通过调测模型,可检验模型的准确性、可靠性及反应效果,发现模型中存在的问题和局限性,确保模型能够在实际应用中正常运行,并且能够准确地预测和处理数据。 支持对我的模型(我部署的、我接入的)、我的路由策略、平台预置的模型以及平台接入的第三方模型进行调测。 前提条件 对平台接入的第三方模型进行调
PromptTemplate 负责提示语模板的构建和初始化等。 4 KnowledgeRetriever 提供了知识库检索的能力,可以检索开发者的知识库,提取相关的信息。 5 ApplicationCenter 提供了开发者调用部署在平台的应用的能力。 父主题: AI原生应用引擎SDK
在SLB中进行降级配置 在SLB中配置黑白名单 在SLB中进行限流配置 在SLB中配置负载均衡其他配置项 在SLB中查看Lua配置 复制和迁移SLB配置信息 在SLB中配置负载均衡实例共享 父主题: 配置运行时引擎负载均衡
节点数是指在一个特定的环境中,例如测试或生产环境,需要部署的节点数量。 镜像名称 用于标识环境配置的镜像。 镜像版本 用于区分一个镜像库中不同的镜像文件所使用的标签。 资源规格 指根据不同的环境类型和用途,对服务器的 CPU 、内存、数据盘等硬件资源进行合理分配和管理的过程。例如,开发
在SLB中进行降级配置 在SLB中配置黑白名单 在SLB中进行限流配置 在SLB中配置负载均衡其他配置项 在SLB中查看Lua配置 复制和迁移SLB配置信息 在SLB中配置负载均衡实例共享 父主题: 配置运维中心负载均衡
资源间绑定服务不一致 问题现象 可能原因 绑定的证书所在的服务和监听所在的服务不一致导致。 处理方法 方法一: 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“监听管理”。 在监听管理页面,单击监听名称。 在监听详情页面选择“监听”页签。