检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
统计周期内,通过认证的用户数。可以用来衡量平台用户的真实性和可信度。 注册用户数 统计周期内,注册的用户数。可以用来衡量平台的用户基数和潜在用户数量。 ARPPU 统计周期内,用户产生的平均付费金额。可以用来衡量平台的盈利能力和用户付费能力。 付费用户数 统计周期内,用户产生了付费的人数
生成模型服务 将已有模型部署为模型服务 接入模型服务 创建路由策略用于提供模型服务 父主题: 管理模型
本文介绍如何将微调后的模型或部分平台预置的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 部署模型服务
用户基础分析模板 模板介绍 统计周期内,通过分析新用户注册情况、用户浏览店铺页面情况、用户访问店铺时长等,了解用户的基本情况。 图1 用户基础分析计算模板 指标体系 表1 指标体系 指标名称 指标描述 注册用户数近7天 最近一周内注册的用户数量。 注册用户数总数 截止到当前时间点,总共注册的用户数量。
在“用户管理”页面,单击右上角“添加用户”。 在“添加用户”页面的“可选用户”区域框中勾选一个或多个用户名,单击,选中的用户显示现在“已选用户”区域框。 单击“确定”,新添加的用户显示在用户列表中。 在用户列表中,可查看已添加的用户账号名、添加人及添加时间等信息。 更多操作
可选非流式、流式。二者区别如下: 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 简称max_tokens,表示模型输出的最大长度。
期的注册用户数。 注册用户数月新增 指在一个月内注册的新用户数量。这个指标可以用来跟踪一个月内注册用户的数量,以及比较不同月份的注册用户数。 注册用户数总数 指从网站或应用程序启动以来注册的总用户数量。这个指标可以用来跟踪用户数量的整体趋势,以及比较不同时间段的注册用户数。 使用建议
使用在线构建方式新建卡片 支持无模板在线构建图表卡片和表单卡片。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 使用在线构建方式新建图表卡片 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。 在左侧导航栏选择“看板管理
将用户添加团队成员后,用户就能进入团队进行操作吗? 项目经理在“团队成员”页面将用户添加为团队成员后,该用户还需要在开发中心首页“我的团队”中关注该团队,以关注“TestTeam”为例,如图1所示,关注团队后,该用户才可进一步在此团队以具备的角色权限进行相应操作。 图1 关注团队
可选非流式、流式。二者区别如下: 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大长度。
创建完成后,会根据所选实例及指标生成对应的模板数据,显示在模板列表中。同时采集的指标数据会保存在自动生成的Kafka Topic中。 如果生成的模板数量与勾选的指标数量不一致,请确认所选指标是否已购买对应云服务实例并完成相应配置,具体请参见对应的云服务。 一键生成指标。 单击“一键生成”,如图2所示。
员定义的模板添加交付件,或者添加自定义类型交付件。在交付件管理页面,用户可以通过创建在线文档或上传离线文档两种方式创建及管理交付件文档,保证版本开发过程阶段性成果沉淀以及过程可追溯。 在线文档功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已创建版本。
自定义看板配置流程介绍 运营看板使用流程如图1所示,包括“新建我的卡片”和“新建我的屏幕”。 图1 使用流程 新建我的卡片 通过在线构建、使用公共卡片模板及离线构建的方式构建自定义卡片。 (可选)新建并发布屏幕模板 通过关联布局和卡片、设置卡片消息联动、配置样例页面来创建屏幕模板。
承诺的用户。本文将介绍按需计费资源的计费规则。 适用场景 按需计费适用于资源需求波动的场景,在使用AppStage的用户创建应用、测试模型服务时需要调用ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。
适用任务类型 提示语适用的任务类型,包括: 对话问答 NL2SQL 多模生成 任务规划 文案生成 功能调用 代码生成 全功能 标签 为提示语选择标签分类。可从以下几个维度选择(支持多选): 行业 适用领域 通用 变量标识符 用户可选择以下符号标识提示语内容中的变量。 大括号{} 双大括号{{}}
运营中的重要数据,支撑下一步运营动作,提升产品运营效率。 功能介绍 提供丰富的卡片类型,供看板选用。卡片构建方式包括:使用在线构建方式构建图表卡片、使用在线构建方式构建表单卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 在看板编辑页面,通过拖拉拽的方式,以图表的形式进行呈现,直观展现产品运营看板数据。
细分领域如金融、电网场景,需要对推理结果进行定制调整,则可在AI原生应用引擎使用模型在线微调训练功能,快速生成行业场景定制模型服务,满足用户特定需求。 对话沟通 通过对话沟通,快速理解并响应客户的需求,提供高效的解决方案或信息。对于涉及行业和领域的专业知识或技术,平台的知识库能够
特定的范围之中,进而更好地控制模型的输出。通过提供清晰和具体的指令,引导模型输出并生成高相关、高准确且高质量的文本对答内容,属于自然语言处理领域突破的重要技术,可以提升用户的使用体验和效率,减少用户的困惑和误解。 前提条件 已创建提示语。 优化提示语 在AI原生应用引擎的左侧导航栏选择“知识中心
统计cpu信息,每次采集都为每个vcpu,以及总cpu维度分别生成消息。 原始数据来源:/proc/loadavg、/proc/stat等。 参数配置 插件默认为CPU0、CPU1、...、CPU-ALL分别生成消息。用户可根据需要配置_filter_cpu_id项,进行消息筛选。如果用户只需要总维度的CPU统计信
请检查建立的SSH密钥配对关系,必要时重新生成密钥并到代码托管控制台进行配置。 只有开启IP白名单的机器才可以在Git客户端克隆。 使用SSH协议在TortoiseGit客户端克隆代码 本节内容指导如何使用TortoiseGit客户端克隆代码托管服务的仓库到本地环境中。 下载并安装TortoiseGit客户端。 获取仓库地址。