检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
生成模型服务 将已有模型部署为模型服务 接入模型服务 创建路由策略用于提供模型服务 父主题: 管理模型
非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 简称max_tokens,表示模型输出的最大长度。
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心
启用模型服务 在“我部署的”页签服务列表中,单击“操作”列“启用”。 停用模型服务 在“我部署的”页签服务列表中,单击“操作”列“停用”。 父主题: 生成模型服务
非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大长度。 温度 较高的数值
"ssl_certificate" is defined for the "listen ... ssl"" 解决办法 开启了https协议但没有绑定证书,会报此错,请绑定证书,具体请参见配置监听。 父主题: SLB同步异常相关问题
创建完成后,会根据所选实例及指标生成对应的模板数据,显示在模板列表中。同时采集的指标数据会保存在自动生成的Kafka Topic中。 如果生成的模板数量与勾选的指标数量不一致,请确认所选指标是否已购买对应云服务实例并完成相应配置,具体请参见对应的云服务。 一键生成指标。 单击“一键生成”,如图2所示。
件。 另外,请确认部署过程中证书申请的步骤在业务安装和启动流程之前,如果业务先启动,之后才进行证书的申请,配置文件还未生成,也会出现找不到配置文件的问题。 若不存在,则要参考STS 2.0业务接入指南申请证书。如果配置的文件路径不是stsagent生成的默认路径,则需要手工将**
功能说明 统计cpu信息,每次采集都为每个vcpu,以及总cpu维度分别生成消息。 原始数据来源:/proc/loadavg、/proc/stat等。 参数配置 插件默认为CPU0、CPU1、...、CPU-ALL分别生成消息。用户可根据需要配置_filter_cpu_id项,进行消息筛
testCertificateName #非必传,证书,需为领域下已录入证书 listeners: #必传 - protocol: https
更多操作 表2 更多操作 操作 说明 编辑证书 单击证书列表中的证书名称,编辑证书信息,支持修改证书描述、证书内容及私钥。单击“保存”。 删除证书 单击证书列表操作列的“删除”,在弹出的提示框中单击“确定”,即可删除证书。已被服务关联使用的证书无法被直接删除。 父主题: 在SLB中创建和管理监听
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另
AI原生应用引擎支持所有数据集进行数据标注吗? 进行标注的数据集必须同时满足用途为“模型训练”、任务领域为“自然语言处理”、任务子领域为“文本生成”、数据集格式为“对话文本”四个条件。 父主题: AI原生应用引擎
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“证书管理”。 在证书列表页面,检查自己的后端证书是否正确。 父主题: SLB同步异常相关问题
在监听详情页面选择“监听”页签。 检查监听管理是否开启了https且配置了证书,如果不需要https将协议改为http,证书选择“-”。 图1 监听管理配置 方法二: 将证书迁移到和监听一致的服务下。 父主题: 运行时引擎负载均衡
查看主机监控报表 如果在监控服务配置采集主机监控指标数据,会生成主机监控报表,可以从主机列表跳转查看主机监控报表。采集主机监控指标数据的操作请参见监控服务采集Linux主机监控指标操作流程。 查看主机监控报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
SLB(>1.3.11) DMQ 分布式JOB 函数 注册中心 选择注册中心。 单击“保存”,在弹出的对话框中单击“确定”。 在灰度服务列表中会生成一条记录,当前状态为“待配置”。 更多操作 表2 相关操作 参数 说明 删除灰度服务 选择灰度服务列表操作列的“更多 > 删除”,删除灰度服务。只有待配置的服务才可以删除。
表5 AI原生应用引擎SDK功能矩阵 接口类型 接口名 函数名 Python 大模型相关接口 文本生成 ModelRouter.chat.completion.create √ 向量生成 ModelRouter.embeddings.create √ 文生图 ModelRouter
助手,智能分析,智能文档,生活助手等提示语类型,每个提示语类型下面都有对应类型相关提示语,如指标计算方法,问答场景选择,总结大纲,买家评价生成器等提示语。 父主题: AI原生应用引擎
处理运维中心事件单 对于已创建的事件单或使用告警信息直接生成事件单进行处理,可以对事件单进行标记、移交、暂停、退回和关闭处理,事件单不同处理方式说明如事件单处理说明所示。 处理事件单 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。