检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。 大模型微调服务API在线调用-SFT局部调优 根据实际输入和输出tokens总量计费,平台提供算力支持。 计费周期 API在线调用按需计费按token数量计费,与周期无关。
业数据的分析洞察能力,覆盖交付质量、交付效率、交付能力、交付成本、交付价值,同时集成了华为先进的方法论和优秀实践,助力企业数字化转型和数据驱动运营及治理,提升企业软件能力可信和研发效能。 操作步骤 在开发中心左上角单击,在菜单列表中选择“效能大盘”,进入“效能大盘”页面。 查看研
挂载用户 设置磁盘挂载用户,即该服务已绑定的运维账号。 将磁盘挂载到设置的磁盘挂载点后,挂载用户可以访问和操作挂载点目录的文件系统。 磁盘类型 选择需要新增磁盘的类型,当前支持SAS、SSD和GPSSD。 磁盘大小(GB) 输入需要新增的磁盘大小,支持新增磁盘大小的范围为10~32768GB。
确定。建议该参数和“多样性”只设置1个。 多样性:影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”只设置1个。 存在惩罚:介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。 频率惩罚:介于-2.0和2.0之间的数字。
部署服务控制台的只读权限。 查看服务的监控大盘和业务报表、调用链、告警和事件、日志检索。 无 组织管理员 服务运维岗位 服务级 即业务运维人员,仅允许业务SRE申请。具有以下权限: 编辑、查看SRE所负责服务的配置。 控制台操作权限,包括服务的部署和升级、EAP编排管理,自定义报表管理,作业平台操作。
取值范围: 可以为空,为空则使用默认值。枚举值:VECTOR_RAG(向量RAG,是一种结合了向量化和大语言模型的RAG技术)、GRAPH_RAG(知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术)。 默认取值: VECTOR_RAG。 retrieval_config 否
确定。建议该参数和“多样性”只设置1个。 多样性 影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”只设置1个。 存在惩罚 介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。 频率惩罚 介于-2.0和2.0之间的数字。
在团队多用户协作开发过程中,不同角色成员执行各自权限和责任事项,因此需要在团队中添加协作开发的各角色成员(项目经理、开发人员、测试人员等),实现统一有序的成员信息管理。 创建及规划版本 创建版本 对团队所关联的服务划分版本,包括创建版本的基本配置信息以及选择版本开始和结束时间。 规划交付件 在版本开
开发代码是开发人员使用编程语言编写程序的过程,包括设计、编写、测试和维护程序的过程。在代码开发过程中,开发人员需要根据需求分析和设计文档,使用编程语言和开发工具编写程序代码,然后进行测试和调试,最终交付给用户使用。代码开发是产品开发的重要环节,决定了产品的质量和可靠性。 开发代码的详细指导请参见《开发指南》。
流程环节 说明 1 创建及发布Agent 一站式创建专属Agent,并将应用程序及相关组件进行发布,使其能够正常运行。当前支持创建LLM模式和工作流模式两种类型的Agent。 LLM模式下,将准备好的模型服务(必选)、工具、工作流及知识库等编排成Agent。 工作流模式下,用户与工
cpu_util”,测量对象为“云服务器”。 查看维度的Key和Value,云服务器维度的Key和Value分别为instance_id和云服务器ID。 父主题: 应用运维
可以为null,如果不为null,枚举值:INT、FLOAT、BOOLEAN和STRING。 默认取值: STRING。 order_type 是 String 参数解释: 排序类型。 约束限制: 不涉及。 取值范围: 不为null,枚举值:ASC(升序)和DESC(降序)。 默认取值: 不涉及。 表8 DataSetSearchInfo
虚拟机部署 虚拟机部署流程 上传Terraform包和软件包 使用虚拟机部署应用 其他操作 父主题: 部署应用
不涉及。 取值范围: 介于-2.0和2.0之间。 默认取值: 0。 logit_bias 否 Map<String,Integer> 参数解释: 该参数接受一个JSON对象,将标记映射到从-100(禁止)到100(独占选择标记)的关联偏差值。 像-1和1这样的适度值将以较小的程度改变选择标记的概率。
容器部署 容器部署流程 上传镜像包和IaC3.0包 创建容器部署环境 使用容器部署应用 其他操作 父主题: 部署应用
运维中心弹性资源服务 如何调整纳管集群的资源占用量? ers-monitoring和ers-manger有什么区别?
参数名称 参数说明 交付件类型 输入交付件的类型。 建议处理角色(可选) 设置建议处理交付件的人员角色,可选择的处理角色包括项目经理、开发人员和测试人员。 上传模板(可选) 单击“添加文件”可选择本地文档模板进行上传。 用户需对自己上传文件的安全风险负责,开发中心不对用户自己上传的文件做任何处理。
到了一些故障问题,暂时无法为您提供服务” 自接入的模型在模型调测的时候报错是什么原因? 开源模型怎么部署? 平台有没有预置模型? 思考模型和问答模型的区别 工作流中知识库节点、LLM节点都需要配置实例,实例的API Key填什么? 工作流中工具节点的实例如何配置? 如何获取Agent发布时所需的API
包含文本对话类、文本向量化类模型服务调用接口。 应用中心 包含Agent调用、用户配置(工作流、技能)调用、文件盒子等接口。 知识中心 包含知识库和知识数据集的创建、删除、执行及查询等接口。
在弹出的窗口中选择SLB监听,然后选择集群,单击。 已选集群区域展示选择的集群,单击“确定”。 在后端集群上下线页签下展示已选的集群及节点信息。 配置目标灰度状态、节点状态和权重。 单击“保存”。 任务创建完后,在部署服务变更管理中执行变更。 创建灰度切换任务 进入AppStage运维中心。 在顶部导航栏选择服务。