检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
的obs桶中。 登录环境B的盘古大模型套件平台,在“模型迁移”页面,选择“导入模型”,输入模型对应的obs地址和模型名称后,单击“确定”,启动导入模型任务。 图4 导入模型
AgentListener的定义如下: public interface AgentListener { /** * Session启动时调用 * * @param agentSession AgentSession */ default
/v1/{project_id}/deployments/{deployment_id}/text/completions 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部
on_session_start(self, agent_session: AgentSession): """ Session启动时调用 :param agent_session: AgentSession """ def o
ents/{deployment_id}/text/completions),其中{project_id}需要替换成用户的项目ID。拼接起来如下所示。 https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/text/completions
/v1/{project_id}/deployments/{deployment_id}/chat/completions 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部
Administrator 统一身份认证服务(除切换角色外)所有权限。 图3 添加用户组权限 设置最小授权范围。 根据授权项策略,系统会自动推荐授权范围方案。例如,可以选择“所有资源”,即用户组内的IAM用户可以基于设置的授权项限使用账号中所有的企业项目、区域项目、全局服务资源。也可以选择“
清理数据:删除用户cache会话下缓存中的数据。例如,删除所有缓存数据,参考示例如下: # 清理 cache.clear() 参数解释:用于设置缓存对象的一些基本信息,如过期时间、session_tag等。 expire_after_access: int # 缓存失效策略-基于访问后到期时间(支持inMemeory缓存)
调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代
> 提示词工程”,进入提示词工程页面。 单击页面右上角“创建工程”,进入工程任务创建弹窗。输入工程名称、描述,选择行业、标签,工程任务下的所有提示词会同步继承该标签。 图1 创建提示词工程 单击“确定”完成工程创建。 父主题: 撰写提示词
盘古大模型服务,有以下两种调用方式: Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。经过认证的请求总是需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加
右侧代码示例会自动完成参数的组装。 图2 设置输入参数 填写输入参数时,deployment_id为模型部署ID,可以在盘古大模型套件平台“服务管理”功能中获取。 图3 服务管理 图4 获取deployment_id
这使得AI助手能够处理各种复杂的任务。 统一调用入口:AI助手通过一个统一的问答入口,即可解决多种问题,这使得用户可以在一个地方就能完成所有的任务。 有效分发业务问题:AI助手可以根据用户的需求和工具的定位,自动对问题进行分发,这使得AI助手可以更准确地理解用户的需求,并提供相关的服务。
盘古大模型的用户可被赋予不同的角色,对平台资源进行精细化的控制。 表2 盘古用户角色 角色 说明 系统管理员 购买平台的用户默认为系统管理员,具有所有操作的权限。 运营人员 具备总览、平台管理(资产管理、权限管理)功能的权限。 模型开发人员 具备总览、服务管理、能力调测、数据工程(数据管
/v1/{project_id}/deployments/{deployment_id}/caltokens 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型调用API地址。
华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访
洗的数据可以提升训练阶段的稳定性。 平台支持通过以下清洗能力: 表1 清洗算子说明 算子类型 功能 说明 数据转换 全角转半角 将文本中的所有全角字符转换成半角字符。 中文繁简体互转 简体转换成繁体或者繁体转换成简体。 去除不可见字符 移除文本中不可见字符,如U+0000-U+001F。
括输入和期望的输出。 LoRA 局部微调(LoRA)是一种优化技术,用于在深度学习模型的微调过程中,只对模型的一部分参数进行更新,而不是对所有参数进行更新。这种方法可以显著减少微调所需的计算资源和时间,同时保持或接近模型的最佳性能。 过拟合 过拟合是指为了得到一致假设而使假设变得
事项为重点。管理人员应建立责任所在意识,制定科学规范的使用办法,强化使用过程的监测和评估。必须严格按照项目运作方案来确定资金使用范围,确保所有使用资金都是经过规范操作和审批的,必须严格按照使用资金的监管属性,统一管理各类资金,精细、规范、稳健。在内部管理上,应加强信息通报、关联跨
建一个工具,或者从搜索框中选择已经创建好的工具。 知识库 通过知识库提升AI助手在特定领域问题的回答效果。 高级配置 工具召回策略 设置从所有可用工具中选择最相关的工具来处理用户的问题策略。 类型:使用词嵌入技术(embedding)来衡量用户问题与工具之间的相关性。 中断策略: