检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、
等多种能力。 在准备自监督训练数据和有监督微调数据时,除行业数据外,建议混入一定比例的通用数据,防止模型在经过训练后出现通用问答能力下降的情况。 行业数据 : 通用数据的比例按业内经验有1 : 1、1 : 5。实际训练过程中,行业数据和通用数据和的配比需要根据具体情况进行权衡,需
登录“我的凭证 > 访问密钥”页面,依据界面操作指引获取Access Key(AK)和Secret Access Key(SK)。下载的访问密钥为credentials.csv文件,包含AK/SK信息。 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。
使用API调用模型 提示词工程 - 利用精心设计的提示词优化和引导大模型生成更加准确和相关的输出,提高模型在特定任务中的表现。 提示词工程 AI助手 - 通过大模型搭建Agent应用,并结合多种工具,实现对话问答、规划推理和逻辑判断功能。 AI助手 应用开发SDK - 通过应用开发
Agent(智能代理),用于对复杂任务的自动拆解与外部工具调用执行,一般包括任务规划、记忆系统和执行系统。 任务规划:将复杂目标任务分解为小的可执行子任务,通过评估、自我反思等方式提升规划成功率。 记忆系统:通过构建记忆模块去管理历史任务和策略,并让Agent结合记忆模块中相关的信息以获取最优化任务解决策略。
选择需要进行压缩的模型执行模型压缩,压缩策略为“INT8”。当压缩模型为N2基础功能模型,或是经有监督微调训练和RLHF训练后的N2模型,支持选择“低消耗模式”,减少推理资源的消耗。 图2 创建压缩任务 输入任务名称和描述,单击“立即创建”,即可下发压缩模型任务。模型压缩任务完成后,可以使用压缩后的模型进行部署操作。
的模型和模型导出的obs路径。 图3 导出模型 单击“确定”,导出模型。 模型导出成功后,可以在obs中查看导出后的模型文件。下载该obs文件,上传到环境B对应的obs桶中。 登录环境B的盘古大模型套件平台,在“模型迁移”页面,选择“导入模型”,输入模型对应的obs地址和模型名称后,单击“确定”,启动导入模型任务。
创建知识库 选择知识库类型后,单击“创建”进入知识库设置页面,创建知识库。 当选择“自定义知识库”时,需要设置名称、英文名称、描述信息。注意英文名称和描述将影响模型检索效果,不可随意填写,需按照知识库中文档的实际内容或知识库目进行填写。设置完成后单击“立即创建”进入知识库详情页,上传文档。
在服务“总览”页面,单击“立即体验”,平台将跳转至盘古大模型体验申请页面。 图1 立即体验 您可以选择希望体验的盘古大模型,单击“申请体验”,填写手机、邮箱和邀请码,单击“下一步”,提交体验盘古大模型的申请。 图2 申请体验-1 图3 申请体验-2 父主题: 体验盘古大模型功能
在服务“总览”页面,单击“立即体验”,平台将跳转至盘古大模型体验申请页面。 图1 立即体验 您可以选择希望体验的盘古大模型,单击“申请体验”,填写手机、邮箱和邀请码,单击“下一步”,提交体验盘古大模型的申请。 图2 申请体验-1 图3 申请体验-2 父主题: 体验盘古大模型功能
如果节点有npu设备需选择“AI加速卡 > Ascend”,并选择加速卡类型。 如果节点没有加速卡,则选择“AI加速卡 > 不使用”。 单击“立即下载”,下载设备证书和Agent固件,并将设备证书与Agent固件分别重命名为license.tgz、hilens-agent.tgz。 父主题: 部署为边缘服务
输入输出长度。修改部署时扩缩容和外推场景互斥,每次只能修改一个。 当前仅盘古-NLP-N4系列模型以及基于它们训练的模型支持外推。 图1 模型部署外推升级 扩缩容部署实例数量 扩缩容是指运行中的模型支持增加或减少模型部署的实例数。 修改部署时扩缩容和外推场景互斥,每次只能修改一个。
bbs.huaweicloud.com/videos/102987 。 请求示例如下图所示,一个请求主要有请求URI、请求方法、请求消息头和请求消息体组成,各个部分将在下文详细解释。 图1 请求示例图 请求URI 请求URI由如下部分组成。 {URI-scheme} :// {Endpoint}
值信息,可以通过“导入”功能进行上传。 图1 预览提示词效果 单击“查看效果”按钮,输出模型回复结果,用户可以根据预览效果调整提示词的文本和变量。 父主题: 撰写提示词
系统: 任务规划:将复杂目标任务分解为小的可执行子任务,通过评估、自我反思等方式提升规划成功率。 记忆系统:通过构建记忆模块去管理历史任务和策略,并让Agent结合记忆模块中相关的信息以获取最优化任务解决策略。 任务执行:能通过工具与外界发生联系并产生影响,工具可以自定义,包括查
用户: 定个金桥203会议室的会议 助手: 好的,请问会议具体是什么时候开始和结束?请按照"yyyy-MM-dd HH:mm"的格式告诉我。 - 步骤1 答复:好的,请问会议具体是什么时候开始和结束?请按照"yyyy-MM-dd HH:mm"的格式告诉我。 用户: 下午2点到4点
api.doc.splitter.config.SplitConfig; // 初始化 pangudoc split(直接指定filePath和mode) String filePath = "D:/test.doc"; DocSplit docPanguSplit = DocSplits
"请在有用户ID、用户单据、用户最大报销比例的情况下查询用户最大报销额度时调用此工具。需要先分别调用query_receipt工具查询用户单据和query_reimbursement_ratio工具查询最大报销比例。", inputDesc = "用户ID、用户单据、用户报销最大比例"
将签名信息添加到消息头,从而通过身份认证。 AK(Access Key ID):访问密钥ID。与私有访问密钥关联的唯一标识符;访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访问密钥ID结合使用的密钥,对请求进行加密签名,可标识发送方,并防止请求被修改。
#JSONL {"text":"《活着》,是中国著名作家余华所写的一部长篇小说。《活着》讲述了一个普通农民徐福贵的人生历程。他的人生充满了苦难和挫折,但他在面对这些困难时,始终保持着坚强和乐观的态度。"} 否 有监督微调数据 单轮:CSV、JSONL 多轮:JSONL 编码格式为UTF-8。