检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用于模型训练的数据安全性与合规性。 所有用于训练的数据均为开源合规的数据。 所有用于训练的数据均过滤密码、IP地址、手机号、email等个人隐私信息。 对所有用于训练的数据集进行版本管理,支持数据溯源;数据集存储安全,且对数据访问进行身份及权限控制,数据访问基于https加密传输,数据访问可防篡改、防泄漏。
RAG知识库资产管理 约束与限制 上传文档限制 本地文件:支持TXT、DOCX格式文件,单个文件最大支持20MB。 代码文件:仅支持JAVA、PYTHON、C、C++文件的ZIP格式,单个文件最大支持20MB,单个资产配额50MB。 入库配置限制 中文文本嵌入模型m3e-base
RAG知识库文件管理 新建知识库资产文件 创建完成知识库资产后,单击资产名称进入知识库资产文件管理页面。可以看到在新建知识库资产时已默认上传的文件。 更新知识库资产文件 创建完成知识库资产后,单击左上角“导入文件”按钮可进行知识库资产文件的增量上传。 删除知识库资产文件 单击资产文件的按钮可以对已上传的文件进行删除。
RAG知识库是将租户上传的数据进行切片、模型向量化处理、索引过滤然后入库形成的知识集合。在CodeArts 盘古助手插件进行“代码续写”和“研发知识问答”场景下,可以增强其准确性。 图1 RAG知识库整体架构 知识库:知识的集合,按照实际使用维度进行划分,通常基于知识库进行检索召回。接口和数据库都采用UTF-8字符集编码。