检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云搜索服务(Cloud Search Service,简称CSS)是一个基于Elasticsearch、OpenSearch且完全托管的在线分布式搜索服务,为用户提供结构化、非结构化文本、以及基于AI向量的多条件检索、统计、报表。云搜索服务是华为云ELK生态的一系列软件集合,为您全方位提供托管的ELK
主词词库文件对象,必须为UTF-8无BOM编码的文本文件,一行一个分词,文件大小最大支持100M。 7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。 stopObject 否 String 停词词库文件对象,必须为UTF-8无BOM编码的文本文件,一行一个分词,文件大小最大支持100M。
向量检索从本质上讲,其思维框架和传统的检索方法没有区别。为了提升向量检索的性能,通常需要解决以下两个问题: 减少候选向量集 和传统的文本检索类似,向量检索也需要某种索引结构来避免在全量的数据上做匹配,传统文本检索是通过倒排索引来过滤掉无关文档,而向量检索是通过对向量建立索引结构来绕过不相关的向量,减小需要考察的范围。
向量检索从本质上讲,其思维框架和传统的检索方法没有区别。为了提升向量检索的性能,通常需要解决以下两个问题: 减少候选向量集 和传统的文本检索类似,向量检索也需要某种索引结构来避免在全量的数据上做匹配,传统文本检索是通过倒排索引来过滤掉无关文档,而向量检索是通过对向量建立索引结构来绕过不相关的向量,减小需要考察的范围。
Elasticsearch集群词库介绍 背景信息 云搜索服务的词库用于对文本进行分词,使得一些特殊词语在分词的时候能够被识别出来,便于根据关键词搜索文本数据。例如,根据公司名称来查询,如“华为”;或者根据网络流行词来查询,如“喜大普奔”。也支持基于同义词词库,根据同义词搜索文本数据。 CSS服务使用的分词器包括IK
OpenSearch集群词库介绍 背景信息 云搜索服务的词库用于对文本进行分词,使得一些特殊词语在分词的时候能够被识别出来,便于根据关键词搜索文本数据。例如,根据公司名称来查询,如“华为”;或者根据网络流行词来查询,如“喜大普奔”。也支持基于同义词词库,根据同义词搜索文本数据。 CSS服务使用的分词器包括IK
集群,对文本内容“智能手机是很好用”进行关键词搜索,查看关键词查询效果;对文本内容“我今天获奖了我很开心”进行同义词搜索,查看同义词查询效果。 配置自定义词库,并查看分词效果。当预置词库即可满足分词需求时,可以跳过此步骤。 准备词库文件(UTF-8无BOM格式编码的文本文件),上传到对应OBS路径下。
集群,对文本内容“智能手机是很好用”进行关键词搜索,查看关键词查询效果;对文本内容“我今天获奖了我很开心”进行同义词搜索,查看同义词查询效果。 配置自定义词库,并查看分词效果。当预置词库即可满足分词需求时,可以跳过此步骤。 准备词库文件(UTF-8无BOM格式编码的文本文件),上传到对应OBS路径下。
性能。 Bulk聚合优化 文本索引加速 通过指定配置项“index.native_speed_up”可以开启文本索引加速。索引加速功能通过优化索引流程以及内存使用等方式实现,对于文本字段(text、keyword)能够极大提升索引构建的性能。当开启文本索引加速时,支持通过指定配置项“index
性能。 Bulk聚合优化 文本索引加速 通过指定配置项“index.native_speed_up”可以开启文本索引加速。索引加速功能通过优化索引流程以及内存使用等方式实现,对于文本字段(text、keyword)能够极大提升索引构建的性能。当开启文本索引加速时,支持通过指定配置项“index
Logstash开源服务器端实时数据处理管道,支持多个来源采取数据。适用场景多,比如日志数据、监控数据、metric数据等流数据。 JSON、CSV、文本等多种格式 使用自建Logstash导入数据到Elasticsearch 开源Elasticsearch API 使用开源Elasticsearch
DRS用于数据库在线迁移和实时同步数据的云服务。 关系型数据库 使用DRS从数据库导入数据至OpenSearch 使用DRS从数据库导入数据至OpenSearch 数据复制服务(Data Replication Service,简称DRS)是一种易用、稳定、高效、用于数据库在线迁移和数据
型数据库具备较好的事务性与原子性,但其TP与AP处理能力较弱,通过将CSS作为备数据库,可提升整个系统的TP与AP处理能力。 高性能:支持文本、时间、数字、空间等数据类型;亿级数据查询毫秒级响应。 高可扩展性:支持200+数据节点,支持1000+个数据字段。 业务“0”中断:规格
Service,简称CSS)。云搜索服务为您提供托管的分布式搜索引擎服务,完全兼容开源Elasticsearch搜索引擎,支持结构化、非结构化文本的多条件检索、统计、报表。 本文档提供了云搜索服务API的描述、语法、参数说明及样例等内容。云搜索服务提供了集群管理接口、词库管理接口和快
产品优势 云搜索服务主要有以下特点与显著优势: 高效易用 TB级数据毫秒级返回检索结果,提供可视化平台方便数据展示和分析。 弹性灵活 按需申请,在线扩容,零业务中断,快速应对业务增长。 无忧运维 全托管服务,开箱即用,主要操作一键可达,专业团队贴身看护。 内核增强 向量检索 云搜索服务
”特殊字符。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 在恢复时,可以根据文本框中定义的过滤条件去恢复符合条件的索引,过滤条件请使用正则表达式。默认值“index_(.+)”表示所有的索引。支持0~1024个字符,不
Search Service,简称CSS),为您提供托管的分布式搜索引擎服务,完全兼容开源Elasticsearch搜索引擎,支持结构化、非结构化文本的多条件检索、统计、报表。云搜索服务的使用流程和数据库类似。 图说云搜索服务 产品介绍 图说ECS 立即使用 成长地图 由浅入深,带您玩转CSS
”特殊字符。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 在恢复时,可以根据文本框中定义的过滤条件去恢复符合条件的索引,过滤条件请使用正则表达式。默认值“index_(.+)”表示所有的索引。支持0~1024个字符,不
”特殊字符。支持使用“*”匹配多个索引,比如index*,表示恢复快照中名称前缀是index的所有索引。 索引名称匹配模式 在恢复时,可以根据文本框中定义的过滤条件去恢复符合条件的索引,过滤条件请使用正则表达式。默认值“index_(.+)”表示所有的索引。支持0~1024个字符,不
当Logstash集群连接CSS服务的Elasticsearch集群时,可以跳过本文直接使用默认CA证书,当连接其他需要安全认证的数据源时,则需要参考文本配置自定义证书。 场景描述 当Logstash集群连接安全模式+HTTPS协议的Elasticsearch集群时,CSS预置的默认CA证书