技术池(jishuchi.com) 本次搜索耗时 6.746 秒,为您找到 241 个相关结果.
  • 文件描述符和 MMap

    文件描述符和 MMap 文件描述符和 MMap Lucene 使用了 大量的 文件。同时,Elasticsearch 在节点和 HTTP 客户端之间进行通信也使用了大量的套接字(注:sockets)。所有这一切都需要足够的文件描述符。 可悲的是,许多现代的 Linux 发行版本,每个进程默认允许一个微不足道的 1024 文件描述符。这对一个小的 E...
  • 连接池

    连接池 staticNoPingConnectionPool (默认) staticConnectionPool simpleConnectionPool sniffingConnectionPool 自定义连接池 选择什么连接池?PHP 与连接池之间的关系 连接池 连接池是客户端内置的一个对象,主要维持当前的节点列表。从理论上来说,节点...
  • 词干提取算法

    词干提取算法 [TIP] 使用基于算法的词干提取器 词干提取算法 Elasticsearch 中的大部分 stemmers (词干提取器)是基于算法的,它们提供了一系列规则用于将一个词提取为它的词根形式,例如剥离复数词末尾的 s 或 es 。提取单词词干时并不需要知道该词的任何信息。 这些基于算法的 stemmers 优点是:可以作为插件使...
  • 合并段

    合并段 optimize API 合并段 通过每秒自动刷新创建新的段,用不了多久段的数量就爆炸了。有太多的段是一个问题。每个段消费文件句柄,内存,cpu资源。更重要的是,每次搜索请求都需要依次检查每个段。段越多,查询越慢。 ES通过后台合并段解决这个问题。小段被合并成大段,再合并成更大的段。 这是旧的文档从文件系统删除的时候。旧的段不会再复制到...
  • 批量

    更新时的批量操作 不要重复 多大才算太大? 更新时的批量操作 就像mget 允许我们一次性检索多个文档一样,bulk API允许我们使用单一请求来实现多个文档的create 、index 、update 或delete 。这对索引类似于日志活动这样的数据流非常有用,它们可以以成百上千的数据为一个批次按序进行索引。 bulk 请求体如下,它有一...
  • 使文本可以被搜索

    使文本可以被搜索 不可变性 使文本可以被搜索 第一个不得不解决的挑战是如何让文本变得可搜索。在传统的数据库中,一个字段存一个值,但是这对于全文搜索是不足的。想要让文本中的每个单词都可以被搜索,这意味这数据库需要存多个值。 支持一个字段多个值的最佳数据结构是倒排索引 。倒排索引包含了出现在所有文档中唯一的值或词的有序列表,以及每个词所属的文档列表。...
  • 总结

    总结 总结 本小节涵盖了许多基本理论以及很多深入的技术问题。聚合给 Elasticsearch 带来了难以言喻的强大能力和灵活性。桶与度量的嵌套能力,基数与百分位数的快速估算能力,定位信息中统计异常的能力, 所有的这些都在近乎实时的情况下操作的,而且全文搜索是并行的,它们改变了很多企业的游戏规则。 聚合是这样一种功能特性:一旦我们开始使用它,我们就...
  • 匹配查询

    匹配查询 索引一些数据 单词查询 匹配查询 不管你搜索什么内容,match 查询是你首先需要接触的查询。它是一个高级查询,意味着match 查询知道如何更好的处理全文检索和准确值检索。 这也就是说,match 查询的一个主要用途是进行全文搜索。让我们通过一个小例子来看一下全文搜索是如何工作的。 索引一些数据 首先,我们使用bulk AP...
  • 字段数据

    数据字段 数据字段 本章的目的在于介绍关于ElasticSearch内部的一些运行情况。在这里我们先不介绍新的知识点, 数据字段是我们要经常查阅的内容之一,但我们使用的时候不必太在意。 当你对一个字段进行排序时,ElasticSearch 需要进入每个匹配到的文档得到相关的值。 倒排索引在用于搜索时是非常卓越的,但却不是理想的排序结构。 当搜索...
  • 解决并发问题

    解决并发问题 全局锁 文档锁 树锁 Note: 解决并发问题 当我们允许多个人 同时 重命名文件或目录时,问题就来了。设想一下,你正在对一个包含了成百上千文件的目录 /clinton 进行重命名操作。同时,另一个用户对这个目录下的单个文件 /clinton/projects/elasticsearch/README.txt 进行重命名操作...