技术池(jishuchi.com) 本次搜索耗时 6.142 秒,为您找到 241 个相关结果.
  • 持久化变更

    持久化变更 flush API 持久化变更 没用fsync 同步文件系统缓存到磁盘,我们不能确保电源失效,甚至正常退出应用后,数据的安全。为了ES的可靠性,需要确保变更持久化到磁盘。 我们说过一次全提交同步段到磁盘,写提交点,这会列出所有的已知的段。在重启,或重新打开索引时,ES使用这次提交点决定哪些段属于当前的分片。 当我们通过每秒的刷新获得...
  • 元数据中的source字段

    元数据:_source 字段 元数据:_source 字段 默认情况下,Elasticsearch 用 JSON 字符串来表示文档主体保存在 _source 字段中。像其他保存的字段一样,_source 字段也会在写入硬盘前压缩。 这几乎始终是需要的功能,因为: 搜索结果中能得到完整的文档 —— 不需要额外去别的数据源中查询文档 如果缺...
  • 创建

    创建一个新文档 创建一个新文档 当索引一个文档,我们如何确定是完全创建了一个新的还是覆盖了一个已经存在的呢? 请记住_index 、_type 、_id 三者唯一确定一个文档。所以要想保证文档是新加入的,最简单的方式是使用POST 方法让Elasticsearch自动生成唯一_id : POST / website / blog / { ...
  • 容量规划

    容量规划 容量规划 如果一个分片太少而 1000 个又太多,那么我怎么知道我需要多少分片呢?一般情况下这是一个无法回答的问题。因为实在有太多相关的因素了:你使用的硬件、文档的大小和复杂度、文档的索引分析方式、运行的查询类型、执行的聚合以及你的数据模型等等。 幸运的是,在特定场景下这是一个容易回答的问题,尤其是你自己的场景: 基于你准备用于生产环...
  • 近实时搜索

    近实时搜索 refeash API 近实时搜索 因为per-segment search 机制,索引和搜索一个文档之间是有延迟的。新的文档会在几分钟内可以搜索,但是这依然不够快。 磁盘是瓶颈。提交一个新的段到磁盘需要fsync 操作,确保段被物理地写入磁盘,即时电源失效也不会丢失数据。但是fsync 是昂贵的,它不能在每个文档被索引的时就触发。 ...
  • 尝试聚合

    尝试聚合 [NOTE] [NOTE] 尝试聚合 我们可以用以下几页定义不同的聚合和它们的语法,但学习聚合的最佳途径就是用实例来说明。 一旦我们获得了聚合的思想,以及如何合理地嵌套使用它们,那么语法就变得不那么重要了。 [NOTE] 聚合的桶操作和度量的完整用法可以在 {ref}/search-aggregations.html[Elasti...
  • 存在

    检查文档是否存在 检查文档是否存在 如果你想做的只是检查文档是否存在——你对内容完全不感兴趣——使用HEAD 方法来代替GET 。HEAD 请求不会返回响应体,只有HTTP头: curl - i - XHEAD http : //localhost:9200/website/blog/123 Elasticsearch将会返回200 O...
  • 多字段搜索

    多字段搜索 多字段搜索 只有一个简单的match 子句的查询是很少的。我们经常需要在一个或者多个字段中查询相同的或者不同的查询字符串,意味着我们需要能够组合多个查询子句以及使他们的相关性得分有意义。 或许我们在寻找列夫·托尔斯泰写的一本叫《战争与和平》的书。或许我们在Elasticsearch的文档中查找minimum should match ,...
  • Mget

    检索多个文档 检索多个文档 像Elasticsearch一样,检索多个文档依旧非常快。合并多个请求可以避免每个请求单独的网络开销。如果你需要从Elasticsearch中检索多个文档,相对于一个一个的检索,更快的方式是在一个请求中使用multi-get 或者mget API。 mget API参数是一个docs 数组,数组的每个节点定义一个文档...
  • 查找准确值

    查找准确值 用于数字的 term 过滤器 用于文本的 term 过滤器 内部过滤操作 查找准确值 对于准确值,你需要使用过滤器。过滤器的重要性在于它们非常的快。它们不计算相关性(避过所有计分阶段)而且很容易被缓存。我们今后再来讨论过滤器的性能优势【过滤器缓存】,现在,请先记住尽可能多的使用过滤器。 用于数字的 term 过滤器 我们...