技术池(jishuchi.com) 本次搜索耗时 3.200 秒,为您找到 241 个相关结果.
  • Hunspell 词干提取器

    Hunspell 词干提取器 安装一个词典 按语言设置 创建一个 Hunspell 语汇单元过滤器 [TIP] Hunspell 词典格式 Hunspell 词干提取器 Elasticsearch 提供了基于词典提取词干的 {ref}/analysis-hunspell-tokenfilter.html[hunspell 语汇单元过滤器(...
  • 相关度评分背后的理论

    相关度评分背后的理论 [NOTE] 布尔模型 词频/逆向文档频率(TF/IDF) 词频 逆向文档频率 字段长度归一值 结合使用 [TIP] 向量空间模型 [TIP] [TIP] 相关度评分背后的理论 Lucene(或 Elasticsearch)使用 布尔模型(Boolean model) 查找匹配文档,并用一个名为 实用评分...
  • 预加载 fielddata

    预加载 fielddata 预加载 fielddata(Eagerly Loading Fielddata) [WARNING] 全局序号(Global Ordinals) 构建全局序号(Building global ordinals) 预构建全局序号(Eager global ordinals) [NOTE] 因此,我们只能为字符串字段预构建...
  • 可插拔的相似度算法

    可插拔的相似度算法 Okapi BM25 词频饱和度 字段长度归一化(Field-length normalization) BM25 调优 可插拔的相似度算法 在进一步讨论相关度和评分之前,我们会以一个更高级的话题结束本章节的内容:可插拔的相似度算法(Pluggable Similarity Algorithms)。 Elasticsear...
  • 局部更新

    文档局部更新 使用脚本局部更新 使用Groovy脚本 更新可能不存在的文档 更新和冲突 文档局部更新 在《更新文档》一章,我们说了一种通过检索,修改,然后重建整文档的索引方法来更新文档。这是对的。然而,使用update API,我们可以使用一个请求来实现局部更新,例如增加数量的操作。 我们也说过文档是不可变的——它们不能被更改,只能被替换...
  • 关联失效

    关联失效 关联失效 在我们去讨论多字段检索中的更复杂的查询前,让我们顺便先解释一下为什么我们只用一个主分片来创建索引。 有时有的新手会开一个问题说通过相关性排序没有效果,并且提供了一小段复制的结果:该用户创建了一些文档,执行了一个简单的查询,结果发现相关性较低的结果排在了相关性较高的结果的前面。 为了理解为什么会出现这样的结果,我们假设用两个分片...
  • 1.2 安装

    安装 安装 Elasticsearch 需要 JDK 版本最低1.7,特别是撰写本文时,建议你使用 Oracle JDK 版本1.8.0_72,这里我们不关注不同Java版本的细节。Oracle 推荐安装文档在此: Oracle’s website 。总之在你安装 ES 之前,使用以下命令检查你的Java环境: java -version ...
  • 5.3 Get API

    Get API 实时性 可选的类型 source过滤 字段 生成字段 直接获取 _source 路由 偏好 刷新 分布式 版本支持 Get API get api 支持通过 ID 返回一个 JSON 格式的文档。下面的例子是从 twitter 索引下的 tweet type 中获取 ID 为1的文档: curl - XGET...
  • 按时间统计

    按时间统计 返回空 Buckets 扩展例子 潜力无穷 按时间统计 如果搜索是在 Elasticsearch 中使用频率最高的,那么构建按时间统计的 date_histogram 紧随其后。为什么你会想用 date_histogram 呢? 假设你的数据带时间戳。无论是什么数据(Apache事件日志、股票买卖交易时间、棒球运动时间)只要带有时...
  • 深入理解 Doc Values

    深入理解 Doc Values [NOTE] 列式存储的压缩 [NOTE] 禁用 Doc Values 深入理解 Doc Values 在上一节一开头我们就说 Doc Values 是 “快速、高效并且内存友好” 。这个口号听不起来不错,不过话说回来 Doc Values 到底是如何工作的呢? Doc Values 是在索引时与 倒排...