首页
分类
命令
采集
标签
搜索
Blog
注册
登录
首页
分类
命令
采集
搜索
Blog
注册
登录
搜索
技术池(jishuchi.com)
本次搜索耗时
3.200
秒,为您找到
241
个相关结果.
搜书籍
搜文档
Hunspell 词干提取器
5052
2020-06-30
《Elasticsearch 权威指南中文版》
Hunspell 词干提取器 安装一个词典 按语言设置 创建一个 Hunspell 语汇单元过滤器 [TIP] Hunspell 词典格式 Hunspell 词干提取器 Elasticsearch 提供了基于词典提取词干的 {ref}/analysis-hunspell-tokenfilter.html[hunspell 语汇单元过滤器(...
相关度评分背后的理论
5039
2020-06-30
《Elasticsearch 权威指南中文版》
相关度评分背后的理论 [NOTE] 布尔模型 词频/逆向文档频率(TF/IDF) 词频 逆向文档频率 字段长度归一值 结合使用 [TIP] 向量空间模型 [TIP] [TIP] 相关度评分背后的理论 Lucene(或 Elasticsearch)使用 布尔模型(Boolean model) 查找匹配文档,并用一个名为 实用评分...
预加载 fielddata
4951
2020-06-30
《Elasticsearch 权威指南中文版》
预加载 fielddata 预加载 fielddata(Eagerly Loading Fielddata) [WARNING] 全局序号(Global Ordinals) 构建全局序号(Building global ordinals) 预构建全局序号(Eager global ordinals) [NOTE] 因此,我们只能为字符串字段预构建...
可插拔的相似度算法
4779
2020-06-30
《Elasticsearch 权威指南中文版》
可插拔的相似度算法 Okapi BM25 词频饱和度 字段长度归一化(Field-length normalization) BM25 调优 可插拔的相似度算法 在进一步讨论相关度和评分之前,我们会以一个更高级的话题结束本章节的内容:可插拔的相似度算法(Pluggable Similarity Algorithms)。 Elasticsear...
局部更新
4771
2020-06-30
《Elasticsearch 权威指南中文版》
文档局部更新 使用脚本局部更新 使用Groovy脚本 更新可能不存在的文档 更新和冲突 文档局部更新 在《更新文档》一章,我们说了一种通过检索,修改,然后重建整文档的索引方法来更新文档。这是对的。然而,使用update API,我们可以使用一个请求来实现局部更新,例如增加数量的操作。 我们也说过文档是不可变的——它们不能被更改,只能被替换...
关联失效
4708
2020-06-30
《Elasticsearch 权威指南中文版》
关联失效 关联失效 在我们去讨论多字段检索中的更复杂的查询前,让我们顺便先解释一下为什么我们只用一个主分片来创建索引。 有时有的新手会开一个问题说通过相关性排序没有效果,并且提供了一小段复制的结果:该用户创建了一些文档,执行了一个简单的查询,结果发现相关性较低的结果排在了相关性较高的结果的前面。 为了理解为什么会出现这样的结果,我们假设用两个分片...
1.2 安装
4670
2020-06-30
《Elasticsearch 参考手册》
安装 安装 Elasticsearch 需要 JDK 版本最低1.7,特别是撰写本文时,建议你使用 Oracle JDK 版本1.8.0_72,这里我们不关注不同Java版本的细节。Oracle 推荐安装文档在此: Oracle’s website 。总之在你安装 ES 之前,使用以下命令检查你的Java环境: java -version ...
5.3 Get API
4666
2020-06-30
《Elasticsearch 参考手册》
Get API 实时性 可选的类型 source过滤 字段 生成字段 直接获取 _source 路由 偏好 刷新 分布式 版本支持 Get API get api 支持通过 ID 返回一个 JSON 格式的文档。下面的例子是从 twitter 索引下的 tweet type 中获取 ID 为1的文档: curl - XGET...
按时间统计
4591
2020-06-30
《Elasticsearch 权威指南中文版》
按时间统计 返回空 Buckets 扩展例子 潜力无穷 按时间统计 如果搜索是在 Elasticsearch 中使用频率最高的,那么构建按时间统计的 date_histogram 紧随其后。为什么你会想用 date_histogram 呢? 假设你的数据带时间戳。无论是什么数据(Apache事件日志、股票买卖交易时间、棒球运动时间)只要带有时...
深入理解 Doc Values
4555
2020-06-30
《Elasticsearch 权威指南中文版》
深入理解 Doc Values [NOTE] 列式存储的压缩 [NOTE] 禁用 Doc Values 深入理解 Doc Values 在上一节一开头我们就说 Doc Values 是 “快速、高效并且内存友好” 。这个口号听不起来不错,不过话说回来 Doc Values 到底是如何工作的呢? Doc Values 是在索引时与 倒排...
1..
«
3
4
5
6
»
..25