Apache Lucene是一個高性能(high-performance)的全能的全文檢索(full-featured text search engine)的搜索引擎框架庫,完全(entirely)使用Java開發。它是一種技術(technology),適合于(suitable for)幾乎(nearly)任何一種需要全文檢索(full-text search)的應用,特別是跨平臺(cross-platform)的應用。
- Annotated Lucene:第一節 Lucene是什么
- Annotated Lucene:第二節 索引文件概述
- Annotated Lucene:第三節 索引文件結構(1) - 每個Index包含的文件
- Annotated Lucene:第三節 索引文件結構(2) - 每個Segment包含的文件
- Annotated Lucene:第三節 索引文件結構(3) - Field數據(.fdx和.fdt)
- Annotated Lucene:第三節 索引文件結構(4) - Term字典(.tii和.tis)
- Annotated Lucene:第三節 索引文件結構(5) - Term頻率數據(.frq)
- Annotated Lucene:第三節 索引文件結構(6) - Positions位置信息數據(.prx)
- Annotated Lucene:第三節 索引文件結構(7) - Term向量文件
- Annotated Lucene:第三節 索引文件結構(8) - 刪除的文檔 (.del)
- Annotated Lucene:第四節 索引是如何創建的
- Annotated Lucene:第四節 索引創建過程(1)
- Annotated Lucene:第四節 索引創建過程(2)
- Annotated Lucene:第五節 索引是如何存儲的
- Annotated Lucene:第六節 文檔內容是如何分析的
- Annotated Lucene:第七節 如何給文檔評分
備注:未完待續,部分內容和插圖譯自Lucene網站及代碼,個別圖片來自網上
Annotated Hadoop 作者:naven 日期: