Apache Lucene の Index の仕組みを探る
この記事は、 株式会社スタンバイアドベントカレンダー の 22 日目の記事です。
昨日は、 @jsoizo さんの Scala + GraalVM AOTコンパイル + AWS Lambdaでwebアプリを動かしたい でした。
はじめに こんにちは、 @kz_morita です。
今年の 9 月に転職をして求人検索エンジンを開発している 株式会社スタンバイに入社しました。
検索エンジンを開発している会社に入社したので、OSS の検索エンジンである Lucene について理解を深めるため、Lucene を簡単に動かしてみて実際にどのように検索エンジンが動いているのか見ていきます。
Lucene について Lucene は、OSS の検索エンジンのライブラリです。 検索エンジンのサーバーである Solr や、Elasticsearch 内で使用されています。
https://lucene.apache.org/ 以降の本文中で、 https://github.com/apache/lucene からソースコードを一部引用しながら Lucene がどのように Index を行っているかを探っていきます。
まずは使ってみる Lucene 公式の Lucene in 5 minutes を Scala でやってみます。
https://www.lucenetutorial.com/lucene-in-5-minutes.html バージョンは 8.10.1 を使用していきます。
まずは、build.sbt から。
name := "LuceneSample" version := "0.