『検索システム ― 実務者のための開発改善ガイドブック』を読んだ

2022年7月10日 engineering

こんにちは、 @kz_morita です。

今回は、タイトルの通り 『検索システム ― 実務者のための開発改善ガイドブック』 を読んだので感想とか書いていきます。

読もうとしたきっかけ

普段、検索エンジンにデータをインデックスするためのシステムの開発をしているが、検索エンジンそのものや検索についてもっと詳しくなりたいという気持ちがあるため、今回読んで見ようと思い購入しました。

目次

目次についてどんな章があったのか HP から引用します。

本書について
第1章 イントロダクション

第I部 検索エンジンの基礎
 第2章 検索エンジンのしくみ
 第3章 テキスト解析
 第4章 ポスティングリストの走査とランキングのアルゴリズム
 第5章 検索エンジンへのデータ登録
 第6章 検索インターフェースと検索クエリの処理

第II部 より高度な検索システムにむけて
 第7章 よい検索とは
 第8章 検索システムプロジェクトの始め方
 第9章 検索システムの評価と課題の発見
 第10章 クエリ提案とドメイン理解の支援
 第11章 検索を成功させるための支援
 第12章 検索結果のランキング

さらに先に進むために
参考文献
索引

大まかに、二部構成になっていて、基礎編と応用編のような形でした。 基礎編は検索エンジンにおける基礎的な転置インデックスについてや、indexer、ランキングについてなどについて紹介されてました。

第二部としては、検索システムをプロジェクトとしてどう始めるのかといったところから、良い検索のためのクエリ提案やクエリの解釈、拡張などについて書かれてました。

読んだ感想など

第一部は、検索エンジンの基本的な内容が詳しく書かれていたため検索システムの開発に普段から携わってない自分には非常にわかりやすくてよかったです。

『情報検索の基礎』を以前よんでたこともあって、ポスティングリスト周りの話は非常にわかりやすかったです。

第二部のより高度な検索システムにむけてに関しては、より本格的な良い検索のための実装や研究などが紹介されてました。

特に 第11章、第12章はいろいろな手法が紹介されていました。

第11章は、クエリをどのように理解するかやクエリの書き換えなどの手法について工夫が書かれていて、第12章は検索結果のランキングについて書かれていました。 特にこの2章に関しては、正直難しい内容で内容を理解できたとはいえないですが、さまざまな手法や研究が紹介されているのと参考文献もとても多く記載されていたのでこれから学んでいくにとても役立ちそうだと感じました。

この一冊を読んだだけでも、検索システムについて考えなければいけないことや研究されていることが大量にあり難しく面白い分野だなと思えたのがよかったです。 今後の学習の良いきっかけになったと思います。

この記事をシェア