Introduction to Information Retrieval #1 の復習資料

Introduction to Information Retrieval輪講 に参加しています。自分はこの輪講で復習係を担当させてもらっています。毎回輪講の頭に、前回分の内容をサマリしてプレゼンテーションする係です。

これから輪講の度、作成した資料を公開していきたいと思います。第一回目の資料を以下に置いておきます。

第一回目は、書籍の第一章 "Boolean Retrieval" の復習です。大規模データを検索する検索システムにおいて、転置インデックスはどのように作成されるか、またブーリアン検索 (「渋谷 and ラーメン」という検索クエリの類) はどう処理されるかといったことの導入部です。

先週末の第二回目は、転置インデックス作成時の前処理部分(トークナイズ、正規化、equivalence classing など) の話が主でした。次回は 2/16 日ですので、その日以降に第二回目分の資料を公開しようと思います。