Introduction to Information Retrieval #8 の復習資料

Introduction to Information Retrieval 輪読会 8章の復習資料を以下にアップロードしました。

8章は、検索結果の適合性を定量的に評価する指標の解説が主です。適合性判断のための最も基本的な指標である Precision と Recall、その二値のトレードオフを加重調和平均値で表現する F measure がまず最初に紹介されています。ランク付けされた検索結果に関してはこれらの指標をもう少し拡張する必要があります。そのために Precision - Recall 曲線を分析する方法や、検索結果指標を一つの統計量で表現する MAP (Mean Average Precision) などが紹介されています。また、Web 検索のような先頭数十件の検索結果が重要な場合に、その善し悪しを判断する指標として R-Presicion があります。その他 ROC 曲線、NDCG などの解説もありました。

次章の内容は、適合性判断のフィードバックについて。ユーザーから明示的/暗黙的にフィードバックを受けて検索結果を改善したり、クエリを拡張したりする手法の導入部でした。次回の輪読会は 7/21 予定ですので、その後いつも通り復習資料をアップします。

過去の章の復習資料 ppt は同 URL のディレクトリ (http://bloghackers.net/~naoya/iir/ppt/) から一覧可能です。