村上晴美研究室

Information Retrieval
知識情報システム特論「情報検索」

2020年度後期火曜5限「知識情報システム特論」の「情報検索」(村上担当分)ページです。
担当:村上 晴美

おしらせ

  • 遠隔授業のため,例年とはやや内容が異なります.予定は変更になる可能性があります.
  • WebClass等に障害があった場合ここにおしらせを出します.

授業計画

受講者の興味等に応じて変更になる可能性があります。

第 1回(10/ 6):コース概要,自己紹介,情報検索とは

  • 配布資料
    • コース概要
    • 村上研究室紹介
    • 情報検索とは(概要)
  • 情報検索といえば(初回アンケート)
  • コース概要
    • 講義の内容と目標, 予定,成績評価方法, Contact
  • 自己紹介兼研究室紹介
  • 情報検索の概要
  • 参考

第 2回(10/13):情報検索の基礎

  • 配布資料
    • 情報検索といえば
    • 情報検索 / Information Retrieval とは
    • 情報検索の基礎(1):語の抽出
    • 情報検索の基礎(2):索引作成
  • 情報検索といえば
  • よく使われている検索エンジン
  • 情報検索の概要
  • 情報検索と研究者
  • 国際会議と雑誌のランキング
  • 情報検索の基礎(語の抽出)
    • 索引付けの概要
    • 語の付与(人間 vs コンピュータ, 統制語 vs 自然語, 語 vs 文字等)
  • 情報検索の基礎(索引作成)  
    • トークン化: 形態素解析とNグラム
    • 不要語処理と出現頻度
    • 索引作成(正規化、接辞処理)
    •  
    • 研究室課題紹介
  • 形態素解析
  • 検索エンジンと索引語
  • 参考

第 3回(10/20):情報検索の基礎

  • 配布資料
    • 情報検索の基礎(3):重み付けとランキング
  • 情報検索の基礎
    • 重み付けとtf, tf-idf, 正規化
    • 検索モデル(ブーリアンモデル)
    • 検索モデル(ベクトル空間モデル)と余弦
    •  
    • 検索モデル(確率モデル)とOkapi BM25
    • ランキングの基本(tf, idf, 正規化)+Web(タグ, PageRank, アンカー)
    • 検索質問(クエリ)
  • 参考

第 4回(10/27):情報検索とユーザ, レポート課題

第 5回(11/10):情報検索の評価

  • 配布資料
    • 情報検索の評価
  • 情報検索システムの評価
    • 評価とは、評価の観点、再現率と精度
    • 再現率と精度、F値、p@10、F値、再現率ー精度グラフ、再現率と精度の平均と要約
    • 平均精度AP/MAP
    • RR/MRR
    • DCG/nDCG
    • テストコレクション, TREC, NTCIR
    • 課題指向の評価、検索エンジンの評価
  • 参考

第 6回(11/17):情報検索の関連技術

  • 配布資料
       
    • 情報検索の関連技術(1)
  • 情報検索の関連技術
    • 自動分類: ベクトル空間モデル(Roccio、kNN、SVM)、確率モデル(ナイーブ・ベイズ)、ルールベース、決定木
    • クラスタリング(階層型/非階層型、1パス法、k-means)

第 7回(11/24):情報検索の関連技術, まとめ

  • 配布資料
    • 情報検索の関連技術(2)
    • 情報検索の関連技術(3)
    • 情報検索「研究」の最近の動向
  • 情報検索の関連技術(ダイジェスト)
    • 情報抽出: MUC, パターンによる方法, 情報抽出の評価, 固有表現抽出
    • データマイニングとテキストマイニング
    • 情報フィルタリング(コンテンツフィルタリング/協調フィルタリング)
    • 情報推薦
  • 情報検索「研究」の最近の動向
    • 関連する学会と雑誌
    • 2020年の会議(ACM SIG-IR)から
  • レポート
  • 参考

主な参考書

参考文献

  • 前田, 西原:情報アクセス技術入門, 森北出版
  • 酒井:情報アクセス評価方法論, コロナ社
MENU
CLOSE