村上晴美研究室

Information Retrieval
知識情報システム特論「情報検索」

2019年度後期火曜5限「知識情報システム特論」の「情報検索」(村上担当分)ページです。
担当:村上 晴美
時限:後期火曜5限
場所:学術情報総合センター情報教育実習室2

おしらせ

授業計画

受講者の興味等に応じて変更になる可能性があります。

第 1回(10/ 1):コース概要,自己紹介,情報検索とは

  • 配布資料
    • コース概要
    • 村上研究室紹介
    • 情報検索 / Information Retrieval とは
  • 情報検索といえば
  • コース概要
    • 講義の内容と目標, 予定,成績評価方法(予定), 教科書・参考書, Contact
  • 自己紹介
  • 情報検索と学問分野, 今後の予定

第 2回(10/ 8):情報検索の基礎

第 3回(10/15):情報検索の基礎(続)

  • 配布資料
    • 情報検索の基礎(2):索引作成
    • 情報検索の基礎(3):重み付けとランキング
  • 情報検索の基礎
    • トークン化: 形態素解析とNグラム
    • 不要語処理と出現頻度
    •  
    • 研究室課題紹介
    • 索引作成(正規化、接辞処理)
    • 重み付けとtf, tf-idf, 正規化

第 4回(10/29):情報検索の基礎(続),情報検索とユーザ

  • 今日の話題
  • 配布資料
    • 情報検索とユーザ・インタラクション(検索質問の修正)
  • 情報検索の基礎
    • 検索モデル(ブーリアンモデル)
    • 検索モデル(ベクトル空間モデル)
    • 類似度計算(内積と余弦)
    • 余弦によるランキングと分類
    •  
    • 検索モデル(確率モデル)とBM25
    • ランキングの基本(tf, idf, 正規化)+Web(タグ, PageRank, アンカー)
    • 検索質問
  • 情報検索とユーザ・インタラクション(検索質問の修正)
    • 適合性フィードバック, 検索質問拡張
    • 用語の追加とシソーラス
    • 用語の関連度: Dice
  • 参考

第 5回(11/ 5):情報検索の評価

  • 配布資料
    • 情報検索の評価
  • 情報検索システムの評価
    • 評価とは、評価の観点、再現率と精度
    • 再現率と精度、F値、p@10、F値、再現率ー精度グラフ、再現率と精度の平均と要約
    • 平均精度AP/MAP
    • RR/MRR
    • DCG/nDCG
    • テストコレクション, TREC, NTCIR
    • 課題指向の評価、検索エンジンの評価
  • 参考

第 6回(11/12):情報検索の関連技術(続)

  • 今日の話題: Google Scholar Citations (information retrieval)
  • 配布資料
       
    • 情報検索の関連技術(1)
  • レポート
  • 情報検索の関連技術
    • 自動分類: ベクトル空間モデル(Roccio、kNN、SVM)、確率モデル(ナイーブ・ベイズ)、ルールベース、決定木

第 7回(11/19):情報検索の関連技術(続), まとめ

  • 配布資料
    • 情報検索の関連技術(2)
    • 情報検索の関連技術(3)
    • 情報検索「研究」の最近の動向
  • 情報検索の関連技術(ダイジェスト)
    • クラスタリング(階層型/非階層型、1パス法、k-means)
    • 情報抽出: MUC, パターンによる方法, 情報抽出の評価, 固有表現抽出
    • データマイニングとテキストマイニング
    • 情報フィルタリング(コンテンツフィルタリング/協調フィルタリング)
    • 情報推薦
  • 情報検索「研究」の最近の動向
    • 関連する学会と雑誌
    • 2019年の会議(ACM SIG-IR)から
  • レポート
  • 参考

主な参考書

参考文献

  • 前田, 西原:情報アクセス技術入門, 森北出版
  • 小町監修, 奥野他著: 自然言語処理の基本と技術, 翔泳社
  • 酒井:情報アクセス評価方法論, コロナ社
MENU
CLOSE