でかいチーズをベーグルする

でかいチーズはベーグルすべきです。

WSDM2012勉強会に参加しました

@y_benjoさん主催のWSDM2012勉強会に参加してきました。@y_benjoさんをはじめ、準備してくださった皆様、発表してくださった皆様、ありがとうございました。

WSDM2012勉強会 : ATND

こんな感じの勉強会に参加するのは初めてだったので、どんな感じかと思ったら、ついったー上の有名人(?)がいっぱいいるー!フォローしてます!サインください!キャー!って感じだった笑

個人的には、@nokunoさんが発表されたFinding Your Friends and Following Them to Where You Areは読まないとと思っていたので、読まなくて済んだ、ラッキー、じゃなくて勉強になった。ちらっとアブストを見たら、地理情報と友人情報を相互に使ってそれぞれを予測するよって感じに書いてあったから、両方を使ったモデルをひとつ提案して、インクリメンタル(?)に予測していくのかなーと思ってたけど、実際はそれぞれを予測するのは別のモデルでやっていたので残念。

会場では、この論文の実験はずるいですねー、こんなベストペーパーで大丈夫か?、ざわざわ、って感じだった。

発表された方とその資料(とメモ)

@nokunoさん

Finding Your Friends and Following Them to Where You Are #wsdm2012

  • 友達情報を使って地理情報を予測
    • テキスト類似度
    • コロケーション
      • 同じ場所に一緒にいた時間
    • 友人関係(グラフ)
      • 共通の友人の数(正規化)
    • 確率を予測する決定木 Regression Decision Tree
      • 上の3つの素性が最も情報利得が大きい
  • 地理情報を使って友達情報を予測
    • Dynamic Bayesian Network(DBN)
      • ツイートtとt+1の間で人は移動している
      • 使う素性
        • 友人のロケーション
        • ツイートの時刻
        • 平日か否か
      • ロケーション情報を全く出していないユーザに対しても教師なし学習できる
  • 実験
    • 友人関係の予測
      • グラフからエッジを取り除いて、システムで再構築できるか
        • 取り除くエッジの割合は50 - 100%
      • エッジをすべて取り除いた場合もある程度うまくいく
    • 地理情報の予測
      • 教師あり、二人の友人のみを用いた場合、77%の精度で予測
      • 教師なし、9人の友人を用いた場合、57%の精度を予測
      • 地図を離散化している
        • 人口密度の大きいところは細かく区切る
        • 離散化された同じ場所を予測したら正解
@tsubosakaさん

WSDM 2012 勉強会資料