えいのうにっき

むかしのじぶんのために書いています

2011/07/11 日誌

今日のWeb

WEB+DB PRESS(vol.63)読んでる

  • 実録・pixivが明かす 段階的サービス拡張
    • 第5章・大量データの解析によるレコメンデーション データが蓄積されて初めてできること(久保達彦 氏)
      • システムに蓄積されていくデータ
        • “蓄積されていくデータを単に保存するだけで、サービスの利便性向上のために有効活用しないのはもったいない”
      • 協調フィルタリングによるレコメンデーション
        • “各ユーザの嗜好情報を用いてユーザ間で類似度の高い嗜好情報を抽出する手法”
        • イラストレコメンデーションシステムはちょっと複雑
          • “ユーザがイラストをブックマークする際にイラストに付加されたタグのハッシュ値とユーザIDの組み合わせを「タグユーザー」と定義し、類似度の計算対象を、対象イラストをブックマークしている「タグユーザー」のブックマーク済みイラストに限定しています。”
      • レコメンダーの構成
        • “レコメンダーは当初Javaで開発されていましたが、できあがったプログラムのメモリ使用量が16GBとかなり大きくなりました。”→ C++

協調フィルタリング」。CDiT for Webでも「ユーザーの類似度」つって計算&表示をしてるところがあるけど、本当に適当な作りにしちゃってるからなぁ。この記事から、ちょっとヒントをもらえた気がする。