2006/06/27(火)S@M2 + {N,M}@B4

発表の内容を勝手に解釈して,一部拡張?して,感想を追加.

ウェブログマイニング? S@M2

ユーザ個別化の手段とか.ログの収集・分析について.

ユーザ個別化とログの収集

ログを分けて,ユーザ毎のログに分ける.クッキー,セッション管理によるユーザを分ける.ユーザの状態により,表示する商品を変える.

ログの分析

ログをツリー上に再構築した場合,ウェブの構造,見やすさによりその形状が変化する.使いやすければ,直線上に,使いにくければ横に広がるはず.

個人的には使いやすさよりも,サイトのタイプに分かれる気がする.ショッピングサイトの場合は,複数の商品を比較するので,直線ではなく,横に広がる可能性が高い.

また,ログは必ずしも木構造になるわけではないので注意.

セマンティックウェブ N@B4

セマンティックウェブとUserエージェントについて.

セマンティックウェブとUserエージェントを話す前に,ウェブ,エージェントの話をしていない.いきなり後のセマンティックとかオントロジーとかUserエージェントとか話しても関連性が見えない.

セマンティックウェブ

エージェント,エージェントとセマンティックウェブの関連性ウェブとセマンティックウェブの違い.その辺まとめないと理解するのは難しい.

個人的にオントロジーの語源等はどうでもいいと思いたい.

Userエージェント

何をするのか不明.どちらかと言うと,UserInterfaceの役割な気がする.おそらく,ユーザの代わりに,バックグラウンドで複雑な作業をさせるのだとは思うが,まだまとまっていないので,今後に期待?

あと,ウェブ推論との区別がつかなくなりそうなので注意.

クリックストリーム M@B4

ウェブサーバのアクセスログとクライアント側のクリックのログについて.

ウェブサーバ側のアクセスログ

ローカルにアクセスされるすべてのログを確実に撮ることができる.しかし,ブラウザ上における戻るボタンや,他のサーバに対するログを取ることが出来ない.

クライアントのクリックのログ

サイトを超えて,すべてのブラウザに対してのアクションを収集することができる.また,ウェブサーバ側で収集できるすべてのログを含んでいる.しかし,クライアント側に専用ソフトをインストールする必要があり実現が難しい.

うちの先生的には,クリックストリームによるデータ収集より,新たな分析ツールの開発を期待している模様.ターゲットはソーシャルネットワークらしいが,おそらくソーシャルネットワークを知らないので,単にクリックストリームを用いたサイトの構造化で済みそうな感じだ.しかし,リンクを利用したサイトの構造化等はある*1ので,どこで差異をつけるのか疑問.

というより,単なるデータマイニング分析ツールを抜け,グラフマイニング等の新たな分析手法を欲しがっている感じ.

*1 : 簡単なところだと,key graphあたりを調べるといいかもしれない