2007/02/13(火){M, E, K}@B4

今更研究の内容について言うことは無い.というか,辛口の評価しかできないので,あまり記事にはしたくないが,コメントを求めている人もいるようなので,簡単に内容をまとめて最低限これくらいはやって欲しいことくらい書いておくことにする.

Firefoxの拡張機能を用いたクリックストリーム収集に関する研究 M@B4

発表時間:14:53-15:04(11分)

検討が足りない.忙しいのかもしれないが,もう少し考えてからプログラムを作って欲しい.本来であれば,目的に合わせて仕様を決め,それに合わせてプログラミングするもの.プログラムの進捗に合わせて仕様を決め,改変するものではない.

背景・目的

ポータルサイトのユーザビリティの向上のために,

  • "Webサイトの運営,構築の効率化",
  • "ユーザの行動の把握",
  • "検索エンジンの正確性の上昇"

が必要.これは,Webログマイニングで解決できる.

今回の研究は,Webログマイニングのためのクリックストリームデータの取得を目標とする.

Webログマイニングとかクリックストリームデータ

以前の記事参照

仕様

クライアントサイドは,FirefoxがターゲットなのでJavascriptがメイン.サーバサイドは,慣れているperlにする.

クライアントは起動時?にサーバへIDを要求し,今後IDを使ってURLやアクションを送る.送るアクションは(ROOT, LINK, RETURN, FORWARD, CLOSE, ALLCLOSE,?)など.サーバは送られてきたデータを元に,クリックストリームを構築し,ログに保存する.

今後の課題

  • クリックストリームデータをデータベースへ格納する
  • 取得したデータで実際にマイニングを行う

コメント

Z
  • おわりにがない\研究発表なのだから,最後に"おわりに"としてまとめを付けること.
  • click stream dataの有用性\今回取得したclick stream dataの内容について議論すべき.今までのデータとは異なること,メリットをきちんと述べること.
  • スライドの作り込みが甘い\たとえば,"研究の背景"ページにおいて,最後を2行にするなど.
S
  • 検索エンジンの正確性の向上\を目的としてWebログマイニングを使う.とのことだが,他のウェブマイニングを使って正確性を向上させていることのほうが多い.
  • 実際の研究の目的は?\click streamをWebログマイニングに利用すること?\マイニングすることが目的?\click streamを使う必要性が見えない
  • Tab Browserのメリットが見えない\Tab Browserの特徴は?
O
  • Click Stream取得の3番目,proxyによる取得も考えて欲しい.\それぞれ収集できる範囲,分析の目的が異なる.
  • サーバへ送るデータを十分に検討していない.
    • 送信するデータは何?
    • クリック以外のイベントは完全に送らない?
    • HTMLだけ?
    • インラインフレーム等には対応する?\画像やPDFを求めている場合など,きちんと検討するべき.
  • クリックストリームデータのフォーマット\そもそも,今回取得したデータは完全なクリックストリームと言えるのか.

個人的に最低限行って欲しいこと

クリックストリームデータの取得を目標とするのなら,

  • 収集するブラウザのアクションを十分に検討して欲しい.
    • なんのためのクリックストリームなのか
    • タブブラウザの特徴をつかんでいるか
    • 取得したログを元に,ユーザのブラウジングを完全に再現できるのか

を検討した上で,

  • 収集したクリックストリームデータの正当性と有用性
    • ログからユーザのブラウジングを再現できる(正当性)
    • 単なるサーバのアクセスログ,proxyで取得したログでは足りない(有用性)

を示して欲しい

ターゲットマーケティングのためのデータマイニング E@B4

発表時間:15:14-15:24

全体的に理解が足りていない.アルゴリズムを知ることも重要だが,何をしているのか本質をつかまないことには,それぞれの特徴を比較することができない.

背景・目的

ターゲットマーケティングが経営戦略上有効である.これは,顧客をセグメント化するもの.データマイニングは,セグメント化のためのルール発見手法がある.

データマイニング手法

分類,クラスタリング,パターンの3種類.それぞれ,Wekaに組み込まれているC4.5,k-means,aprioriを利用する.

コメント

Z
  • 研究の目的は?\公開されたツールを使っただけでは研究にならない.
  • 多面的分析とからめて行う\異なるデータを分析するのでは(比較できないので)意味がない.幸いにも,1つのデータセットに対し,異なる分析手法を行っている.それぞれのメリットを議論すること.
  • 各手法(少なくとも今回利用する3種類)を完全に理解すること
  • 研究のポイントをまとめること\他の人が作ったソフトを使って結果を見せるだけではダメ.結果をきちんと解釈し,分析すること.
O
  • いろいろと勘違いしているふしがある

きちんと理解して欲しい

S
  • 具体例をまとめて欲しい

例えば,どのようなことを知りたいときにどの手法を用いるべきか述べて欲しい.

個人的に最低限行って欲しいこと

研究の対象について理解しないことには始まらない.

  • ターゲットマーケティング
    • 種類
    • 目的
  • データマイニング
    • 分類
    • 利用する手法

をきちんと理解して欲しい.これを理解しないことには,データマイニング手法とターゲットマーケティングの目的を関連づけることができない.

その上で,

  • データを分析し
  • 特徴をまとめて

欲しい.

脳データ分析のためのデータベース構築に関する研究 K@B4

発表時間:15:59-16:04

研究分野への理解が足りない.脳データ分析,データベースを知らないまま研究を行っている.そのせいか,自分が行ったことが発表中に見えてこない.

背景・目的

脳研究のためのデータは巨大で他種類.これらのデータを保存するための汎用的なデータベースを作る.

コメント

M
  • 先行研究をまねしただけ?\先行研究との違いを明確にして欲しい.たとえデータベーススキーマか変わっていたとしても,やっている内容自体は同じ.BI,脳研究者の支援のことを強く出して欲しい.
  • 自分の成果が分かりにくい\研究の提案,やったこと,新規性が見えない.
H
  • 実際に作っているのか?\実際に作ってみないと分からないことも多々ある.
O
  • 脳データは巨大,他種類\今回はERP,fMRIデータをあげていたが,巨大と言えるレベルのデータなのか
  • 一括して管理するデータベースが必要\理由が見えない.
  • 認知実験の説明\データベースを作ることと話が繋がっていない.データベース構築と,認知実験の設計は関係があるのか.
  • スキーマの設計\どのようなデータベースであれ,その設計には理由があるもの.わかりにくいという理由で変えてしまっていいのか."人間が分かりやすいか"ということも重要ではあるが,

"(データベースとして)コンピュータが処理しやすいこと"の方が重要では?

  • MySQLを使う\保存するデータに対して,MySQLは適したRDMSなのか?MySQLの特徴として挙げている点と,保存したいデータの関連性が無い.

個人的に最低限行って欲しいこと

研究の目的がはっきり見えないので,コメントしづらいが,"汎用性のあるデータベースを作成する"とするならば,何よりも,データベースを理解して欲しい.

  • データベースをきちんと設計して,構築する\こちらの指示通りにデータベースを作るのではなく保存する内容を理解した上で,設計して欲しい.
  • 汎用性があるか議論して欲しい\自分たちで用意したデータを保存することだけが目的ではない.ターゲットは脳研究者であって,自分たちではないことに注意.

総評

とりあえず,うちの教授の方針である30ページ以上の論文を書いてもらえれば構わない.ただし,きちんと内容を理解した上で,正しいことを書くこと.

新たなシステムや手法を開発した上で,それが間違っているのならまだしも,他の人が作ったものを間違えてまとめているのでは,そもそもその分野への理解が足りていない証拠.

また,論文は早めに書き上げて欲しい.というよりもまだ書き上がっていないことが問題.たった2枚の概要ですら,チェックに1時間以上掛かる.文字の密度が下がるとはいえ,30枚を超える論文をチェックするのにはそれなりに時間がかかるもの.大学への論文提出の締め切り前日に持ってこられても,チェックなどできるはずもない.