2006/12/04(月)Li, {E, K} @ B4
情報収集について Li
ウェブ上の情報収集に関してのお話し.
keywords: Information Gathering, Data Reasoning
ウェブ上における検索は,mismatchやoverloadなどにより,目的のサイトを探すことは難しい.そのためInformation Retrieval, Information Agents, Web Miningなどの技術を用いる必要がある.特に,単語のシノニム(synonym)やフォノニム(phononym)の関係性をきちんと把握することが必要である.
現在のDecision Patternは,その知識の中に曖昧性,構造を埋め込むことが出来ない.知識を始めとする曖昧性を利用するために,ラフ集合を用いる必要がある.
発見されたパターンにおいて,間違えているパターンもあるが,その中でも特に"興味深い間違いパターン"が重要である.分析において,間違えたパターンを分析することで,なぜ間違えたかを学習し,次の分析に応用する.
ターゲットマーケティングのためのデータマイニングの分析 E @ B4
データマイニングには数多くの手法がある.データ,分析の目的に応じて使い分ける必要がある.ターゲットマーケティングにおいて,データマイニングを行うにあたり,各分析ツールはどのような分析に向いているか比較する.
使用するツール・データ
- 決定木
- 非階層型クラスタリング k-means
- 相関ルール
- 特異性指向マイニング pom
上3種類はwekaに組み込まれている物,pomはせりかが提供するツールを使う.分析対象のデータはUCI Machine Learning Repositoryにあるダイレクトマーケティングのデータ.
結局
ツールを自作することを前提に話を進めていたつもりだが,結局他のツールに頼ることに.ツール使って,公開されているデータを分析して,研究(?)は終わる模様.
コメント
せめて,各分析ツールが何をしているのか理解すること.他は特に言えること無し.
脳データ分析のためのデータグリッドの構築 K @ B4
グリッド上において,脳データを分析するためのデータグリッドを構築する.保存するデータは,fMRIにより取得された画像,EEGにより収集された脳波.グリッドはGlobus Toolkit3を使う*1.
現在
Globus,MySQLのインストール中.
これから
この時期にインストールできていないようでは先は無い.方針を変え,脳データ分析のためのデータベースの構築に変更.今後
- 脳データの理解
- データスキーマの設計
- データベースの構築
を行う.
コメント
MySQLくらいはインストールして貰いたいけど,現状では怪しい.最低でも,脳データ,脳データ分析というものについて知り,きちんとしたスキーマの設計をして欲しい.
B4に
工学系にいるのだから,ソフトウェアは使えて当然."使い方を調査しました"は論文にならない.教授に限らずとも,研究室には先輩が多くいるのだから,分からないことがあれば素直に尋ねること.一人でずっと悩んでいても仕方がない.
研究とは,
- 既存の手法や実装に対して問題点を見つけ
- 解決法を提案・実装し
- 元の手法や,他の手法と比較検討し
- 有効性やさらなる発展を示す
こと.現状では,研究に成り得ないし,論文にもならない.