2006/12/04(月)Li, {E, K} @ B4

情報収集について Li

ウェブ上の情報収集に関してのお話し.

keywords: Information Gathering, Data Reasoning

ウェブ上における検索は,mismatchやoverloadなどにより,目的のサイトを探すことは難しい.そのためInformation Retrieval, Information Agents, Web Miningなどの技術を用いる必要がある.特に,単語のシノニム(synonym)やフォノニム(phononym)の関係性をきちんと把握することが必要である.

現在のDecision Patternは,その知識の中に曖昧性,構造を埋め込むことが出来ない.知識を始めとする曖昧性を利用するために,ラフ集合を用いる必要がある.

発見されたパターンにおいて,間違えているパターンもあるが,その中でも特に"興味深い間違いパターン"が重要である.分析において,間違えたパターンを分析することで,なぜ間違えたかを学習し,次の分析に応用する.

ターゲットマーケティングのためのデータマイニングの分析 E @ B4

データマイニングには数多くの手法がある.データ,分析の目的に応じて使い分ける必要がある.ターゲットマーケティングにおいて,データマイニングを行うにあたり,各分析ツールはどのような分析に向いているか比較する.

使用するツール・データ

  • 決定木
  • 非階層型クラスタリング k-means
  • 相関ルール
  • 特異性指向マイニング pom

上3種類はwekaに組み込まれている物,pomはせりかが提供するツールを使う.分析対象のデータはUCI Machine Learning Repositoryにあるダイレクトマーケティングのデータ.

結局

ツールを自作することを前提に話を進めていたつもりだが,結局他のツールに頼ることに.ツール使って,公開されているデータを分析して,研究(?)は終わる模様.

コメント

せめて,各分析ツールが何をしているのか理解すること.他は特に言えること無し.

脳データ分析のためのデータグリッドの構築 K @ B4

グリッド上において,脳データを分析するためのデータグリッドを構築する.保存するデータは,fMRIにより取得された画像,EEGにより収集された脳波.グリッドはGlobus Toolkit3を使う*1

現在

Globus,MySQLのインストール中.

これから

この時期にインストールできていないようでは先は無い.方針を変え,脳データ分析のためのデータベースの構築に変更.今後

  • 脳データの理解
  • データスキーマの設計
  • データベースの構築

を行う.

コメント

MySQLくらいはインストールして貰いたいけど,現状では怪しい.最低でも,脳データ,脳データ分析というものについて知り,きちんとしたスキーマの設計をして欲しい.

*1 : 理由は,GT4に日本語マニュアルが無いから...

B4に

工学系にいるのだから,ソフトウェアは使えて当然."使い方を調査しました"は論文にならない.教授に限らずとも,研究室には先輩が多くいるのだから,分からないことがあれば素直に尋ねること.一人でずっと悩んでいても仕方がない.

研究とは,

  • 既存の手法や実装に対して問題点を見つけ
  • 解決法を提案・実装し
  • 元の手法や,他の手法と比較検討し
  • 有効性やさらなる発展を示す

こと.現状では,研究に成り得ないし,論文にもならない.