2006/06/27(火)S@M2 + {N,M}@B4

発表の内容を勝手に解釈して,一部拡張?して,感想を追加.

ウェブログマイニング? S@M2

ユーザ個別化の手段とか.ログの収集・分析について.

ユーザ個別化とログの収集

ログを分けて,ユーザ毎のログに分ける.クッキー,セッション管理によるユーザを分ける.ユーザの状態により,表示する商品を変える.

ログの分析

ログをツリー上に再構築した場合,ウェブの構造,見やすさによりその形状が変化する.使いやすければ,直線上に,使いにくければ横に広がるはず.

個人的には使いやすさよりも,サイトのタイプに分かれる気がする.ショッピングサイトの場合は,複数の商品を比較するので,直線ではなく,横に広がる可能性が高い.

また,ログは必ずしも木構造になるわけではないので注意.

セマンティックウェブ N@B4

セマンティックウェブとUserエージェントについて.

セマンティックウェブとUserエージェントを話す前に,ウェブ,エージェントの話をしていない.いきなり後のセマンティックとかオントロジーとかUserエージェントとか話しても関連性が見えない.

セマンティックウェブ

エージェント,エージェントとセマンティックウェブの関連性ウェブとセマンティックウェブの違い.その辺まとめないと理解するのは難しい.

個人的にオントロジーの語源等はどうでもいいと思いたい.

Userエージェント

何をするのか不明.どちらかと言うと,UserInterfaceの役割な気がする.おそらく,ユーザの代わりに,バックグラウンドで複雑な作業をさせるのだとは思うが,まだまとまっていないので,今後に期待?

あと,ウェブ推論との区別がつかなくなりそうなので注意.

クリックストリーム M@B4

ウェブサーバのアクセスログとクライアント側のクリックのログについて.

ウェブサーバ側のアクセスログ

ローカルにアクセスされるすべてのログを確実に撮ることができる.しかし,ブラウザ上における戻るボタンや,他のサーバに対するログを取ることが出来ない.

クライアントのクリックのログ

サイトを超えて,すべてのブラウザに対してのアクションを収集することができる.また,ウェブサーバ側で収集できるすべてのログを含んでいる.しかし,クライアント側に専用ソフトをインストールする必要があり実現が難しい.

うちの先生的には,クリックストリームによるデータ収集より,新たな分析ツールの開発を期待している模様.ターゲットはソーシャルネットワークらしいが,おそらくソーシャルネットワークを知らないので,単にクリックストリームを用いたサイトの構造化で済みそうな感じだ.しかし,リンクを利用したサイトの構造化等はある*1ので,どこで差異をつけるのか疑問.

というより,単なるデータマイニング分析ツールを抜け,グラフマイニング等の新たな分析手法を欲しがっている感じ.

*1 : 簡単なところだと,key graphあたりを調べるといいかもしれない

2006/06/08(木)現代社会と科学・技術

科学の歴史

天文学,占星術が重要(自分の位置,時間を知る,歴を決める).時の権力者によって,それぞれの識者・研究者を独占.研究者は,好きな研究のみやっていればよかった.権力者の物であることが多い.

技術の歴史

一子相伝.免許皆伝.元々は代々受け継がれるもの.人々のための物であることが多く,生活のための技術.

科学と技術の融合

科学を利用した技術へと変化.一昔前までは,科学・技術であったが,近年科学技術となってきている*1

*1 : 英語では,science and technologyであり,andが消えてはいない

最も重要な褒賞

最近はノーベル賞などが出来て,価値が変わってきているが,元々は,eponym*2である.

*2 : 地名や数式などに,人の名前を付けること.\その人の成果を讃えて,尊敬の念を込めて使う.AのB方程式.C岬など

CUDOS

元々の研究者は,研究第一であり,"研究は善である"ものであった.

  1. Communalism (成果の共有)
  2. Universalism (普遍主義)
  3. Disinterestedness (利益の放棄)
  4. Organized Skepticism (組織的懐疑主義)

PLACE

近年は,お金,成果が優先されることが多い.CUDOSをパロったもの.

  1. Proprietary (所有件)
  2. Local (局所性)
  3. Authoritarian (権威主義)
  4. Commissioned (依頼)
  5. Expert work (専門職)

産業と行政

一般社会を動かす,最も大きな力を持つもの.科学者の技術を最も必要としている.

2006/06/01(木)顔合わせ

G大学のM先生との共同研究の記録.M先生は,G大学における計測機器全般を管理しているらしい.今後,そこの機材を利用させて貰うかもしれない.

内容

  1. 相手側,自分側の持っている研究のネタについて.
  2. それぞれの,研究目的.
  3. 自分の就職活動.
  4. 相手側にある機材について.

相手側

専門

最近は,感染制御に関して.患者の病状だけではなく,医者側の抗体の確認,2次感染防止のための取り組み.特に,針などを間違えて指に刺してしまう等の感染が非常に怖い.

所属等

検査部にいるため,一通り検査データを扱っている.1万件/日程度の検査データが来る.

期待していること

今までは,検査データからほとんど分析等を行ったことが無い.また,データを管理する専門スタッフがいない.検査データから有効な分析結果が出ていないのは,データの分析方法に問題があったから.M大学の持つデータマイニング技術を使いたい.

機材等

いろいろ紹介されたが,現状関係がありそうな項目のみリストアップ

  • 脳波 \暗室があり,長時間のデータ収集が目的.同時に医療目的で長い紙に出力していたが,そのまま,データをデジタルデータとして取り出せるのか?\20件/日程度
  • 血液 \受付においてある受付機に,診察カードを通すと,検尿用カップ,採血用試験管に自動的にラベルが貼られる.\件数に関しては不明だが,最も一般的検査であるため,相当数あるのでは?
  • MRI \SiemensとGEの2者の装置が置いてある.GEの方がfMRIに対応しており,来年更新予定.\100件/日程度?
  • MEG \今年新しく入ったため,まだ稼働していない.

R研との共同研究

今度話を聞きに行く.相手側に,どの分野の聞きに行くのか伝えるために,2-3行程度でそれぞれの専門分野を伝える.自分も行くようにと教授に言われたが,この共同研究は,ゲノムに関しての共同研究を予定しているため,自分たちが関わるべき内容ではない.

とりあえず

ほどほどにいい先生の模様.医療に従事しているだけあって,現場でのことをテーマにした研究が多そう.ただ,やはり研究者,という感じが否めない.

多くの検査機器が自動化されていた.また,相手の先生もそれを売りにしていた感じがある.

医療の現場でほぼフルに動いているため,我々が実験に使いたいと言っても,なかなか使わせてもらえる様子はない.特に,病院であるため,緊急の割り込み等も多いようだ.

次回打合せ

7/5 (水) 午後