共創情報学研究室

教員

大崎　美穂（教授）Miho OHSAKI

研究分野	機械学習と知識発見
研究室	KE-111
TEL	0774-65-6468
FAX	0774-65-6801
E-mail	mohsaki@mail.doshisha.ac.jp

共創情報学研究室web siteへ

白浜　公章（教授）Kimiaki SHIRAHAMA

研究分野	人工知能のマルチメディア解析への応用
研究室	KE-110
TEL	0774-65-7567
FAX	0774-65-6801
E-mail	kshiraha@mail.doshisha.ac.jp

共創情報学研究室web siteへ

研究内容

研究の背景と目的

環境問題や化石エネルギーの枯渇、社会の少子・高齢化に伴う産業力の低下など、私たちは今、急いで解決されなくてはならない多くの困難に直面しています。

「モノや人の移動を減らし、少ないエネルギーで多くの価値を生み出す」－抱える困難に対する解は、高度技術を用いる高効率な価値創造以外にはありえません。私たちは、そんな価値創造の決め手こそがコンピュータの活用にあり、コンピュータと私たち人間との共創こそが、人類が困難を乗り越え、真に豊かな社会を築くための切り札であると信じています。

共創情報学研究室では、こうした信念を持って、コンピュータを活用して遠く離れた人どうしを結ぶ遠隔コラボレーション支援技術の研究や、コンピュータ自身を賢くし、人間には決して扱うことができない大量かつ複雑なデータから価値を生み出す技術の研究を行っています。

コンピュータの力で人と人を結ぶ

電信や電話に始まる電気通信の技術は、インターネットやケータイの登場によって、まさに「いつでも、どこでも、誰とでも」コミュニケーションをとることができる情報化社会をもたらしました。確かに、これらの新しい通信手段は便利です。

しかし、小さな画面やキー・ボードに閉じ込められ、私たちの思いを十分に伝えることは決して容易ではありません。コンピュータやインターネットの能力が向上した今、これまで追い求めてきた「小さく手軽な」手段から、私たちが本来持っているコミュニケーション・シーン全体を伝え合う「大きくて本物の」手段に、技術開発が目指す目標を変えるべきであると考えています。

私たち共創研は、そうした思いを実現すべく、NTT研究所が提案した「ミライノデンワt-Room」の高度化の研究を行っています。多数のカメラやディスプレイ、マイク、スピーカなどのマルチ・メディア機器を多数のコンピュータで制御し、まるで隣合っているように遠くの人と人を結びます。

しかし、映像や音は、単に伝わればよいわけではありません。技術の現状は、映像・音の反射（エコー）や映像の死角、視点のずれ、不自然な映像・音場の再現、さらには同期のずれなど、改善しなくてはならない様々な課題をかかえています。私たちは今、これらの課題の解決を目指して、デジタル信号処理やパターン認識、コンピュータ通信の技術を活用してt-Roomの高度化に取り組んでいます。

コンピュータの力で知識を掘り起こす

近年、コンピュータの計算や記憶の能力は目を見張る進歩を遂げています。単に四則演算を繰り返すのであれば、コンピュータは既に人間の力を超えたと言っても過言ではありません。記憶の力も同様です。インターネットで結ばれているコンピュータ上にあるテキストや映像などのデータの量は、到底一人の人間が記憶できる量ではありません。しかし、私たち人間は、そんな力強いコンピュータでも決して真似ることができない様々な高い知能を持っています。そんな知能の一つが知識を掘り起こす力です。この力は、データ・マイニングや知識発見の力とも呼ばれます。
そうした掘り起こす力をコンピュータにもたせるために、私たちは共創研は、特に医療現場から得られる膨大かつ複雑な時系列データから有益な知識を発見する医療データ・マイニング技術の確立を目指して、その基礎技術の研究開発を行っています。多くのデータ・マイニング技術では、人間の経験的知識を言葉で表現する記号処理的なアプローチに重点が置かれています。一方、私たちの取り組みでは、膨大かつ複雑なデータから統計的に意味のある知識を表現することを目指した信号処理的なアプローチに重点を置いています。人間では決して実行できない、数十次元もの時系列データの同時モデリングなどを行い、コンピュータの力を最大限に活用する知識の掘り起こしの実現を目指しています。

コンピュータを賢くする

人間には簡単に出来てもコンピュータにはなかなか出来ない、もう一つの知能に、パターン認識があります。私たち人間は、音声を聞き取り、目に映る情景を理解して、何を話しているのか、何が見えるのか、を瞬時に正確に判断することができます。文章を読み、その内容をスラスラと理解することもできます。しかし、今のコンピュータでは、例えばデータベースの中に「コンピュータ」という単語が入っているかどうかなどのような、探しているモノそのものがあるかどうかの検索はできますが、探しているモノに似たモノがあるかどうかの判断、つまりパターンの認識をすることは決して容易ではありません。「おはよう」ということばを声に出してみてください。皆さん一人一人、違った声で違った言い方になるはずです。全く同じ音声パターンが別々の人の口から出ることは決してありません。一人の人の声でさえ、繰り返し口に出してみれば、毎回毎回必ず違った「おはよう」になるはずです。私たち人間は、こうした異なるパターンを苦もなく同じ「おはよう」ということばであると聞き取るのです。コンピュータに、この聞き取りをさせるのは決して容易ではないのです。

私たち共創研は、このパターン認識の技術の高度化を目指して、最小分類誤り学習法（あるいは一般化確率的降下法）と呼ばれる、最先端の手法を土台とした新しい認識システム設計法の研究開発を行っています。考え方の基本は簡単です。認識の基本は比較にあります。認識しようとしているパターン「おはよう」と、コンピュータに記憶しているいくつものパターンとを比べます。もし記憶されている「おはよう」のパターンが、他の「こんばんは」のパターンなどよりも明確に認識したい「おはよう」と似ていれば問題はありません。正しく認識がなされます。しかし、記憶している「おはよう」が大人の男性の声だったとしましょう。一方、子供の声の「こんばんは」が記憶されているとします。この時、もし認識したい「おはよう」が子供の声であるとすると、この「おはよう」は大人の声の「おはよう」よりも子供の声の「こんばんば」に似ていると判断されることがあります。似通っている加減を声に求めるか、ことばに求めるかで、こうした判断のブレ、結果的に誤りが起こり得ることが理解できます。こうした誤りを防ぐために、私たちの手法は、記憶されている「おはよう」や「こんばんは」というパターンを、正確な認識の実現を目指して変更の繰り返し、つまり学習をするのです。
最小分類誤り学習法は、その開発そのものに私たち自身がかかわってきました。こうした経緯もあり、その一層の改良と発展に向けた研究は、国際的な水準で競争しながら進められています。

具体的な研究テーマ

遠隔コラボレーション支援技術の開発

マルチ・メディア通信における高臨場感音場再生技術の開発　
映像エコー・キャンセリング技術の開発　
身体動作を用いたt-Roomとの自然なインタフェースの開発　
t-Roomのユーザ・インタフェースの開発　
クロス・メディア情報を用いた同室感向上技術の開発　
時間遅れ制御による同室感向上技術の開発　
t-Roomにおける同室感向上のための評価基準の研究

医療データからの知識発見
　（病院で蓄積されたデータから治療に役立つ知識を発見する）

時系列クラスタリング法の開発　
知識発見支援システムの開発　
多次元スペクトル解析によるデータ・モデリングとその知識発見への利用

最小分類誤り学習法／一般化確率的降下法を基軸としたパターン認識技術の研究

アンサンブル型最小分類誤り学習法の開発
最小分類誤り学習法における幾何マージン制御法の確立
教育研究用識別学習ライブラリ・ソフトウェア「DISCERN」の開発
遺伝アルゴリズムを用いた認識向き特徴表現法の開発