このページの本文へ移動
ページの先頭です
以下、ナビゲーションになります
以下、本文になります

音声言語処理機構研究室

教員

加藤 恒夫(教授)Tsuneo KATO

DB

研究分野 音声情報処理と行動信号処理
研究室 KC-221
TEL 0774-65-6981
FAX  
E-mail tsukato@mail.doshisha.ac.jp

田村 晃裕(准教授)Akihiro TAMURA

DB

研究分野 自然言語処理
研究室 KC-321
TEL 0774-65-6983
FAX
E-mail aktamura@mail.doshisha.ac.jp

研究内容

研究の背景と目的

世界がグローバル化されて色々な言語を話す人とコミュニケーションを行う機会が増えています。また、人間とは言語認識機構が異なるコンピュータやロボットなどに、話し言葉(音声)で色々な指示をしたり、逆に情報を受け取ったりする機会も増加しています。
話し言葉は、状況依存性といって、会話がなされている状況から容易に推測される事項は省略されることが多く、また、「考えながら話す、話しながら考える」という発話行動から、文法には従わない発話も多くなされます。このような話し言葉の特徴は、言語メディアの異なる外国人や言語認識機構が異なるコンピュータやロボットとコミュニケーションを行おうとする際、どのような影響を与えるのでしょうか。逆に、どのようにすれば、このような言語メディアや言語認識機構が異なる対象と正確で効率的なコミュニケーションを、私達にとって身近な話し言葉で成立させることができるでしょうか。
このような話し言葉のコミュニケーションを成立させるための機構の探求と技術の研究開発を行っています。具体的には、情報処理技術を用いて外国語の効率的な習得を支援するe-learningや外国語によるコミュニケーション能力を正確に測定する自動評価技術、話し言葉による外国人とのコミュニケーションをするのを支援するコンピュータによる音声翻訳システム、更にはコンピュータやロボットに話し言葉を理解させたり、発話させたりする音声対話システムなどの研究を行います。これには、話し言葉のコミュニケーションを成立させるための機構を探求する話し言葉のコミュニケーション科学と共に、音声認識・音声合成や自然言語処理技術の研究開発も必要です。
研究の背景と目的

問題解決のアプローチと方法

自然言語を処理する手法としては、従来開発者の内観に基づき処理規則を開発するルールベース手法が主に使用されてきました。ルールベース手法は、開発者の永年の経験を凝縮した貴重な知識源ですが、大規模なシステムの場合、多くの開発者が係わることから統一性の保持や保守の困難性の問題がありました。コンピュータの処理能力の増大やコンピュータで利用可能なコーパス(品詞などの情報が付与された文例)の増加につれて、コーパスから機械学習により知識を自動獲得する手法であるコーパスベースが注目されています。外国語学習者のコーパスや音声データベース更には対訳用例などに機械学習手法を適用するコーパスベース手法を中心に、e-learningシステムやロボットとの音声対話システムを研究開発しています。
コーパスベース手法は自然言語処理や音声言語処理の強力な手法ですが、コーパスベースは万能というわけではありません。人間の持つ自然な知識をどのように組み込んでいくかも重要な研究テーマです。このような人間がどのように音声言語を理解するかについても研究を進めます。

具体的な研究テーマ

外国語学習者の効率的な学習を支援するには、学習者の能力を的確に把握し、能力にあった課題を与える必要があります。それには、以下のような能力を客観的に測定する方法および課題の難易度を測定する方法が必要です。この研究開発には研究用の大規模なコーパスや音声認識システムの開発が必要です。更に、実際に使用した場合の課題を抽出するために、これらの技術を統合したシステムを開発します。
また、2015年度より新たに、音声対話技術、スマートデバイス向け統計的ソフトウエアキーボード、を加藤が担当します。

音声認識技術

  • 日本人の英語音声に適した音響モデルや言語モデルの開発
  • 日本人の英語を認識する音声認識システムの開発

自然言語処理技術

  • 大規模英文コーパスからの翻訳の信頼度評価技術
  • 統計翻訳技術などのコーパスベース翻訳技術
  • 英文の信頼度を評価用の大規模な英文コーパス収集用WEB上のロボットの開発

外国語能力測定技術

  • 種々の英語能力の人による日本文からの英文への翻訳データや英語発話データの開発
  • 参照訳との距離等に基づく英語文の構成能力(英語発信能力)の自動測定方法
  • 能力測定に際して適切な難易度の異なる課題を選択する方法

英文難易度測定技術

  • 与えられた日本文を英語に翻訳する場合の難易度の評価尺度の研究
  • 日本文の英語への翻訳の難易度の自動評価尺度の研究

音声信号などの解析

  • 音声などの信号から非線形解析手法を用いて有用な情報を抽出する研究
  • 信号解析技術の改良や解析手法の開発
  • 不規則信号の発生機構の解明や予測手法の開発

DIET(Doshisha Interactive English Tutoring)システム開発

  • 英語で会話し、学習者の問題点を指摘する学習支援システム
  • 英語音声認識、対話者の能力測定、翻訳課題選択、翻訳技術などの技術の集大成

音声対話技術

  • ニューラルネットを用いた統計的意図推定モデルの研究

スマートデバイス向け統計的ソフトウエアキーボード

  • 統計的タッチモデルの開発
  • 統計的タッチモデルのオンラインユーザ適応技術の研究
  • 視線、加速度などのマルチモーダルデータを用いた状況適応の研究
  • シニア向けユーザインタフェースの研究