古宮研究室

自然言語処理 言葉をあやつるコンピュータ

Categories

コンピュータを使って、言葉の研究を行っています。専門的に言うと、人工知能の研究に含まれる、自然言語処理という研究分野です。大量のデータ(問題集)をコンピュータに与えて、規則性を発見し、新しい問題を解けるようにする技術、「機械学習」を使って実現していきます。当研究室では、言葉の意味を文脈によって理解させたり、欲しい情報を抽出したりするタスク、また、評判分析、推薦システム、文書分類など様々なタスクを対象に研究を行っています。

最近では、深層学習を用いた技術が人工知能の研究の標準となっており、当研究室でも盛んに利用しています。当研究室では日本語の処理を長年研究してきており、日本語ならではの特性について焦点を当てて研究しています。また同時に、この特性を意識しつつ、英語のテキストを用いたクロスリンガルな処理についても研究を行っています。

また、ある分野についてあまりデータがないときに、別の近い分野の知見を転用、併用して低リソースで精度の高いシステムを作成する研究をしています。例えば、新聞のデータを利用したブログのデータ用のシステムや、現代文のデータを用いた、古文用のシステム、日英のテキストを使ったクロスリンガルなシステムなどを作っています。

 

TOP