開催日時: | 2009年3月2日(月) 10:45〜18:30 |
---|---|
場所: | A20大講義室 |
10:45〜12:15
「ウェブサービスを利用した自然言語処理研究」
山下 達雄 氏(Yahoo! JAPAN 研究所 R&D)
ウェブ検索やショッピングなどのウェブサービス(ウェブAPI)を自然言語処理研究に活用するためのアイディアとレシピを紹介する. プログラム初心者にも分かりやすいようデモを中心にプレゼンを行う. プログラムを書かない人にも,ウェブサービスで何ができるのかが分かるように,「やりたいこと」(問題)と「使えるウェブサービス」(その解決)を軸に多種多様な利用方法を提案する.
13:20〜14:50
「生成文法の考え方と検証の方法」
上山 あゆみ 氏(九州大学)
生成文法は,20世紀後半にチョムスキーが提唱しはじめた言語理論である. それまでの言語理論とは大きく異なる点が多かったため,特に80年代ごろまでは多くの分野から注目されていたが,比較的頻繁なモデルチェンジのせいもあり,現在では,いったい何を手がかりにして,何を明らかにしようとしているのか,わかりにくいという印象を持たれていることが多いのではないだろうか. このチュートリアルでは,生成文法の目的と,研究の進めていく上で何が重要かということを,なるべく平明に述べていきたい. ある程度,講師の個人的な再解釈も含めることによって,生成文法が他の諸分野とどのように連携していけるかということが少しでも明らかにできればと考えている.
15:10〜16:40
「情報可視化の基礎」
松下 光範 氏(関西大学)
情報可視化(information visualization)は,様々な情報をわかりやすく表示することでユーザの理解を支援する技術である. 計算機の発展やネットワークの普及によって私たちがアクセスできる情報の量は飛躍的に増加しているため,情報可視化に対する期待が高まっている. 本チュートリアルの前半では,情報可視化の基礎として可視化の参照モデルについて説明したあと,様々な可視化表現を紹介する. また後半では,テキスト処理と情報可視化の連携に焦点をあて,その一つの試みである「動向情報の要約と可視化に関するワークショップ(MuST)」の取り組みについて紹介する.
17:00〜18:30
「自然言語処理のための知識獲得」
関根 聡 氏(ニューヨーク大学)
形態素解析,構文解析,小数の固有表現など分類問題に帰着できる自然言語の問題が教師付機械学習によってほぼ解決の目処がついた現在,自然言語処理の研究対象は,項構造解析,照応解析,言い換え表現,対象に依存した表現認識などを含めた意味解析に注目が移ってきている. 教師付機械学習はこの問題の解決には最適な方法論ではなく,意味的な処理を行なうためには幅広い知識を作ることが必要である. しかしながら人手のみで意味的知識を作ることには限界があり,大規模な(タグ付けされていない)コーパスから知識を獲得する方法が研究されている. 方法としては,Distributional Similarity, LSP, Alignmentを使う方法などがあり,その基本的ツールとして,大規模なコーパスに対するパターンの検索技術も重要である. 本チュートリアルではこれらの技術を概観し,今後の研究の方向性についての可能性を挙げる. また,2008年11月にNYUで最先端の研究者が集まったSemantic Knoweldge Discovery, Organization and Useのシンポジウム (http://nlp.cs.nyu.edu/sk-symposium) で議論された話題についても取り上げる.