自然言語処理におけるエラー分析
(兼:Project Next NLP報告会)
趣旨
科学技術が“trial and error”によって進展してきたことは間違いありません.この“trial and error”を科学技術の効率的な発展につなげるためには,偶然の産物を求めた無作為な試行の繰り返しではなく,「errorを深く分析し次の有効なtrialにつなげる」プロセスが重要であると我々は考えています.言語処理技術の各領域においてエラー分析はこれまでも個別の研究の一部として個々の研究者が行ってきていますが,そのほとんどは特定のタスクにおける特定のシステム・手法を対象とするもので,システム・手法に固有の問題が混在した形で課題が明らかにされてきただけでした.
本ワークショップでは,上記の現状と課題を踏まえ,約1年間にわたって総合的なエラー分析を目標に活動してきたProject Next NLPの成果報告を行うとともに,プロジェクト外からの関連研究発表,招待講演,パネルディスカッション,ポスター発表などを行い,自然言語処理全体における課題を明らかにして行きます.
会場情報
プログラム1日目/3月20日(金)
9:00-9:30: 趣旨説明
- Project Next NLP概要 (2014/3-2015/2)
- 関根聡 (ニューヨーク大)
9:30-11:30: Project Next NLP報告(1)
司会:鈴木久美(マイクロソフト)
- 形態素解析のエラー分析
- 鍜治伸裕 (東大)、 森信介 (京大)、 高橋文彦 (京大)、 笹田鉄朗 (京大)、 斎藤いつみ (NTT)、 服部圭吾 (富士ゼロックス)、 村脇有吾 (京大)、 内海慶 (デンソーアイティーラボラトリ)
- Project Next NLP 構文解析タスク
- 河原大輔 (京大)、 金山博 (日本IBM)、 颯々野学 (ヤフー)
- 固有表現抽出におけるエラー分析
- 岩倉友哉 (富士通研)
- パネルディスカッション
11:30-12:30: 休憩
12:30-13:30: 口頭発表(一般発表)
司会: 関根聡 (ニューヨーク大)
- Error Analysis of Named Entity Recognition in BCCWJ
- Masaaki Ichihara (茨城大), Kanako Komiya (茨城大), Tomoya Iwakura (富士通研), Maiko Yamazaki (東工大)
- 様々なジャンルのテキストに対する固有表現認識の分析
- 平田亜衣 (首都大),小町守 (首都大)
- 複数の知識源を利用した語義曖昧性解消手法のエラー分析
- 白井清昭 (JAIST)
- 語義曖昧性解消の機械翻訳への利用可能性を探る
- 藤田早苗 (NTT),Graham NEUBIG (NAIST)
13:30-15:30: Project Next NLP報告(2)
司会: 乾健太郎 (東北大)
- Project NEXT 述語項構造タスク
- 松林優一郎 (東北大), 吉野幸一郎 (京大), 林部祐太 (京大), 中山周 (東北大)
- 日本語書き言葉を対象にした省略・共参照解析の誤り分析
- 飯田龍(NICT),柴田知秀(京大),井之上直也(東北大/デンソー)
- エラー分析知識獲得グループ
日本語Winograd Schema Challenge を題材として知識獲得
- 柴田知秀 (京大)
- パネルディスカッション
15:30-16:00: 休憩
16:00-18:30: Project Next NLP報告(3)
司会: 賀沢秀人 (Google)
- Project Next日本語校正タスク
- 山本和英(長岡技科大), 鄭育昌(富士通研)
- Project Next英文校正タスク: 前置詞誤りを対象とした誤り分析
- 水本智也 (NAIST), 三田雅人 (NAIST)
- 語義曖昧性解消の誤り分析
- 新納浩幸(茨城大), 白井清昭(JAIST), 村田真樹(鳥取大), 福本文代(山梨大), 藤田早苗(NTT), 佐々木稔(茨城大), 古宮嘉那子(茨城大), 乾孝司(筑波大)
- Project Next における機械翻訳の誤り分析
- 赤部晃一 (NAIST), Graham Neubig (NAIST), 工藤拓 (Google), John Richardson (京大), 中澤敏明 (京大), 星野翔 (総研大)
- パネルディスカッション
プログラム2日目/3月21日(土)
9:00-11:30: Project Next NLP報告(4)
司会: 奥村学 (東工大)
- 情報抽出タスクの誤り分析 -商品の属性値抽出を題材に-
- 新里圭司 (楽天技研)
- レビュー解析を題材とした「誤り分析マニュアル」の試作に向けた検討
- 藤井敦 (東工大), 乾孝司 (筑波大), 中山卓哉 (筑波大)
- Project Next Summarization: Project Next 要約タスク最終報告
- 小倉由佳里(お茶大),菊池悠太(東工大),小林一郎,鈴木聡子(お茶大),高村大也(東工大),西川仁,平尾努(NTT),森田一(京大)
- WebNLP: NLP 応用の誤り解析 ~事実性解析と主体解析を題材に~
- 荒牧英治 (京大/JST),
叶内晨 (首都大), 北川善彬 (首都大), 岡崎直観 (東北大)
- パネルディスカッション
11:30-12:30: 休憩
12:30-15:00: Project Next NLP報告(5)
司会: 徳永健伸 (東工大)
- 言い換え認識技術の評価に適した言い換えコーパスの構築指針
- 藤田篤(NICT),柴田知秀(京大),松吉俊(山梨大),渡邉陽太郎(NEC),梶原智之(長岡技科大)
- 情報検索のエラー分析
- 難波英嗣 (広島市立大),酒井哲也(早大)
- 『ロボットは東大に入れるか』プロジェクト 代ゼミセンター模試タスクにおけるエラーの分析
- 松崎拓也 (名古屋大), 横野光 (NII), 宮尾祐介 (NII), 川添愛 (NII), 狩野芳伸 (静岡大), 加納隼人 (名古屋大), 佐藤理史 (名古屋大), 東中竜一郎 (NTT), 杉山弘晃 (NTT), 磯崎秀樹 (岡山県立大), 菊井玄一郎 (岡山県立大), 堂坂浩二 (秋田県立大), 平博順 (大阪工業大), 南泰浩 (電気通信大)
- Project Next NLP 対話タスク:雑談対話データの収集と対話破綻アノテーションおよびその類型化
- 東中竜一郎 (NTT), 船越孝太郎 (HRI-JP), 荒木雅弘 (京都工繊大), 塚原裕史 (デンソーITラボラトリ), 小林優佳 (東芝), 水上雅博 (NAIST)
- パネルディスカッション
15:00-16:00: 全体ディスカッション
司会: 関根聡 (ニューヨーク大)
提案者一覧
- 関根聡(ニューヨーク大学)
- 乾健太郎(東北大学)
- 鍜治伸裕(東京大学)
- 森信介(京都大学)
- 河原大輔(京都大学)
- 松林優一郎(東北大学)
- 岩倉友哉(富士通研究所)
- 飯田龍(NICT)
- 藤田篤(NICT)
- 新納浩幸(茨城大学)
- 柴田知秀(京都大学)
- 難波英嗣(広島市立大学)
- 高村大也(東京工業大学)
- 平尾努(NTT)
- 西川仁(NTT)
- 新里圭司(楽天)
- 藤井敦(東京工業大学)
- 乾孝司(筑波大学)
- 岡崎直観(東北大学)
- 荒牧英治(京都大学)
- 宮尾祐介(NII)
- 横野光(NII)
- 松崎拓也(名古屋大学)
- 工藤拓(グーグル)
- グラム・ニュービッグ(奈良先端大学院大学)
- 山本和英(長岡技科大学)
- 鄭育昌(富士通研)
- 水本智也(奈良先端大学院大学)
- 東中竜一郎(NTT)
- 船越孝太郎(HRI)
- 賀沢秀人(グーグル)
- 相澤彰子(情報学研究所)
- 黒橋禎夫(京都大学)
- 加藤恒昭(東京大学)
- 奥村学(東京工業大学)
- 佐藤理史(名古屋大学)
- 鈴木久美(マイクロソフト)
- 神門典子(情報学研究所)
- 中村哲(奈良先端大学院大学)
- 酒井哲也(早稲田大学)
- 徳永健伸(東京工業大学)
- 佐々木裕(豊田工業大学)
- 影浦峡(東京大学)