第28回年次大会委員長 堂坂 浩二(大会担当理事・秋田県立大学)
同 プログラム委員長 河原 大輔(早稲田大学)
同 実行委員長 狩野 芳伸(静岡大学)
○ 場所・期日
言語処理学会第28回年次大会は,大会運営関係者と一部のチュートリアル・講演登壇者以外のすべての参加者はオンラインで参加する形態で,会場としてアクトシティ浜松コングレスセンター (静岡県浜松市中区)を活用し,次のとおり開催しました.
チュートリアル 2022年3月14日(月)
本会議 2022年3月15日(火)〜 17日(木)
ワークショップ 2022年3月18日(金)
開催にあたっては,国立大学法人静岡大学の後援,浜松・浜名湖ツーリズムビューローの協賛を受けました.
〇 参加状況
参加状況は以下の通りです.参加者数は過去最大を数えました.前回に引き続き会期中の受付は廃止し,従来通りの事前登録に加えて,開催前週まで受付を行う「直前登録」にて参加申込を受け付けました.
事前登録 996名
直前登録 173名
講師等の招待者 11名
スポンサー招待 538名
合計 1,718名
○ プログラム概要
■本会議 (3月15日 -- 17日)
一般セッション(口頭発表,ポスター),テーマセッション合わせて386件の投稿があり,そのすべてがオンラインで発表されました.発表件数は過去最多のNLP2019の398件に近い発表件数となりました.口頭発表254件(テーマセッション発表33件を含む)は過去最多の件数です.
・口頭発表(一般) 221件 (NLP2021:164件)
・口頭発表(テーマセッション) 33件 (NLP2021: 12件)
・ポスター発表 132件 (NLP2021:183件)
今大会では口頭発表の希望が多く,可能な限り多くの口頭発表を受け入れるため,口頭発表のセッションを当初予定の6並列から7並列に増やして実施しました.
■テーマセッション(3月15日・17日)
公募により設定された以下の4件のテーマセッションを開催しました.
・論文情報処理と論文執筆支援 (14件+総合討論)
・文章の評価と品質推定 (13件+総合討論)
・言語処理テクノロジーと翻訳:翻訳の要請から技術へ,技術から翻訳応用へ (3件+総合討論)
・談話研究と対話システム研究,人工知能研究の連携に向けて (3件+総合討論)
■招待講演(3月15日・16日)
下記の2名の先生をお招きし,招待講演を実施しました.
・田中 久美子 先生(東京大学)
自然言語を複雑系として捉える試み
・馬塚 れい子 先生(理化学研究所/Duke University)
自然言語処理研究が乳幼児の言語発達研究から学べることは何か
■招待論文講演 (3月17日)
会誌「自然言語処理」に発表された論文の中から選出された以下の4件の論文についての発表が行われました.
・Effectiveness of Syntactic Dependency Information for Higher-Order Syntactic Attention Network
Hidetaka Kamigaito, Katsuhiko Hayashi, Tsutomu Hirao, Masaaki Nagata and Manabu Okumura
Vol.28, No.2, pp. 321-349
・テキストベクトルの重みづけを用いたタスクに対する単語分割の最適化
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観
Vol.28, No.2, pp. 479-507
・訓練事例の影響の軽量な推定
小林颯介, 横井祥, 鈴木潤, 乾健太郎
Vol.28, No.2, pp. 573-597
・数値気象予報からの天気予報コメントの自動生成
村上聡一朗, 田中天, 萩行正嗣, 上垣外英剛, 船越孝太郎, 高村大也, 奥村学
Vol.28, No.4, pp. 1210-1246
■チュートリアル (3月14日)
以下の4つのテーマについてチュートリアルを実施しました.
・項目反応理論と自然言語処理/江原 遥 先生(東京学芸大学)
・ゼロから始める転移学習/柴田 知秀 先生(ヤフー株式会社)
・ボケとツッコミの言語学〜漫才研究が照らす日常会話のメカニズム/岡本 雅史 先生(立命館大学)
・最適輸送と自然言語処理/横井 祥 先生(東北大学)
■スポンサーイブニング (3月14日)
スポンサーと参加者との交流を目的として,スポンサーイブニングをオンラインで開催しました.270名を超える参加があり,スポンサーのブースの紹介に活用されました.
■懇親会(3月16日)
Gatherを使ってオンラインで懇親会を開催し,最大接続数270件を超える多くの参加者が集まりました.
■ワークショップ (3月18日)
昨年度に引き続きワークショップの募集を行いました.以下の2件の応募があり,いずれも多くの参加者を集めて開催されました.
・NLPにおける再現性
・日本語における評価用データセットの構築と利用性の向上
○ スポンサー
オンラインを中心とした開催形態でしたが,全部で66の団体からご支援を頂きました.これは歴代最多のスポンサー数です.内訳は次の通りです.
プラチナスポンサー件数 22団体
ゴールドスポンサー件数 19団体
シルバースポンサー件数 25団体
また,冠スポンサーとして,1団体から「プレミアムスイーツ」のご支援を,5団体から「スポンサー賞」のご支援をいただきました.スポンサー様のご支援のおかげで,充実した大会になりました.厚く御礼申し上げます.
〇 総括
第28回年次大会では,オンラインによる開催形態を中心に企画を進め,新型コロナウイルスの感染状況を見ながら,現地会場とオンラインを組み合わせたハイブリッド開催形態も視野に入れ準備を進めてきました.そのなかで最も重視したことは,開催形態によらず活発な発表と議論,参加者・スポンサー団体の交流を促進することです.結果としてオンライン中心の開催形態となりましたが,おかげさまで盛況に年次大会を開催することができました.
活発な発表・議論・交流のための取り組みとして次のことを行いました.
・ポスター発表・スポンサー展示ブース・懇親会のインフラとしてGatherを活用し,参加者間のコミュニケーションの円滑化を図りました.
・ポスター発表セッションへの参加を促進するために,各発表30秒のライトニングトーク(録画)の放映を行いました.
・参加者の皆さんが,一体感を感じ,大会に没入するための鍵は「現地」にあると考え,名産品配送企画など現地の情報の共有に努めました.
・チュートリアル2件,招待講演1件を現地から配信し,現地とオンラインをつないで質疑応答を実施しました.
・チュートリアル講演・招待講演の動画は参加登録者向けに期間限定配信を行いました.
以上のような取り組みを通して,大会の活性化に寄与できたのではないかと考えています.現地会場からチュートリアル・招待講演の一部を配信したほか,運営委員が現地会場に集まり大会を運営することで,意思決定を円滑に行うことができました.
同時に課題も残っています.今大会ではポスター発表の希望が例年より減少しました.セッションの並列数を増やさず,余裕のあるプログラムが望ましいので,ポスター発表をより魅力的にする必要があります.また,持続可能な年次大会であるために,委員や運営側に負荷がかかり過ぎない運営の仕組みについて,引き続き知恵を絞っていく必要があると考えています.
最後に,チュートリアル・招待講演の講演者の皆様,テーマセッション・ワークショップの企画をしてくださった皆様,論文を投稿・発表してくださった皆様,ご支援をいただいたスポンサー団体の皆様,ご後援いただいた静岡大学の関係者の皆様,ご協賛いただいた浜松・浜名湖ツーリズムビューローの関係者の皆様,困難な状況の中,献身的な努力で準備をしてきた各委員会のメンバーの皆様,業務委託先の各企業の皆様,そして大会を盛り上げてくださった参加者の皆様に深く感謝いたします.来年以降も引き続き年次大会への投稿,ご支援,ご参加をどうぞよろしくお願いいたします.
第28回年次大会プログラム委員長 河原大輔(早稲田大)
言語処理学会第28回年次大会では,優秀賞・若手奨励賞,言語資源賞,スポンサー賞,委員特別賞の表彰を行いました.
■優秀賞・若手奨励賞
言語処理学会年次大会の優秀賞は,年次大会において論文の内容が優れていると認められた発表論文に与えられる賞です.また,優秀賞のうち特に優れたものがあれば,最優秀賞として選定されます(言語処理学会年次大会優秀賞規定).同様に若手奨励賞は,年次大会において論文の内容が優れていると認められた発表論文に関して,以下の条件を満たす著者に与えられる賞です(言語処理学会年次大会若手奨励賞規定).
・年次大会開催年の4月1日において満30歳未満のもの
・当該論文の第1著者であること
・過去に若手奨励賞を受賞していないこと
・ある論文が優秀賞を受賞する場合は,その論文の第1著者は若手奨励賞の対象とはならない
近年の年次大会の場合と同様に,今大会においても大会の開始前に全論文を対象に審査を行い,授賞論文・著者を決定し,大会のクロージングにて表彰しました.
賞選考のための内規では,
・優秀賞は全発表件数の約2%を目安とする
・優秀賞の中で特に評価の高いものを0件から2件の範囲で最優秀賞とする
・若手奨励賞は最大10件程度を目安に選出する
としております.
今大会の全発表件数は386件(前大会361件)であり,優秀賞の授賞件数は全体の2%にあたる8件を目安としました.また若手奨励賞の対象となる論文は280件(前大会247件)でした.
年次大会優秀賞・若手奨励賞の選考にあたっては,選考委員会を組織し,慎重な議論を重ねた上で選定を行いました.今回,選考委員会は計248名(前大会227名)で構成されました.各授賞論文には議論で合意された授賞理由が付記されます.授賞の最終的な責任はプログラム委員長の河原が負います.
賞選考は「論文審査」と「最終選考」の二段階で行いました.論文審査に先立ち,投稿カテゴリにより全ての論文を5つのグループ(A,B-1,B-2,C-1,C-2)に分けました.グループ毎に,そのグループの研究分野を専門とする選考委員を各論文に対し5名割り当て,審査を行いました.審査委員はそれぞれ7〜9件の論文を担当し,各論文に対して,総合評価(6段階),新規性(5段階),有用性(5段階),読みやすさ(5段階)の観点から審査しました.この際,優秀賞に推薦する論文については推薦理由を記述するようお願いしました.また,今大会では,若手奨励賞のための推薦項目は設けず,優秀賞と若手奨励賞の選考は同じ総合評価の点に基づいて行いました.
論文審査終了後,最終選考を行いました.選考委員は,河原大輔(早稲田大;プログラム委員長),東中竜一郎(名古屋大;副プログラム委員長),鈴木潤(東北大;前プログラム委員長),林部祐太(リクルート;大会賞担当プログラム委員)の4名です.最終選考では,原則として,論文審査において審査員が与えた総合評価の点数の高い論文を授賞論文として選びました.4名の最終選考委員のうち,授賞のボーダーライン付近にCOIのある論文があったときは,COIのない選考委員で授賞論文を決めました.
最終選考では,まず優秀賞を決定しました.最初に,審査員による評価点のばらつきを抑えるために,一般化線形混合モデルを用いて総合評価の点を補正しました(以下では,補正後の評価点を単に「評価点」と呼びます).次に,評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,上位9件の論文を優秀賞として選びました.優秀賞の授賞件数の目安は8件ですが,8位と9位の論文の評価点が僅差でボーダーラインを入れることが難しいこと,9件でも全発表件数の2.3%で内規を満たすことから,今大会では9件に対して優秀賞を授賞することにしました.次に,これら9件のうち,2位と3位の論文の評価点に大きな差があったことから,上位2件の論文を最優秀賞として選びました.
次に,若手奨励賞を決定しました.優秀賞受賞論文ではなく,かつ若手奨励賞の受賞資格を満たす論文について,評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,上位12件の論文を若手奨励賞として選びました.若手奨励賞の授賞件数の目安は最大10件程度ですが,10位から12位の論文の評価点が僅差でボーダーラインを入れることが難しいこと,若手奨励賞の対象論文数が近年増加傾向にあり,12件は対象論文の4.3%で授賞の乱発には当たらないことから,今大会では12件に対して若手奨励賞を授賞することにしました.
以下は,最優秀賞,優秀賞,若手奨励賞の論文とその授賞理由です.
*言語処理学会第28回年次大会 最優秀賞(2件:発表番号順)
G1-4 強化学習における画像キャプションの低識別性問題とLong-Tail分類手法を用いた対処
本多右京, 渡辺太郎 (NAIST), 松本裕治 (理研)
画像キャプション生成において強化学習は有効な手法ですが,一般的な内容のキャプションを生成しやすいという低識別性の問題があります.本論文では,この問題に対処するため,画像分類で用いられているlong-tail分類手法を応用することによって,キャプション中の語彙を増加させる手法を提案しています.実験によって,提案手法が既存モデルと比べて,語彙を増加させるとともに,識別性を顕著に向上させることを確認しています.また,提案手法は学習済みの既存モデルをfine-tuningするものであり,計算コストが低く,実用性も高いと考えられます.これらの貢献から最優秀賞にふさわしいと判断しました.
A3-1 ニューラル言語モデルの効率的な学習に向けた代表データ集合の獲得
鈴木潤 (グーグル/東北大), 全炳河, 賀沢秀人 (グーグル)
ニューラル言語モデルは近年の自然言語処理タスクの根幹を担う基盤技術ですが,モデル構築には潤沢な計算リソースが必要になります.本論文では,ニューラル言語モデルを構築する際に,学習データを全て用いるのではなく,選択した代表的なデータ集合のみを用いて学習した場合に,性能を維持できるか否かを検証しています.実験によって,提案手法を用いることで,21分の1程度までに学習データを削減したとしても,全ての学習データを用いて学習した場合と比較して性能が維持できるということが示されました.本手法を用いることで,ニューラル言語モデルの構築を様々な研究者ができるようになると考えられ,有用性,発展性の高い研究であると言えます.これらの貢献から最優秀賞にふさわしいと判断しました.
*言語処理学会第28回年次大会 優秀賞(7件:発表番号順)
D1-4 状況別感情極性日本語辞書の作成とその活用
高田篤志 (東大), 狩野芳伸 (静大), 山ア俊彦 (東大)
既存の感情極性辞書は単語に対してポジティブかネガティブとラベル付けされているものか,いくつかのクラスカテゴリに単語を分類しているものが多いです.ところが,単語は文脈や状況によって様々な意味を持ち,異なる印象を与えることがあります.そこで,本論文では20種類の状況を設定し,各状況に対してクラウドソーシングを利用して感情極性ラベルを付与した日本語辞書SiSPを作成しています.そして,その辞書を用いることで極性予測の性能が向上することを実験で示しています.文脈を考慮した解析は言語処理において重要であり,また本辞書はオープンソースで公開予定としておりコミュニティへの貢献も大きいため,優秀賞にふさわしいと判断しました.
A2-5 Transformerを多層にする際の勾配消失問題と解決法について
高瀬翔 (東工大), 清野舜 (理研/東北大), 小林颯介 (PFN/東北大), 鈴木潤 (東北大/理研)
本論文は,Transformer の多層化において,Post Layer Normalization の学習の安定性向上に取り組んでいます.勾配に関する解析を通して,Transformerのオリジナルの構造での多層化における学習の不安定性は Layer Normalization による勾配消失であることを示し,層内のLayer Normalization を回避するためのResidual Connection を追加した B2T Connection を提案しています.機械翻訳での実験により,提案手法の有効性を示しています.実験的な合理化を入念に行い,最終的な実験でもその有用性を示しているという点でインパクトと完成度の高い研究です.今後のTransformerに大きな影響を与える可能性があると考えられることから,優秀賞にふさわしい論文と判断しました.
G2-3 IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法
前田航希, 金子正弘, 岡崎直観 (東工大)
本論文は,誤文と正文の組からなるパラレルデータのみを用い,修正の影響度を考慮しながら文法誤り訂正の評価尺度を学習する手法であるIMPARAを提案しています.具体的には,誤文と正文の組から,編集に対する影響度を算出し,訂正文の良し悪しに関する順序関係を学習するためのデータを作成します.そして,このデータから,自動的にラベル付けをする評価尺度を学習します.本手法は,実験により,人手評価との相関において既存手法と同等以上の性能を示すこと,評価対象となるコーパスが持つ訂正の特性を考慮した自動評価を行えることが示されています.文法誤り訂正タスクのデータセット作成コストの削減に大きく貢献する成果であり,自動採点等への適用など大きな可能性が期待されることから,優秀賞にふさわしい論文と判断しました.
E3-3 論述リビジョンのためのメタ評価基盤
三田雅人 (理研), 坂口慶祐 (Allen Institute for Artificial Intelligence), 萩原正人 (Earth Species Project/Octanove Labs), 水本智也 (フューチャー/理研), 鈴木潤, 乾健太郎 (東北大/理研)
本論文は,文書単位で論述の流れや一貫性・結束性に関する編集を行う論述リビジョンタスクを対象に,自動評価尺度の開発促進のためのメタ評価基盤を提案しています.メタ評価基盤は,論文に対して専門家がリビジョンをアノテーションしたデータセットと,編集事例毎の二値分類に基づくメタ評価手法によって実現しています.また,提案した基盤により,大規模言語モデルを用いて作成した評価尺度のメタ評価を行い,基盤の有用性を示しています.本研究は,自動評価尺度の開発,ひいては,論述リビジョンという挑戦的な課題に取り組む研究を促進するものです.これらの貢献と将来性に鑑みて,優秀賞にふさわしいと判断しました.
PT2-7 知識グラフ埋め込みにおける負例サンプリング損失の分析
上垣外英剛 (東工大), 林克彦 (群馬大)
本論文は,知識グラフ埋め込みの学習時にしばしば用いられる負例サンプリング損失に関して,その中で用いられるマージン項,負例サンプル数,サブサンプリング法の選択の意味付けを数式に基づく解釈にて提示しています.従来,これらの人手により選択するハイパーパラメータは,経験的な知見に基づいて選択されることがほとんどでした.そのため,実際に利用している設定が,具体的にどういった効果をもたらしているのかを深く理解することができていませんでした.それに対して,数式的な解析により導出される等価性などを根拠に具体的な意味付けを与えることで,利用者に一定の理解を提供することに成功しています.最近の自然言語処理分野において経験的な研究が多い中で理論的な解析に基づいて方法論を理解/分析しようという研究の考え方なども含めて,多くの後続研究の参考になることが期待されます.これらのことから優秀賞にふさわしい論文といえます.
E5-4 機械・人の双方が言語で概念を説明可能なFew-shot画像分類
西田光甫, 西田京介, 西岡秀一 (NTT)
本論文では,few-shot画像分類問題を題材に,機械学習モデルが新規の概念を自然言語の説明から獲得し,モデルの挙動を自然言語によって説明することに取り組んでいます.提案手法のLIDEは,テキストデコーダによる説明の生成と,テキストエンコーダによる説明の入力によってfew-shot画像分類の性能を改善することに成功しています.また,人間による説明をテキストエンコーダに入力することで性能がさらに向上することや,生成された説明の品質が画像分類の正否と相関を持つことも確認しており,多くの後続研究にとって重要な知見となることが期待されます.これらの貢献から優秀賞にふさわしいと判断しました.
D7-4 創発言語でもHarrisの分節原理は成り立つのか?
上田亮, 石井太河, 宮尾祐介 (東大)
本論文は,シミュレーションにおいてエージェント間で生じる人工的な言語である創発言語について,Harrisの分節原理が成り立つかを検証したものです.創発言語は近年注目を集めつつある研究対象で,創発言語においても自然言語の性質が観察されるかを検証する研究が行われるようになっていますが,Harrisの分節原理に着目したものはなく,新規性が認められます.分析の結果,創発言語はHarrisの分節原理が成立するためのいくつかの前提条件を満たすものの,統計的な情報から得られる分節境界が必ずしも意味的に妥当なものであるとは限らない可能性が示唆されました.自然言語の性質の多くが語や節などの単位を仮定して語られることを踏まえると,創発言語の上でも分節を定義しようとする試みは重要な一歩であり,優秀賞にふさわしいと判断しました.
*言語処理学会第28回年次大会 若手奨励賞(12 件:発表番号順)
C1-3 テキストと視覚的に表現された情報の融合理解に基づくインフォグラフィック質問応答
田中涼太 (NTT)
本論文は,言語と視覚の融合的な理解に向けて,情報を視覚的に表現した画像(インフォグラフィック)に対する質問応答モデルを提案しています.提案モデルの特長は,テキストと視覚物体の配置関係の学習,および算術演算理解のためのデータ拡張の2点です.これらの両方が質問応答の精度向上に貢献することを実験によって示すとともに,ICDAR 2021 CompetitionのInfographicVQAタスクにおいて優秀な成績を収めています.実用面での利活用も期待できることにも鑑みて,若手奨励賞にふさわしいと判断しました.
F2-5 Pre-trained Transformerによる引用文脈を考慮した引用ネットワーク埋め込み
大萩雅也 (東大)
本論文では,Pre-trained Transformerを用いて引用文脈を考慮したネットワーク埋め込みを作成する新たな手法を提案しています.ネットワーク埋め込みを作成するにあたり,Masked Paper Predictionという新しいタスクを提案し,加えて,Structure-Aware Cross-Entropy Lossという新しい損失関数も提案しています.評価実験の結果,既存手法に対して優位な結果を示しています.引用ネットワーク埋め込みという新しい取り組みを行っており,今後の発展も期待できることから,若手奨励賞に値すると判断しました.
E3-5 大学入学共通テスト試行調査における短答式記述答案の完全自動採点
岡知樹 (東大)
本論文は,大学入学共通テスト試行調査の国語の短答式記述問題を対象に,手書きで書かれた答案を完全に自動で採点するシステムの開発と評価について報告しています.畳み込みニューラルネットワークのアンサンブル学習による手書き文字認識モデルとBERTのファインチューニングによる自動採点モデルを組み合わせることで実現した提案システムを,約6万件の答案データを用いて評価・検証しています.大規模な現実のデータを用いて,現在の採点技術の可能性を具体的に示した本研究は,今後の研究開発の参照点となる有用なものであることから,若手奨励賞にふさわしいと判断しました.
G3-4 多言語文符号化器の言語表現と意味表現の分離に基づく機械翻訳の品質推定
黒田勇斗 (愛媛大)
本論文は,文表現から抽出した言語非依存の意味表現を用いて,機械翻訳の品質推定を行う手法を提案しています.教師なし品質推定では,多言語文符号化器により得られる文表現が言語の影響を強く受け,言語間の意味的類似度の推定が不正確になるという課題があります.これに対して,提案手法は,意味表現に言語固有の情報が含まれないように,敵対的学習を用いる点が特徴的です.WMT20の品質推定タスクにおける評価実験の結果,提案手法はベースラインの多言語文符号化器LaBSEを一貫して改善すること,また,特に少資源言語対においては他の複数のアプローチと比較しても高い性能を達成することが示されています.言語表現と意味表現を分離するというアイディアの有用性が示されており,今後の発展が期待できることから,若手奨励賞に値すると判断しました.
PH2-7 シフト付き絶対位置埋め込み
清野舜 (理研/東北大)
本論文は,Transformer における位置表現の改良に取り組み,入力系列の各位置インデックスを,乱数から生成したオフセットでシフトさせる,シフト付き絶対位置埋め込み(SHAPE)を提案しています.実験の結果,本手法が相対位置埋め込みと同等の性能を発揮しつつ,絶対位置埋め込みと同等の速度で動作することを示しています.位置埋め込みの後段の注意機構の改変を強制しない優れた手法であり,絶対位置とシフト不変性という両立しそうにない方向性に対してシンプルな方法でアプローチしている点は高く評価できます.評価・分析も十分なされており,論文としての完成度も高く,今後の位置埋め込みに影響を与える研究と考えられることから,若手奨励賞にふさわしいと判断しました.
PH2-8 線型部分空間に基づく学習済み単語埋込空間上の集合演算
石橋陽一 (NAIST)
本論文では,事前学習済み単語埋め込み空間において集合と集合演算を定義することに取り組んでいます.具体的には,線型部分空間に基づく集合演算である量子論理に着目し,埋め込み空間でも同様に線型部分空間が言語的な集合演算として機能することを示しています.実験では文の意味的類似性タスクにて提案法の有効性を検証しています.必ずしも単純なベースラインよりも顕著に高い効果が得られているわけではないですが,理論的裏付けを持つ方法論が十分な性能を示すことを実証しています.今後のさらなる発展も期待できる研究であることから,若手奨励賞に値する論文と判断しました.
A5-1 単語ベクトルの長さは意味の強さを表す
大山百々勢 (京大/理研)
本論文では,単語ベクトルの長さが意味の強さをエンコードすることについて分析しています.意味の強さとして,各単語の周辺単語分布とコーパス全体の単語分布のKullback-Leibler (KL)情報量を提案し,その補正値が品詞の違いを識別できることを実験により示しています.さらに,Skip-gram with Negative Samplingによって得られる単語ベクトルの長さがKL情報量,つまり意味の強さに相当することを理論的かつ実験的に示しています.分析結果は興味深く,また単語ベクトルは深層学習に基づく手法の基盤であり,今後の発展が期待できる研究であることから,若手奨励賞に値すると判断しました.
G5-2 Holographic EmbeddingsによるCCG構文解析
山木良輔 (立命館大)
本論文では,CCG構文解析の課題に対して,単語分散表現から句や文の分散表現を再帰的に構成し,文の構成要素間の依存関係を明示的にモデリングする手法を提案しています.具体的には,知識グラフをベクトル空間に埋め込むために提案されたHolographic Embeddingsを用いて,階層的な句の分散表現を得ています.実験では,特定の条件下では従来研究と比較して最も良い評価結果を示すなど,良好な性能を示しています.非常に独自性の高い研究に位置付けられ,また,実験結果も有望であり今後の発展も十分に期待できることから,若手奨励賞に値する論文と判断しました.
PH3-13 主観と客観の感情極性分類のための日本語データセット
宮内裕人 (愛媛大)
感情分析の先行研究は,感情極性 (Sentiment)・基本感情 (Emotion)・書き手の感情(主観感情)・読み手の感情(客観感情)といった様々な観点で行われてきています.本論文ではそれらを包括的に扱った先行研究は存在しないと指摘し,主観と客観の両方の立場から感情極性のラベルを付与した日本語データセットを作成しました.そして実験において,単一の感情のみが含まれるテキストよりも複数の感情が共起するテキストが,読み手にとって書き手の感情を読み取りやすいことを示しました.本データセットは一般公開されており,今後の感情分析に関する研究に大きく貢献すると考えられるため,若手奨励賞にふさわしいと判断しました.
PT4-3 日本語文法誤り訂正の流暢性評価に向けたデータ作成
木山朔 (都立大)
既存の日本語文法誤り訂正の評価データでは,文法に関する最小限の編集に基づき訂正文を作成しており,文法的ではあるものの流暢性に欠けることから,こうした評価データに依存してモデルを開発すると文法的かつ流暢な出力をするモデルが正当に評価されないという問題があります.本論文では,こうした状況を受け,Lang-8コーパスに含まれる学習者が書いた作文に対し,日本語母語話者5人が文法的に正しくかつ流暢性に配慮した訂正を行うことにより,日本語文法誤り訂正のための流暢性評価データを作成しました.これはモデルの流暢性も含めた評価を可能にする有効なデータであることから,若手奨励賞に値すると判断しました.
PT4-5 Teacher-Student学習を利用したラベル誤りを含むデータにおける固有表現認識の性能向上
田川裕輝 (富士フイルム)
本論文では,Teacher-Student学習を利用したラベルノイズを含む学習データでの固有表現認識の学習方法を提案しています.学習データに含まれるノイズが含まれることを前提に実験が行われており,加えて,ノイズ割合を変化させて評価を行うことで,提案手法の頑健性を示しています.また,他の手法とも比較しており,信頼性の高い結果となっています.信頼性・実用性の高さから,若手奨励賞にふさわしいと判断しました.
F8-3 マイクロブログからの消失エンティティの検知
赤崎智 (東大)
本論文では,死没・閉店といったエンティティの存在が実世界から無くなる「消失」という概念を定義しています.この「消失」の認識はトレンドの分析等において必要である一方,エンティティは消失しても言及され続けたり,長期間言及されていなくてもそれが消失ではなかったりするため,エンティティ辞書を用意して出現頻度を監視するという単純な方法ではうまくいかないとしています.そこで,本論文では,Twitterの大規模アーカイブから,消失エンティティを収集し,日英データセットを構築した上で,消失エンティティの自動検知手法の提案及び評価を行っています.新規性・独自性の高いタスクとデータセットを設計し,一定の性能を示すモデルも提案していることから,若手奨励賞にふさわしいと判断しました.
■言語資源賞
言語資源賞は,言語処理学会と言語資源協会(GSK)との共同事業であり,年次大会で発表され,優れた言語資源を作成したと認められる論文に対して与えられる賞です.論文投稿時に言語資源賞の審査を申し込むかどうかの自己申告の選択肢が設けられており,今大会では,92件の応募がありました.応募のあった論文をGSKの審査員が審査し,今大会では以下の2件が選出されました.GSKより公開されている授賞理由は以下の通りです.
E8-1 『日本語日常会話コーパス』の設計と特徴
小磯花絵, 天谷晴香, 石本祐一, 居關友里子, 臼田泰如, 柏野和佳子, 川端良子, 田中弥生 (国語研), 伝康晴 (千葉大), 西川賢哉, 渡邊友香 (国語研)
本論文は「日本語日常会話コーパス」を構築しています.このコーパスは,日常における様々な場面について,年齢・性別をバランスさせた40名の話者による会話を収録しています.コーパスの規模も大きく,会話時間は200時間,会話数は577,のべ話者数は1675名となっています.会話の音声データ,転記テキストに加え,会話の様子を撮影した映像データを含む点に特徴があります.転記テキストには,人手修正された短単位の形態素情報と自動付与された長単位の形態素情報がタグ付けされています.また,全体のうち20時間分の会話を抜粋したコアデータについては,人手修正された長単位の形態素,文節間の係り受け関係,談話行為,韻律の情報が付与されています.同コーパスは2022年3月に一般公開されます.日本語の日常会話を収録した豊富なアノテーションを含む大規模なコーパスであり,対話の研究に幅広く利用できる価値の高い言語資源であると言えます.
E8-4 JGLUE: 日本語言語理解ベンチマーク
栗原健太郎, 河原大輔 (早大), 柴田知秀 (ヤフー)
本論文は,英語のGLUEにならい,複数のデータセットからなる日本語の言語理解処理のベンチマーク JGLUEを構築しています.文書分類タスクについては,日本語の商品レビューにpositive,negativeの二値のラベルを付与した「MARC-ja」と,日本語容認性判断データセット「JCoLA」を含みます.文ペア分類タスクについては,2つの文の意味がどの程度等しいかを表す0〜5の実数値を付与した「JSTS」と,2つの文に対して含意,矛盾,中立の三値のラベルを付与した「JNLI」を含みます.質問応答タスクについては,機械読解タスクのデータセット「JSQuAD」と,常識推論能力を評価するための5択問題のデータセット「JCommonsenseQA」を含みます.既存の英語のデータセットを日本語に翻訳するのではなく,クラウドソーシングを用いて一から構築されています.JGLUEv1は2022年3月に公開される予定です.日本語の言語理解のための標準的なベンチマークとして利用され,研究分野全体の発展に貢献することが期待されます.
■スポンサー賞
スポンサー賞の選考は,各スポンサーに委ねられており,独自の視点でそれぞれ選出していただきました.今大会ではスポンサー5団体からそれぞれ1件の論文を選出していただき,合計5件の表彰をいたしました.各スポンサーから公開されている授賞理由は以下の通りです.
*LegalForce賞
A4-2 否定の理解へのprompt-based finetuningの効果
田代真生, 上垣外英剛, 船越孝太郎, 奥村学 (東工大)
本論文は,事前学習済み言語モデルを後段タスクに適用するいくつかの手法において,否定表現がどれだけ理解できているかを定量化して比較した論文です.否定表現は文書分類の分類結果など後段タスクの予測結果に大きく影響を与える要素の一つであり,実用上大事な観点であると考えています.論文中では,後段タスクにおける否定認識の影響を適切に分析できるようにAverage Data Point Advantageの指標を用いて様々な観点で比較を行っており,特にprompt-based finetuningによる手法が否定表現をより認識できていることを示しています.この実験結果は実用時に事前学習済み言語モデルを選択する際の有益な手がかりになるという点を評価し,スポンサー賞とさせていただきました.
*NEC賞
A4-5 四則演算を用いた Transformer の再帰的構造把握能力の調査
松本悠太 (東北大), 吉川将司 (東北大/理研), Benjamin Heinzerling (理研), 乾健太郎 (東北大/理研)
本研究は多くの自然言語処理で用いられるTransformerの再帰的構造をとらえる能力について,同じく再帰的構造を持つ形式的な四則演算を通して検証し,計算の途中結果が中間層において分散的にエンコードされていることを明らかにしています.単独の研究として優れているだけでなく,その結論はTransformerを用いた言語処理の応用を考える多くの人たちにも価値ある洞察を与えるであろう点を評価し,スポンサー賞に選考しました.
*サイバーエージェント賞
B3-2 後処理ネットワークを用いた強化学習によるタスク指向型対話システムの最適化
大橋厚元, 東中竜一郎 (名大)
一番の理由は,実務に近い課題設定なところです.弊社でもタスク指向型対話のシステムを運用しているんですが,パイプラインベースな手法だと部分最適になってしまう一方で,end-to-end な手法だと細かい制御ができないので,産業応用はまだ難しそうです.その点,この研究では強化学習で後処理することで,パイプラインベースな手法において全体最適を可能とし,タスク成功率を向上させました.例年通り,良い研究が多くて非常に迷いましたが,実働システムへの導入のしやすさだったり,高い汎用性からこの研究を選ばせていただきました.
*富士通賞
C4-3 Transformerモデルのニューロンには局所的に概念についての知識がエンコードされている
有山知希 (東北大), Benjamin Heinzerling (理研/東北大), 乾健太郎 (東北大/理研)
本論文は,言語モデルが穴埋め問題を解く際に,正答と対応関係のあるニューロン(Feed-Forward層の特定の重み)を探し,そのニューロンの活性度を変更することで正解率が大きく変化することを確かめています.特に品詞により局所性に違いがある可能性を示し,Transformerを用いたモデルの挙動の一端をあきらかにしています.弊社では推論の説明性,説明可能なAIの研究に取り組んでおり,関連する研究と考えスポンサー賞としました.
*Japan Digital Design賞
PH4-11 要約の生成過程を考慮した弱教師あり学習による生成型要約のエラー検出
高塚雅人, 小林哲則, 林良彦 (早大)
理由は3点あります.1つ目は,弊社の課題意識に近く,そこにチャレンジした研究だったことです.弊社でも文書自動生成に取り組んでおり,生成文の良し悪しの評価を重要と捉え,「記載内容が事実に基づいているか?根拠として記載すべき事象が網羅されているか?」など試行錯誤しております.受賞論文は,生成モデル側で同様の課題意識を持ち,チャレンジした研究だと評価しました.2つ目は,課題に対し,新規性のある手法で解決策を提示したことです.また,課題意識の説明から納得のいく手法と感じました.3つ目は,実験結果を見ても,既存研究に比べ精度向上が認められたことです.
■委員特別賞
委員特別賞は,「ある特定の観点で光る論文を拾い上げたい」「多様な論文に光を当てたい」「論文の完成度よりも将来性を重視したい」といった理念のもと,優秀賞・若手奨励賞とは異なる観点で優れた論文に与えられる賞です.優秀賞・若手奨励賞を受賞した論文を除外した上で,賞審査の項目点を基準として,委員特別賞選考委員により16件を選出しました.
B1-4 対話での共通基盤構築過程における名付けの分析
齋藤結 (電通大), 光田航, 東中竜一郎 (NTT), 南泰浩 (電通大)
【新規性】【将来性】の観点での評価
E1-1 拡張固有表現に分類された31言語のWikipedia知識ベース
関根聡, 中山功太, 野本昌子 (理研), 安藤まや (フリー), 隅田飛鳥, 松田耕史 (理研)
【将来性】の観点での評価
D2-5 Vaporetto: 点予測法に基づく高速な日本語トークナイザ
赤部晃一, 神田峻介 (LegalForce), 小田悠介 (LegalForce/東北大), 森信介 (京大)
【有用性】の観点での評価
F2-3 MioGattoによる数式グラウンディングデータセットの構築
朝倉卓人, 宮尾祐介 (東大), 相澤彰子 (NII)
【新規性】【将来性】の観点での評価
B3-2 後処理ネットワークを用いた強化学習によるタスク指向型対話システムの最適化
大橋厚元, 東中竜一郎 (名大)
【有用性】【将来性】の観点での評価
A4-1 確信度を考慮した言語モデルの関係知識評価
吉川和 (東工大/富士通), 岡崎直観 (東工大)
【有用性】の観点での評価
PT2-4 どれほどの統語的教示が必要十分なのか?
能地宏 (LeapMind), 大関洋平 (東大)
【有用性】の観点での評価
A5-5 Transformerにおけるフィードフォワードネットの作用
小林悟郎 (東北大), 栗林樹生 (東北大/Langsmith), 横井祥, 乾健太郎 (東北大/理研)
【新規性】【有用性】の観点での評価
E5-5 複数映像の抽象化を要するキャプション生成
高橋力斗, Chenhui Chu, 黒橋禎夫 (京大)
【新規性】 の観点での評価
C6-3 近傍の事例を用いた非自己回帰生成
丹羽彩奈, 高瀬翔, 岡崎直観 (東工大)
【有用性】の観点での評価
E6-4 動画タイトルを用いたサムネイル画像の自動選択手法の提案
嘉田紗世, 山野陽祐, 新美茜, 田森秀明, 小海則人 (朝日新聞社), 岡崎直観 (東工大), 乾健太郎 (東北大/理研)
【新規性】【有用性】の観点での評価
PT3-16 単語埋め込みを利用した商品に対するキーワードの予測
山口泰弘, 深澤祐援, 原島純 (クックパッド)
【有用性】の観点での評価
PH4-7 LSTMの無変化性バイアスの実験的分析
石井太河, 上田亮, 宮尾祐介 (東大)
【有用性】の観点での評価
PH4-12 曖昧性を含む翻訳に着目したマルチモーダル機械翻訳データセットの構築方法の検討
Yihang Li, 清水周一郎, Chenhui Chu, 黒橋禎夫 (京大)
【将来性】の観点での評価
PT4-11 JParaCrawl v3.0: 大規模日英対訳コーパス
森下睦, 帖佐克己 (NTT), 鈴木潤 (東北大), 永田昌明 (NTT)
【有用性】の観点での評価
D7-3 分散表現を用いたロマンス語同源語動詞の意味変化の分析
川崎義史, Maelys Salingre (東大), Marzena Karpinska (University of Massachusetts Amherst), 高村大也 (産総研), 永田亮 (甲南大)
【新規性】の観点での評価