言語処理学会ニュースレター

Vol. 28 No. 2 (2021年7月1日発行)

目次

2020年度論文賞の選考について
言語処理学会第27回年次大会(NLP2021)報告
言語処理学会第27回年次大会各種表彰について
言語処理学会第27回通常総会報告
言語処理技術セミナー2021について
言語処理学会第28回年次大会について

□ 2020年度論文賞の選考について

論文誌編集委員会 委員長 内山将夫(NICT)


2020年に出版された自然言語処理27巻1号から4号に掲載された論文31編より,編集委員会が賞に相応しい論文を推薦することを目標として,実施しました.選考は以下の手続きで実施し,一次投票は浅原正幸副編集長を選考委員長として内山将夫編集委員長および編集委員36名が,二次投票は荒牧英治渉外担当理事(編集委員兼務)を選考委員長として編集委員21名が,それぞれ選考委員会を編成して審査を行いました.


(1) 候補論文の決定:上記31編の論文のうち,査読点数が5点満点で4点以上の論文および担当編集委員から推薦のあった論文を候補論文とし,計22編の論文を一次投票の対象としました.


(2) 一次投票:選考委員37名が,22編の候補論文の中から,COI(※)を考慮して各自に割り当てられた約3編の論文を読んだうえで,10点満点で採点しました.一論文あたり5名の委員が審査し,高得点を得た上位4編の論文を選出しました.


(3) 二次投票:COIのない21名を審査員とする最終選考委員会を編成し,上位4編の論文を対象として,委員が全論文を読んだうえで,審査を行いました.そして,1編の論文を最優秀論文賞候補,3編を論文賞候補に推薦することを決しました.(最終的に理事会でこの推薦を承認頂き,論文賞を決定しました)


(最優秀論文賞)


栗林 樹生,大内 啓樹,井之上 直也,鈴木 潤,Paul Reisert,三好 利昇,乾 健太郎.論述構造解析におけるスパン分散表現.Vol.27 No.4, pp.753-779.


(論文賞)


Chunpeng Ma, Akihiro Tamura, Masao Utiyama, Eiichiro Sumita and Tiejun Zhao. Syntax-based Transformer for Neural Machine Translation. Vol.27 No.2, pp.445-466.


Shohei Higashiyama, Masao Utiyama, Eiichiro Sumita, Masao Ideuchi, Yoshiaki Oida, Yohei Sakamoto, Isaac Okada and Yuji Matsumoto. Character-to-Word Attention for Word Segmentation. Vol.27 No.3, pp.499-530.


Chunpeng Ma, Akihiro Tamura, Masao Utiyama, Tiejun Zhao and Eiichiro Sumita. Encoder-Decoder Attention ≠ Word Alignment: Axiomatic Method of Learning Word Alignments for Neural Machine Translation. Vol.27 No.3, pp.531-552.


以上,4編の論文については第27回年次大会で招待論文として講演いただきました.


※COIについて
以下の条件に一つ以上該当する委員は,当該論文の投票に参加せず,選考を実施した.
・著者である
・著者と現在同じ組織に所属している
・著者と過去1年以内に共同で研究している


□ 言語処理学会第27回年次大会(NLP2021)報告

第27回年次大会委員長 金山 博(大会担当理事・日本IBM)
同 プログラム委員長 鈴木 潤(東北大学)
同 実行委員長    須藤 克仁(NAIST)


○ 場所・期日
言語処理学会第27回年次大会は,北九州国際会議場(福岡県北九州市小倉北区)において以下の期日に開催されました.北九州市との共催で,開催にあたって北九州観光コンベンション協会様の協賛を受けました.


チュートリアル 2021年3月15日(月)
本会議     2021年3月16日(火)〜 18日(木)
ワークショップ 2021年3月19日(金)


現地会場への入場は運営者と講演者の一部に限らざるを得ず,事実上のオンライン開催となりましたが,部分的に現地のホールからの配信をするなど,今後のハイブリッド開催に繋がる形を作りました.また,第26回の緊急対応時と異なり、予定されていた全てのプログラムを実施することができました.


○ 参加状況
オンラインでの参加ができることもあり,参加者数は過去最大を数えました.今回より会期中の受付を廃止し,従来通りの事前登録に加え,前週まで受付を行う「直前登録」を導入し,登録と支払をオンラインで完結させました.


事前登録    891名
直前登録    185名
講師等の招待者  12名
スポンサー招待 425名

合計     1,513名


○ プログラム概要
■本会議 (3月16日 -- 18日)
一般セッション(口頭発表,ポスター),テーマセッション合わせて361件の投稿があり,その全てがオンラインで発表されました.
発表数の内訳は次の通り(カッコ内は前回通常開催時のNLP2019の件数)です.口頭発表,ポスター発表を同時に行うことにより,口頭発表の並列数を7から5に減らすとともに,休み時間を長めにするなどプログラムに余裕を持たせました.


・口頭発表(一般)        164件 (NLP2019:132件)
・口頭発表(テーマセッション)   12件 (NLP2019:56件)
・ポスター発表         183件 (NLP2019:210件)


■テーマセッション(3月16日・17日)
公募により設定された以下の2件のテーマセッションを開催しました.後述のワークショップの復活もあり,NLP2020(5件)と比べて開催数は減少しています。

・言語教育と言語処理の接点(発表6件+討論)
・翻訳プロセスの解剖と翻訳テクノロジー(発表6件+討論)


■招待講演(3月16日・17日) 下記の2名の先生をお招きし,招待講演を実施しました.
・水本 篤 先生(関西大学)
  言語教育が自然言語処理に期待すること

・松本 裕治 先生(理化学研究所)
  知識と言語処理


■招待論文講演 (3月18日)
会誌「自然言語処理」に発表された論文の中から選出された以下の4件の論文についての発表が行われました.

・Encoder-Decoder Attention ≠ Word Alignment: Axiomatic Method of Learning Word Alignments for Neural Machine Translation
  Chunpeng Ma, Akihiro Tamura, Masao Utiyama, Tiejun Zhao and Eiichiro Sumita
  Vol.27, No.3, pp. 531-552

・Character-to-Word Attention for Word Segmentation
  Shohei Higashiyama, Masao Utiyama, Eiichiro Sumita, Masao Ideuchi, Yoshiaki Oida, Yohei Sakamoto, Isaac Okada and Yuji Matsumoto
  Vol.27, No.3, pp. 499-530

・Syntax-based Transformer for Neural Machine Translation
  Chunpeng Ma, Akihiro Tamura, Masao Utiyama, Eiichiro Sumita and Tiejun Zhao
  Vol. 27, No.2, pp. 445-466

・論述構造解析におけるスパン分散表現
  栗林樹生, 大内啓樹, 井之上直也, 鈴木潤, Paul Reisert, 三好利昇, 乾健太郎
  Vol. 27, No.4, pp. 753-780


■チュートリアル (3月15日)
・ガウス過程と自然言語処理・持橋 大地 先生(統計数理研究所)
・NLPが目指すこと,心理言語学が目指すこと・広瀬 友紀 先生(東京大学)
・深層学習の理論・鈴木 大慈 先生(東京大学/理化学研究所)
・文献学への自然言語処理技術の応用 ―スペイン語文献を例にして―・川崎 義史 先生(東京大学)


■スポンサーイブニング (3月15日)
スポンサーと参加者との交流を目的として,昨年に続きスポンサーイブニングをオンラインで開催しました.学生を中心に200名を超える参加があり,スポンサーのブースの紹介に活用されました.


■懇親会(3月17日)
オンラインで開催し,のべ300名を超える参加者が集まりました.前半は8グループに分かれたリクリエーション,後半は懇談を行いました.


■ワークショップ(3月19日)
3年ぶりにワークショップの募集を行い,以下の4件の応募があり,いずれも予定通り実施されました.

・クリエイティブAIが会話型AIと出会うとき(When creative AI meets conversational AI)
・AI王 〜クイズAI日本一決定戦〜
・文章の評価と品質推定〜人間・機械の「作文」の巧拙をどう見極めるか?〜
・若手研究者交流のニューノーマルを考える


○ 新たな施策(抜粋)
・スポンサー賞・委員特別賞・さらに臨時の年次大会功績賞を新設し,選奨の幅を広げました.
・論文のスタイルファイルを公開し,執筆と審査の両面に寄与しました.
・会期中のSlackの利用を前回以上に促進し,非常に活発な交流が行われました.
・チュートリアル・招待講演の後に「質問部屋」を設置し,質疑応答・交流の機会を増やしました.


○ 総括
  おかげさまで第27回年次大会を盛況に開催することができました.昨年からのパンデミックの状況により,大会への参加どころか研究活動や各種ビジネスの遂行にも支障が出かねない中,議論や交流の場である大会が縮小することがなきよう,分野の関係者の関心を保ち続けることを念頭において準備を進めてきました.結果として,非常に多くの発表と企画,スポンサー,そして参加者を集めることができました.

  また,オンラインでの開催であっても,議論や出会いを促進し,参加者にとって特別な一週間となることを目標として工夫をしてきました.NLP2020の時に考案されたオンラインの環境がさらに整備され,Zoom の上で発表はスムーズに行われました.Slack は参加者の自己紹介やセッションの議論に活用されました.公式の懇親会に加えて,参加者により自発的に作られた場においても,雑談や研究コミュニティ形成が行われるなど,大会の期間にこそできる会話がなされたようです.こちらの目標も達成できたと考えています.

  こうして,NLP2020,NLP2021と,困難な状況の中であっても大会を開催し,自然言語処理に関係する人々が集まる大切な場所を保つことができました.言語処理学会の方法は他の学会からも参考にされているようです.これらの成功は,大きすぎず小さすぎない学会の規模によるものかもしれませんが,研究者自身がそれぞれ自分たちの活動の場所のために企画をしているという風土が感じられ,これは学会として誇れるものであると思っています.

  最後に,チュートリアルと招待講演の講演者の方々,論文の投稿・発表,またテーマセッションやワークショップの企画をしてくださった皆様,ご支援をいただいたスポンサー様ならびにご協賛をいただいた北九州市の関係者の皆様,準備をしてきた各委員会のメンバー(特に大会秘書の両名),業務委託先の各企業の皆様,そして大会を盛り上げてくださった参加者の皆様すべてに深く感謝いたします.来年以降もぜひご期待いただき,引き続き年次大会への投稿,企画やご支援,そしてご参加をご検討いただければ幸いです.

□ 言語処理学会第27回年次大会各種表彰について

第27回年次大会プログラム委員長 鈴木潤 (東北大学)


言語処理学会年次大会では,第2回年次大会(NLP1996)以降,大会賞を選出し表彰してきました.大会賞(現在は優秀賞と若手奨励賞)は大会の正規の賞として言語処理学会会長から贈られます.
また,第23回年次大会(NLP2017)から言語資源協会(GSK)と言語処理学会の共同表彰事業として,言語資源賞の選出および表彰をおこなってきました.こちらは,言語資源協会会長ならびに言語処理学会会長の連名で授与されます.
今大会では,新たな施策として「スポンサー賞」「委員特別賞」「年次大会功績賞」を新設しました.大会賞は言語処理学会会長から贈られるのに対して,スポンサー賞は大会スポンサーの中からスポンサー賞に賛同していただいたスポンサーから,委員特別賞および年次大会功績賞は年次大会の大会委員長から贈られる賞になります.優れた論文を積極的に評価していくために,次回大会以降も持続性のある選出方法へと改善しつつ毎年表彰していきたいと考えています.


■ 大会賞(優秀賞・若手奨励賞)
言語処理学会年次大会の大会賞には優秀賞と若手奨励賞があります.優秀賞は,年次大会において論文の内容が優れていると認められた発表論文に与えられる賞です.また,優秀賞のうち特に優れたものがあれば,最優秀賞として選定されます(言語処理学会年次大会優秀賞規定).同様に若手奨励賞は,年次大会において論文の内容が優れていると認められた発表論文に関して,以下の条件を満たす著者に与えられる賞です(言語処理学会年次大会若手奨励賞規定).


・年次大会の開催年の4月1日において満30歳未満のもの
・当該論文の筆頭著者であること
・過去に若手奨励賞を受賞していないこと
・ある論文が優秀賞を受賞する場合は,その論文の筆頭著者は若手奨励賞の対象とはならない


また,優秀賞(最優秀賞)は発表論文に対する賞であり,若手奨励賞は著者個人に贈られる賞という違いがあります.


近年の年次大会と同様に,今大会においても大会の開始前に全論文を対象に審査を行い,大会賞を決定し,大会のクロージングにて表彰しました.


大会賞の選考のための内規では,


・優秀賞は全発表件数の約2%を目安とする
・優秀賞の中で特に評価の高いものを0件から2件の範囲で最優秀賞とする
・若手奨励賞は最大10件程度を目安に選出する


としております.


今回の年次大会では361件(前回396件)が優秀賞の対象となる論文であり,優秀賞の授賞件数は全体の2%にあたる7〜8件を目安としました.また若手奨励賞の対象となる論文は247件(前回269件)でした.


年次大会優秀賞・若手奨励賞の選考にあたっては,選考委員会を組織し,慎重な議論を重ねた上で選定を行いました.今回,選考委員会は計227名(前回213名)で構成されました.各授賞論文には議論で合意された授賞理由が付記されます.授賞の最終的な責任はプログラム委員長の鈴木が負います.


大会賞の選考は「論文審査」と「最終選考」の二段階で行いました.論文審査に先立ち,投稿カテゴリにより全ての論文を5つのグループ(A, B-1, B-2, C-1, C-2)に分けました.グループ毎に,そのグループの研究分野を専門とする選考委員を各論文に対し5名割り当て,審査を行いました.審査委員はそれぞれ6?9件の論文を担当し,各論文に対して,総合評価(6段階),新規性(5段階),有用性(5段階),読みやすさ(5段階)の観点から審査しました.この際,優秀賞に推薦する論文については推薦理由を記述するようお願いしました.また,若手奨励賞の対象論文については,同賞に推薦するかについても6段階で審査を行い,同様に推薦理由の記述をお願いしました.


論文審査終了後,最終選考を行いました.選考委員は,鈴木潤(東北大;プログラム委員長),河原大輔(早大;副プログラム委員長),白井清昭(北陸先端大;前プログラム委員長),斉藤いつみ(NTT;大会賞担当プログラム委員)の4名です.最終選考では,原則として,論文審査において審査員が与えた総合評価の点数の高い論文を授賞論文として選びました.4名の最終選考委員のうち,授賞のボーダーライン付近にCOIのある論文があったときは,COIのない選考委員で授賞論文を決めました.


最終選考では,まず優秀賞を決定しました.最初に,審査員による評価点のばらつきを抑えるために,一般化線形混合モデルを用いて総合評価の点を補正しました.次に,補正後の評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,授賞の目安とした上位8件の論文を優秀賞として選びました.次に,これら8件のうち,補正後の総合評価の点数の2位と3位の論文の間に比較的大きな差があったことから,上位2件の論文を最優秀賞として選びました.


次に,若手奨励賞を決定しました.優秀賞受賞論文ではなく,かつ若手奨励賞の受賞資格を満たす論文について,若手奨励賞の総合評価の点数を同様に一般化線形混合モデルを用いて補正しました.補正後の評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,上位11件の論文を若手奨励賞として選びました.若手奨励賞の授賞件数の目安は最大10件ですが,補正後の評価点が10位と11位は僅差でボーダーラインを入れることが難しいという点,若手奨励賞の対象論文数が近年増加傾向にあり,11件は対象論文の4.5%で授賞の乱発には当たらないことから,今回は11件に対して若手奨励賞を授賞することとしました.


以下は,最優秀賞,優秀賞,若手奨励賞の論文とその授賞理由です.


* 言語処理学会第27回年次大会 最優秀賞 (2件:発表番号順)


A5-1 VisualMRC: 文書画像に対する機械読解
田中涼太, 西田京介, 吉田仙 (NTT)


本論文は,言語と視覚の融合的な理解に向けて,ウェブ文書のスクリーンショット画像(文書画像)に対する機械読解タスク,データセット,およびモデルを提案しています.タスク自体が新しいことに加え,構築したデータセットは1万画像,3万質問からなるものであり,本タスクの学習,評価に十分用いることができる規模となっています.実サービスでは,テキストではなく,このような文書画像のみが手に入ることが多くあり,実用面での利活用も期待できることから,最優秀賞にふさわしいと判断しました.


P5-2 Recurrent neural network grammar の並列化
能地宏 (産総研), 大関洋平 (東大)


本論文では,既存の Recurrent neural network grammar (RNNG) の高速化に取り組んでいます.昨今のDNNによる方法論で良い性能を得るには,大量のデータを高速に処理することが必須であり,ミニバッチによるGPU上での並列処理がその中心的な役割を担っています.しかし,構造情報を持つデータの場合はミニバッチ処理との相性が悪く,高速な学習を実現することが困難でした.本論文では,構造の情報をミニバッチ処理に適した形に分解することでGPU上での並列化を容易にする方法論を提案しています.実験において,最大で6倍速程度の高速化に成功し,また,その効果として,これまでより大きなコーパスでの実験を行いRNNGに関する新たな知見も提供しています.分野全体が抱えていた潜在的な問題を解消する指針を示し,また,文構造を考慮した言語モデルの有用性を大きく引き上げる,最優秀賞にふさわしい素晴らしい成果だと判断しました.


* 言語処理学会第27回年次大会 優秀賞 (6件:発表番号順)


P4-6 児童作文の評価に向けた脱文脈化観点からの検討
田中弥生 (神大/国語研), 佐尾ちとせ (関西学院千里国際中等部・ 高等部), 宮城信 (富山大)


本論文は,児童の作文のテーマと学年による違いを脱文脈化程度の観点からどのように捉えられるかを検討した論文です.具体的には修辞ユニット分析の分類法を用いて,修辞機能と脱文脈化指数の現れ方を丁寧に分析しています.そして,作文と脱文脈化の位置づけが,言語で思考することと認識することとの関係で示されています.今後の研究の発展により,言語が使えるとはどういうことかという本質的な問題へのアプローチも期待できることから,優秀賞にふさわしい論文といえます.


B5-1 関連タスクの予測確率分布を用いるsoft-gatedBERTによる対話印象分類
竹下智章, 上垣外英剛, 船越孝太郎 (東工大), 高村大也 (東工大/産総研), 奥村学 (東工大)


対話印象分類のタスクにおいて,対話印象と対話破綻との関係性に着目し,対話破綻検出タスクにおける予測確率分布を用いて印象分類を行う手法を提案しています.こうした関連するタスクの利用はマルチタスク学習などで一般的であるものの,一方のタスクの予測結果をもう一方のタスクの予測に用いることで,関連するタスクのデータをうまく活用できている独創性があります.また,手法自体が様々な関連タスクの組み合わせに適用できる可能性があり,汎用性の高さについても評価できることから優秀賞にふさわしいと判断しました.


A7-1 単語埋め込みの確率的等方化
横井祥 (東北大/理研), 下平英寿 (京大/理研)


本論文は,単語埋め込み空間の歪みを,単語頻度に基づいて補正する新しい手法を提案しています.具体的には,まず既存手法において単語頻度の一様性を暗黙的に仮定していたという問題点を指摘した上で,等方性を評価する新しい尺度である正規化エントロピー,当方性を修正する新しい手法である方向白色化を提案し,原点中心性,等方性,単語類似度タスク,文類似度タスクに基づいて実験を実施し,提案手法の有効性を経験的に示しています.また,静的な単語埋め込みに対する既存手法の悪影響や,動的な単語埋め込みへの拡張など,今後の研究の発展も期待されることから,優秀賞にふさわしいと判断しました.


A7-3 単語埋め込みの決定的縮約
仲村祐希 (東北大), 鈴木潤, 高橋諒, 乾健太郎 (東北大/理研)


本論文は,1次元 K平均法と主成分分析を組み合わせた決定的アルゴリズムを用いて,単語埋め込みに対する離散符号の獲得手法を提案しています.従来手法では,得られる離散符号は乱数のシードによって異なるという特徴がありましたが,提案手法は離散符号を決定的に獲得することができるため再現性に優れています.また,得られた離散符号に適した効果的な基底ベクトルの合成方法も合わせて提案しています.実験結果から,得られた離散符号が元の単語ベクトルの情報を十分に保持していることや,機械翻訳タスクにおいてより高い圧縮率で既存手法と同等の精度を達成できることなどを示しています.今後の研究の発展も期待されることから,優秀賞にふさわしい論文といえます.


A7-4 階層コード表現を用いた上位下位関係の識別
水木栄, 岡崎直観 (東工大)


本論文は,学習済み単語分散表現を階層性を備えたコード表現に変換して,単語ペアの上位下位関係らしさを計量する方法を提案しています.特に,これまで独立に研究されてきた言語資源から得られる意味関係を用いた分散表現学習方法と順序関係のベクトル空間への埋め込み方法に着目し,両者の長所を組み合わせて提案手法に取り入れている点が特徴です.提案手法によって得られたコード表現を用いた性能評価実験を通して,上位下位関係分類タスクにて既存手法を上回る結果を報告するとともに,誤りの傾向についても詳細に分析しています.今後の研究の発展も期待されることから,優秀賞にふさわしい論文といえます.


B9-4 共同図形配置課題における対話の共通基盤構築過程の分析
光田航, 東中竜一郎 (NTT), 大賀悠平 (筑波大), 杵渕哲也 (NTT)


本論文は,対話における共通基盤構築をモデル化する方法を提案しています.まず,二名の作業者が互いに対話しながらブラウザ上で独立に図形を配置する共同図形配置課題を設定し,平均28.8発話からなる984対話を収録しています.この際に作業中の図形配置を記録し,図形配置間距離(任意の二図形間で定義されるベクトルの差の距離の総和)を測ることで共通基盤を定量化します.対話ログを分析し,共通基盤が構築される過程を5つのクラスタに分類し,それぞれについて共通基盤の構築が進む様子を可視化しています.共通基盤構築のモデル化は対話システムにおける重要な課題の一つであり,その最初のステップとして共通基盤を定量化する試みは興味深いものです.今後の研究の発展も期待されることから,優秀賞にふさわしい論文といえます.


* 言語処理学会第27回年次大会 若手奨励賞 (11件:発表番号順)


E1-4 日本語文法誤り訂正におけるデータ増強および評価データ構築
加藤秀佳 (同志社大)


本論文は,日本語文法誤り訂正が抱える「学習に利用できるデータ不足」と「評価データの不十分性」という2つの課題に取り組んだ論文です.前者には訂正前と訂正後の両方の疑似データを生成することで対処し,後者にはBCCWJを用いて複数のドメインに対する複数の種類の誤りを付与したコーパスを構築することで対処しています.興味深い考察が行われており,今後の発展も期待できる研究であるため若手奨励賞に値すると判断しました.


C2-4 再帰的ニューラルネットワーク文法による人間の文処理のモデリング
吉田遼 (東大)


本論文は,LSTM,top-downの再帰的ニューラルネットワーク文法(RNNG),left-cornerのRNNGの3つの言語モデルの日本語の認知的妥当性を検証しています.RNNGは文の階層構造を考慮したモデルである点がLSTMと異なります.検証実験では,視線計測コーパスを用いてテキストの読み時間を推測する回帰モデルの性能を測り,言語モデルを説明変数に加えたときの改善度によって言語モデルの認知的妥当性を評価しています.left-corner RNNGが最も認知的に妥当であること,LSTMは言語モデリング精度(perplexity)は高いが認知的妥当性は必ずしも高くないことなど,いくつかの興味深い結果が報告されています.先端的な手法を用いて実験的検証を完遂している点に価値があり,研究者としての将来性の観点から若手奨励賞にふさわしいと判断しました.


D3-2 後段モデルの損失値を用いた単語分割のタスクへの最適化
平岡達也(東工大)


本論文は,対象とするタスクに応じて適した単語分割を学習過程で自動的に決定する方法論を提案しています.具体的には,対象とするタスクを学習する際に用いる損失関数の値を用いて,モデルの最適化と,単語分割の最適化を同時に学習する方法です.本質的には相性の悪いDNNの学習と単語分割という離散最適化の問題を同時に解くために,N-best候補への限定,スムージング,語彙の制限等の様々な工夫を用いて実現しており,目的を達成するために多くの試行錯誤をしてより良い結果を得るための努力が見られます.また,エンコーダとデコーダで単語分割法を変えることで機械翻訳の性能に違いが見られるといった興味深い調査結果も示しています.このように論文としての完成度も高く若手奨励賞に値する成果と判断しました.


B5-4 潜在変数の投機的サンプリングに基づく多様な雑談応答生成
佐藤翔悦 (東大)


対話モデルにおける雑談応答生成において多様性を確保するという目的から,条件付き変分オートエンコーダ(CVAE)を用いた対話モデルにおける潜在変数の投機的サンプリングという手法を提案しています.CVAEで用いられる潜在変数のサンプリングを学習時に行い,最も損失関数が良かったサンプルを学習に用いるというシンプルな手法ながら,評価において十分な有効性が示されています.CVAEを用いた既存の生成における問題点を注意深く考察した上で適切な問題解決が行われており,また評価・考察も丁寧に記述された完成度の高い論文であることから,若手奨励賞として推薦しました.


P5-9 疑似正解データを利用した修辞構造解析器の改善
小林尚輝 (東工大)


本論文は,修辞構造解析器を改善するため,擬似正解データを利用した新しい手法を提案しています.具体的には,まず修辞構造解析器を訓練するための正解データが少ないという問題点を指摘した上で,正解データに基づいて訓練された解析機を複数用意し,それらの解析結果で共通する部分木を抽出して擬似正解データを作成しています.そして,擬似正解データに基づいて事前学習・正解データに基づいて追学習した解析機を訓練し,実験によって提案手法の有効性を経験的に示し,核性・関係ラベル両者を対象にした評価では世界最高性能を達成しています.また,構造解析全般に応用できる可能性がある点でも将来性があり,若手奨励賞にふさわしいと判断しました.


B6-3 トピック文生成による教師なし意見要約
磯沼大 (東大)


教師なしでの意見要約を作成するため,要約を構成するトピックと,そのトピックに対応する要約の詳細さに着目した手法を提案しています.具体的には,テキストのトピックを木構造で推定した上で,根から葉に近づくに従って記述内容が詳細化されたトピック文が生成されるという過程を,再帰的混合ガウス分布を用いたモデル化によって表現しています.教師なし要約作成問題について意見要約の性質を適切に利用しようとする優れたモデルであり,今後の発展が大いに期待されることから若手奨励賞として推薦しました.


A7-2 Transformerの文脈を混ぜる作用と混ぜない作用
小林悟郎 (東北大)


本論文は,Transformerに対し注意機構に加えて残差結合と層正規化を考慮して「混ぜ合わせの強さ」を分析する方法を提案しました.これまでBERTなどのTransformerの分析においては「混ぜる作用」である注意機構の働きが盛んに扱われてきましたが,本研究では「残す作用」である残差結合や,層正規化にも着目してBERTの分析を行いました.この結果,各層において混ぜる作用ではなく残す作用が支配的であることを明らかにしました.また,BERTの各層において混ぜる作用がどの程度の割合で起きているかについても興味深い考察を行っています.今後の発展が期待できる研究であることから,若手奨励賞に値する論文と判断しました.


C7-3 BERTを用いたTable-Fillingによる固有表現抽出と関係抽出
Youmi Ma (東工大)


本論文は,固有表現と固有表現間の関係の同時抽出に取り組み,Table-Fillingに基づく新たなニューラルアーキテクチャを提案しています.本提案によって,従来手法の抱えている特徴量選択とデコーディング順序に関する困難を緩和しています.評価実験を通して,最先端の手法と同等またはそれを上回る予測性能を記録しています.今後のさらなる発展も期待できる研究であることから,若手奨励賞に値する論文と判断しました.


D8-1 画像と単語の不一致を考慮した疑似教師ありキャプション生成
本多右京 (NAIST)


画像からキャプションを生成するタスクにおいて,アノテーションコスト削減のため,人手でアノテーションされた画像とキャプションのペアを用いない方法がこれまでに提案されています.これらの方法では,画像から検出された物体名を含む文を疑似キャプションとして学習しますが,疑似キャプションには画像と対応しない記述が多く存在するという問題がありました.本論文では,この問題に対処するために,疑似キャプションにおいて画像と対応しない箇所を教師信号として用いない新しい方法を提案しています.実験により,提案手法,および提案手法と既存手法の組合せの有効性が示されています.研究者としての将来性に鑑みて若手奨励賞に値すると判断しました.


P8-21 相互情報量最小化による例文に基づく制御可能な言い換え生成
杉浦昇太 (東大)


本論文は,利用者が例文を用いて言い換えのスタイルを制御可能な言い換え生成の手法を提案しています.具体的には,言い換えの対象となる入力文の意味をなるべく保持しながら,別途ユーザが指定した例文になるべく近いスタイルとなるような言い換えを行うモデルを提案しました.また,相互情報量に基づく損失関数を導入することで,文のスタイルに関する情報のみを抽出することを試みています.ユーザが制御可能な文生成技術という重要なトピックに取り組んでいるとともに,今後の発展が期待できる研究であることから,若手奨励賞に値する論文と判断しました.


E9-2 定理証明に基づく対話的な自然言語推論システム
隅田敦 (東大)


本論文は,計算機と人間のインタラクションによって自然言語推論(ある文から別の文が帰結するか否かを判定するタスク)を行う手法を提案しています.推論には形式意味論と定理証明器に基づいたシステムを用い,ユーザが証明に必要な知識を補完します.具体的には,証明したい命題をサブゴールに分解し,サブゴールを自然言語に変換してユーザに提示します.ユーザはそれが成立する,しない,どちらでもない,のいずれかを選択し,その結果から補うべき命題を生成します.評価実験では,ユーザとの対話によって高い適合率を維持しながら再現率が大きく向上したことが示されています.対話によって証明に必要な公理を生成するというアプローチは興味深く,今後の発展が期待できる研究であることから,若手奨励賞に値する論文といえます.


■ 言語資源賞
言語資源賞は,論文投稿時に言語資源賞の審査を申し込むかどうかの自己申告の選択肢が設けられており,今大会では,76件の応募がありました.応募のあった論文をGSKの審査員が審査し,今大会では以下の2件が選出されました.
GSKより公開されている授賞理由は以下の通りです.


P7-10 ビジネスシーン対話対訳コーパスの構築と対話翻訳の課題
中澤敏明, 李凌寒, Matiss Rikters (東大)


本論文は日英ビジネスシーン対話対訳コーパスを構築しています.6つのビジネスシーン(対面対話,電話応対,雑談,会議,研修,プレゼン)を想定し,日本語または英語の対話のシナリオをシナリオライターが執筆し,それを人手で英語または日本語に翻訳することで,日英・英日対訳コーパスを構築しています.日英・英日あわせて,シナリオの数はおよそ80,文数は2400となっています.コーパスの構築手順が丁寧に説明されており,品質管理が十分に行われていることが窺えます.また,このコーパスは評価型ワークショップ WAT 2020(Workshop on Asian Translation 2020) の翻訳タスクでも使用され,論文ではその結果ならびに誤り分析による対話翻訳の課題の考察についても報告しています.同コーパスの一部は既に公開されています.既存の対訳コーパスは書き言葉が中心で,話し言葉,特に対話の対訳コーパスは稀少であり,価値の高い言語資源と言えます.


E8-3 日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良
田中佑, 村脇有吾 (京大), 河原大輔 (早大),黒橋禎夫 (京大)


本論文は, Wikipedia の編集履歴から日本語入力誤りデータセット JWTD v2(Japanese Wikipedia Typo Dataset version 2) を自動構築しています.このデータセットでは,誤りのタイプとして誤字,脱字,衍字,転字,漢字誤変換の5種類が想定され,これらの誤りを含む文とそれを訂正した正しい文が約70万組収録されています.Wikipedia の編集履歴から,誤りを含む可能性のある文と編集後の文(正しい文)の組をマイニングし,品詞・形態素解析,リダイレクトデータ,事前学習済みBART言語モデルを用いたフィルタリングによって誤り訂正前後の文の組を獲得します.さらに,JWTD v2 を用いて入力誤りを訂正するモデルを学習し,その精度が十分に高いことを実験により確認しています.日本語の入力誤りを含むデータセットとしては他に類を見ないほど大規模なものであり,特に深層学習に基づく日本語の誤り訂正の研究に役立つ重要な言語資源であると言えます.


■ スポンサー賞
スポンサー賞の選考は,各スポンサーに委ねられており,独自の視点でそれぞれ選出していただきました.今大会では5社のスポンサー企業からそれぞれ1件の論文を選出していただき,合計で5件の表彰をいたしました.
各スポンサーから公開されている授賞理由は以下の通りです.


* 富士通賞
D9-2 言い換えラティスを用いたテキスト生成の性能改善
西原大貴 (阪大), 梶原智之 (愛媛大), 荒瀬由紀 (阪大), 藤田篤 (NICT)


本論文は入力文の語句の言い換えを考慮して,入力文をラティスとして表現するテキスト生成モデルの提案しており,実験によって機械翻訳での有効性を示しています.
また非専門家でも構築可能な知識を組み込むことができ,運用時のカスタマイズ性がseq2seqよりも優れている点が特に実用面において評価できます.


* LegalForce賞
E9-2 定理証明に基づく対話的な自然言語推論システム
隅田敦 (東大), 峯島宏次 (慶應大), 宮尾祐介 (東大)


本論文は,定理証明器を活用して自然言語推論のタスクに取り組む研究です.
しかし,証明に必要な公理を事前に網羅することは難しく,著者らは人間と計算機の間の対話的なやり取りを通して,必要な公理を獲得しながら証明を行う枠組みを提案しています.
特に提案手法について,自動で公理を獲得するのではなく人手を介することで誤った公理が混入するリスクを減らし,適合率を保ちながら再現率を向上している点で,定理証明器を活用するメリットを残しながら性能向上しています.
また,実際のアプリケーションの観点からも,サブゴールに関するユーザーとシステム間のインタラクションは自然言語でのやりとりを行うというインターフェース面も考慮されています.
以上の点を評価し,スポンサー賞とさせていただきました.


* デンソーアイティーラボラトリ賞
A7-3 単語埋め込みの決定的縮約
仲村祐希 (東北大), 鈴木潤, 高橋諒, 乾健太郎 (東北大/理研)


選考理由は下記の通りです.
・決定的アルゴリズムによる一貫性のある単語埋め込みベクトルの離散化を実現
・高速かつ安定で,元のベクトル表現の性質も保持
・アルゴリズムとしては単純だが非常に実践的かつ効果的


* サイバーエージェント賞
B6-4 指定語句を確実に含む見出し生成
山田康輔 (名大/朝日新聞社), 人見雄太, 田森秀明 (朝日新聞社), 岡崎直観 (東工大), 乾健太郎 (東北大/理研)


弊社においても広告文生成を行っているプロダクトがあり, 実務環境においても特定のキーワードを含んだ文生成が非常に課題になります.
今回の提案手法では, 既存の手法であるTransformerをうまく改良し, 指定の語句を中心に前後方向に文生成をするといった方法をとっており, まさにコロンブスの卵的発想でした.
また, 特定のキーワードを確実に含めた上でRougeが先行研究と比べて遜色ない点も受賞の理由となります.


* Sansan DSOC賞
C8-3 辺編集による文書レベルの関係グラフ構築
牧野晃平, 三輪誠, 佐々木裕 (豊田工大)


本論文は, 文書内の用語間の関係をグラフ構造として取り扱い, 他システムが出力したグラフに対して辺の編集という形で加工するモデルを提案し, その有効性を示した研究となります.
ここで他システムというのはルールベース手法であり, 辺の編集を行うモデルによりルールベースのクラスごとの性能のばらつきを軽減しています.
また, モデルが辺の編集を行う際の距離についての関係を確認しており, グラフとして取り組む有用性を示しています.
文書解析の需要が高まる中, 研究の発展や展開に期待を込めて, Sansan DSOC 賞にふさわしい論文と判断いたしました.


■ 委員特別賞
委員特別賞は,「ある特定の観点で光る論文を拾い上げたい」「多様な論文に光を当てたい」「論文の完成度よりも将来性を重視したい」といった理念のもと,大会賞とは異なる観点で優れた論文を表彰する試みです.大会賞を受賞した論文を除外した上で,大会賞の審査の項目点および座長による発表に対する評価を基準として,委員特別賞選考委員により14件を選出しました.


A1-4 極座標を用いた階層構造埋め込み
岩本蘭 (慶應大), 小比田涼介, 和地瞭良 (日本IBM)
【発表形式】の観点での評価


C2-3 予測の正確な言語モデルがヒトらしいとは限らない
栗林樹生 (東北大/Langsmith), 大関洋平 (東大/理研), 伊藤拓海 (東北大/Langsmith), 吉田遼 (東大), 浅原正幸 (国語研), 乾健太郎 (東北大/理研)
【新規性】【発表形式】の観点での評価


D2-4 歌詞のサビ区間検出手法
渡邉研斗, 後藤真孝 (産総研)
【新規性】【発表形式】の観点での評価


P2-14 オンライン百科辞典を対象とする有効期限切れ情報データベースの作成
土屋雅稔, 横井康孝 (豊橋技科大)
【有用性】【発表形式】の観点での評価


D4-3 項目採点技術に基づいた和文英訳答案の自動採点
菊地正弥, 尾中大介, 舟山弘晃, 松林優一郎, 乾健太郎 (東北大/理研)
【有用性】【発表形式】の観点での評価


P4-16 知識グラフ埋め込み学習における損失関数の統一的解釈
上垣外英剛 (東工大), 林克彦 (群馬大)
【新規性】の観点での評価


A5-4 オープンドメイン質問応答における解答可能性判別の役割
鈴木正敏 (東北大/理研), 松田耕史, 大内啓樹 (理研/東北大), 鈴木潤, 乾健太郎 (東北大/理研)
【有用性】の観点での評価


A6-3 単語埋め込みによる論理演算
内藤雅博 (京大), 横井祥 (東北大), 下平英寿 (京大)
【新規性】の観点での評価


B6-4 指定語句を確実に含む見出し生成
山田康輔 (名大/朝日新聞社), 人見雄太, 田森秀明 (朝日新聞社), 岡崎直観 (東工大), 乾健太郎 (東北大/理研)
【有用性】の観点での評価


D8-4 視覚と言語によるナビゲーション課題への言語に対応付けられた生成的な方策
栗田修平 (理研/JST), Kyunghyun Cho (NYU/CIFAR)
【新規性】【発表形式】の観点での評価


E8-3 日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良
田中佑, 村脇有吾 (京大), 河原大輔 (早大), 黒橋禎夫 (京大)
【新規性】【有用性】の観点での評価


P8-11 動的な環境における基盤化タスク設計の試み
宇田川拓真 (東大), 相澤彰子 (NII)
【発表形式】の観点での評価


P8-16 翻訳精度に基づく固有名詞の翻訳手法の研究
高井公一 (NAIST), 服部元, 米山暁夫 (KDDI 総合研究所),安田圭志, 須藤克仁, 中村哲 (NAIST)
【有用性】の観点での評価


B9-1 対話システムの矛盾応答の生成に対する脆弱性の分析
佐藤志貴 (東北大), 赤間怜奈 (東北大/理研), 大内啓樹 (理研), 鈴木潤, 乾健太郎 (東北大/理研)
【有用性】【発表形式】の観点での評価


■ 年次大会功績賞 年次大会を開催/運営するに際して,特別に貢献の大きかった人物に感謝を伝えるために新設した賞になります.本賞は,毎年誰かに授与するといった方式ではなく,表彰するに値する事があった場合にのみ適用される賞です.
今大会では以下の2名を表彰しました.


NLP2020におけるオンライン開催緊急対応に対する貢献
白井清昭 (北陸先端大)


投稿論文用フォーマット/スタイルファイル作成に対する貢献
朝倉卓人 (東大)


□ 言語処理学会第27回通常総会報告

総務担当理事 鶴岡慶雅(東京大学)


日時: 2021年3月16日(火)11:33〜11:58
場所: 北九州国際会議場 11会議室
出席者: 代議員29名(内,書面による議決権行使者22名), 理事15名, 監事2名


■第1号報告 2020年度事業報告
資料「第27回通常総会」に基づき,2020年度の事業内容が報告されました。


■第1号議案 2020年度決算報告
資料「第27回通常総会」に基づき,2020年度の決算報告があり,その内容が承認されました。


■第2号報告 2020年度監査報告 資料「第27回通常総会」に基づき,2020年度の監査の結果,会計監査,業務監査ともに問題のないことが報告されました。


■第3号報告 2021年度事業計画
資料「第27回通常総会」に基づき,2021年度の事業計画が報告されました。


■第4号報告 2021年度予算案
資料「第27回通常総会」に基づき,2021年度の予算案が報告されました。


■第5号報告 2021年度代議員構成
資料「第27回通常総会」に基づき,2021年度の代議員の一覧が報告されました。


□ 言語処理技術セミナー2021について

言語処理学会では,2018年より「言語処理技術セミナー」を開催しています.
今年は,「言語生成の技術とサービス」と題し,近年目覚ましい進歩を遂げている言語生成技術に焦点をあてて,現状技術の俯瞰と実際のサービスでどのような技術が活用されているかを学ぶためのセミナーを企画いたしました.
言語処理学会会員の方の聴講は無料ですが参加登録が必要です.参加登録は9月ごろに開始する予定です.詳細が決まり次第,以下のホームページに記載します.
多くのご参加をお待ちしております.


「言語処理技術セミナー2021 言語生成の技術とサービス」
ホームページ:https://sites.google.com/site/nlpseminarweb
日時:10月22日(金)10:30〜16:35
会場:Zoomによるオンライン開催


参加費:言語処理学会会員 無料
言語処理学会非会員
    学生  4,000円(税込)
    一般  15,000円(税込)
※今回新たに言語処理学会の会員に申し込みされた場合でも会員価格(聴講無料)が適用されます.


講演内容:
・「言語生成研究の俯瞰」
    高村 大也先生(産業総合技術研究所)
・「LINEにおける大規模な日本語汎用言語モデルの構築と活用」
    佐藤 敏紀先生(LINE)
・「クリエイティブな機械翻訳は可能か?〜Mantraにおけるマンガ機械翻訳の事例〜」
    石渡 祥之佑先生(Mantra)


実行委員長:徳久 良子((株)豊田中央研究所)
実行委員 :賀沢 秀人(グーグル合同会社)
       小林 颯介((株)Preferred Networks)
       柴田 知秀(ヤフー(株))
       水本 智也( フューチャー(株))
       村上 聡一朗((株)サイバーエージェント )


□ 言語処理学会第28回年次大会について

第28回年次大会委員長 堂坂浩二 (秋田県立大学)


言語処理学会第28回年次大会の開催予定は以下の通りです.
日時: 2022年3月14日〜18日 (18日のワークショップはオンライン形式での開催に向けて実施形態を検討中です)
会場: アクトシティ浜松 (静岡県浜松市中区)
大会委員長:     堂坂 浩二 (秋田県立大)
大会実行委員長:   狩野 芳伸 (静岡大)
大会プログラム委員長:  河原 大輔 (早稲田大)


言語処理学会第28回年次大会 (NLP2022)では,過去二回の年次大会のオンライン配信経験を生かし,新型コロナウイルス感染症による影響が不透明な中でも自然言語処理分野の発展に寄与できるよう,参加者の皆様の安全を第一に企画を進めて参ります.現時点では,オンラインによる開催形態を中心に企画を進めており,オンラインであっても活発な発表と議論,参加者・スポンサー団体間の交流を促進できるよう知恵を絞っているところです.今後,社会状況を見ながら現地会場の活用も検討していきます.ワークショップ開催に関しては,主催者・参加者の双方をご支援できる開催形態を検討中です.自然言語処理とその関連分野において教育,研究,業務,社会貢献に従事している皆様,多くのご発表とご参加をお待ちしております.



学会に関する問い合わせ先

中西印刷株式会社内 言語処理学会事務局
 〒602-8048 京都市上京区下立売通小川東入ル
 e-mail: nlp@nacos.com

ニュースレター担当
 大熊智子 (理事・富士ゼロックス)
 e-mail: ohkuma.tomoko@fujixerox.co.jp