言語処理学会ニュースレター

Vol. 27 No. 2 (2020年7月27日発行)

目次

会長就任にあたって
2019年度論文賞の選考について
言語処理学会第26回年次大会(NLP2020)報告
言語処理学会第26回年次大会優秀賞・若手奨励賞の選考について
言語処理学会第26回通常総会報告
言語処理学会第27回年次大会について
論文の電子化について

□ 会長就任にあたって

会長 奥村学(東工大)


3月の年次大会から会長を仰せつかりました.2年間どうかよろしくお願いいたします.ご存知のように,3月の第26回年次大会は,新型コロナウイルスの感染を防ぐという観点から,茨城大学での開催を中止し,多くの内容をオンラインで開催しました.現地開催中止の決定からオンライン開催まで実に短期間でしたが,新納大会委員長,白井プログラム委員長,佐々木実行委員長をはじめとする各委員会委員の皆様やスポンサーの皆様の多大なるご尽力で大きなトラブルもなくオンライン開催を無事に実施することができました.ご協力いただ いたすべての皆様に感謝いたします.


さて,言語処理学会は設立から20年以上が経ち,今や年次大会は毎年発表者,参加者数が歴代1位を更新し続けるかのような勢いのある状態です.このように,日本における自然言語処理コミュニティが大きくかつ活発に成長したのは, ひとえに言語処理学会を設立,運営して来て下さった皆さんのご尽力によるものと言えると思います.学会およびコミュニティのこの状況からは,学会としてはもう何も手を打つ必要はないとも言えるのですが,個人的には,以下の方 向性で活動を進めていっても良いのではと考えています.それは,より多くの企業様へのアウトリーチと日本のコミュニティの国際的な位置づけの強化の2つです.


1. これまですでに色々なところで自然言語処理技術は実用化されて,その技術の有用性は十分認知され,また,非常に多くの企業様が年次大会のスポンサーになってくださったり,また,学会の賛助会員となってくださったりしていま す.しかし,自然言語処理技術は今も活発に研究されることでどんどん成熟しつつある状況にありますので,まだまだより多くのところで採用し実用化していっていただきたいと思いますし,そのためにも,我々の技術を広く企業の方に知っていただきたいと考えています.そこで,数年前から企業の方や自然言 語処理技術に熟知していない方を対象としたセミナーなども活動として開始しております.このような形で,より多くの方々に自然言語処理技術の可能性を知っていただき,言語処理学会の活動にも関心を持っていただければと考えて います.


2. この20数年で,日本の自然言語処理技術研究者は増加し,優秀な若手の方々が多数輩出され,トップクラスの国際会議にも日本からの論文が多数投稿されるようになり,また,採録もされるようになってきています.投稿数ではもはやトップ10の位置をずっと維持しているように思います.ただ,まだ採録率や採録数では上位に位置することが必ずしもできておらず,また,全世界の自然言語処理コミュニティの中での日本の存在感はまだそれほど大きくないのではないかと残念に思っています.そういう意味で,まずトップクラスの国際会議 を日本へ積極的に誘致することにより,日本の自然言語処理コミュニティを世界の自然言語処理研究者により知ってもらうことができればと思っています.また,これは今すぐには実現が難しいかもしれませんが,あと数年もすれば我々 の世代の研究者は定年などでリタイアしますので,そういうシニアな研究者も巻き込んで,日本からの国際会議への投稿論文をメンタリングするようなシステム,サービスなども運用していけると良いと思っています.


皆様方におかれましては,ウィズコロナの時間がまだまだ続くと思われますし,日々の生活に御不自由なところがおありかと思いますが,今後も健康に留意して過ごされますようお祈りするとともに,言語処理学会の今後の活動にも是非ご協力くださいますようお願いいたします.奥村が会長の2年間はひょっとし て一度も年次大会を現地で開催できず,ずっとヴァーチャルなままの会長で終わる懸念は十分ありうると思いますが,可能な限り早く皆様と対面でお話できる日が来ることを期待しています.



□ 2019年度論文賞の選考について

論文誌編集委員会 委員長 内山将夫(NICT)


2019年に出版された自然言語処理26巻1号から4号に掲載された論文25編より,編集委員会が賞に相応しい論文を推薦することを目標として,実施しました.選考は以下の手続きで実施し,内山将夫副編集長を選考委員長として,一次投票は編集委員26名が,二次投票は編集委員14名が,それぞれ選考委員会を編成して審査を行いました.


(1) 候補論文の決定:上記25編の論文のうち,査読点数が5点満点で4点以上の論文および担当編集委員から推薦のあった論文を候補論文とし,計13編の論文を一次投票の対象としました.


(2) 一次投票:選考委員26名が,13編の候補論文の中から,COI(※)を考慮して各自に割り当てられた2〜3編の論文を読んだうえで,10点満点で採点しました.一論文あたり5名の委員が審査し,高得点を得た上位6編の論文を選出しました.


(3) 二次投票:内山将夫副編集長を選考委員長として,COIのない14名を審査員とする最終選考委員会を編成し,上位6編の論文を対象として,委員が全論文を読んだうえで,二次投票を行い,審議を行いました.そして,1編の論文を最優秀論文賞候補,4編を論文賞候補に推薦することを決しました.(最終的に理事会でこの推薦を承認頂き,論文賞を決定しました)


(最優秀論文賞)


加藤 明彦,進藤 裕之,松本 裕治. 複単語表現を考慮した依存構造コーパスの構築と解析, Vol.26, No.4, pp. 663-688.


(論文賞)


渡邊 大貴, 田村 晃裕, 二宮 崇, Teguh Bharata Adji. CKYに基づく畳み込みアテンション構造を用いたニューラル機械翻訳, Vol.26, No.1, pp. 207-230.


栗田 修平,河原 大輔,黒橋 禎夫. ニューラルネットワークを利用した中国語の統合的な構文解析, Vol.26, No.1, pp. 231-258.


宮崎 千明,佐藤 理史. 発話テキストへのキャラクタ性付与のための音変化表現の分類, Vol.26, No.2, pp. 407-440.


田中 貴秋,永田 昌明. 日本語の文法機能タイプ付き単語依存構造解析, Vol.26, No.2, pp. 441-481.


以上,5編の論文については第26回年次大会で招待論文として講演いただきました.


※COIについて:
選考にあたっては,以下の条件に一つ以上該当する委員は,当該論文の議事に参加せず,審査を実施した.
・著者である
・著者と現在同じ組織に所属している
・著者と過去1年以内に共同で研究している



□ 言語処理学会第26回年次大会(NLP2020)報告

大会委員長・事業担当理事 新納浩幸(茨城大)


第26回年次大会委員長 新納浩幸(事業担当理事・茨城大)
同プログラム委員長 白井清昭(JAIST)
同実行委員長    佐々木稔(茨城大)


言語処理学会第26回年次大会は,コロナウイルスの感染拡大防止のため当初予定していた茨城大学水戸キャンパスでの現地開催を取り止め,Zoom によるオンライン会議の形で実施しました.


○ 期日


2020年3月17日(火) から 19日(木) の3日間開催しました.3月16日(月)に予定していたチュートリアルはオンライン開催への変更に伴い中止となり,16日は発表者によるオンライン会議システムの接続テストを実施しました.


○ 参加状況


オンライン開催への変更に伴い,基本的に,参加者は事前登録者のみとしました.その結果,最終的には招待者・欠席者を含め 1,052名の参加者となりました.ただしここにはオンライン開催での特別招待枠は含まれていません.


○ プログラム概要


■本会議 (3月17日 - 19日)


発表申込は 396件でした.前年の NLP2019 では 398件の発表でしたので,論文数としては同程度でした.ただしオンライン開催への変更に伴い,発表を辞退した方もおり,実際に発表されたのは口頭発表が 155件,ポスター発表が183件の合計 338件でした.


■テーマセッション


オンライン開催にはなりましたが,公募により設定された以下の5件のテーマセッションを開催しました.括弧内はオンラインでの発表件数です.


・金融・経済ドメインのための言語処理 14件 (11件)
・言語教育と言語処理の接点 5件 (3件)
・ロボティクス・グラウンディングと自然言語処理 8件 (2件)
・化学分野への言語処理の応用 12件 (10件)
・翻訳とは何か? 何ではないか? 12件 (9件)


■招待講演 (中止)


当初の予定では下記の 2名の先生をお招きして,招待講演を実施する予定でしたが,オンライン開催により招待講演は中止になりました.


・水本篤 先生(関西大学)
言語教育が自然言語処理に期待すること

・松本裕治 先生 (奈良先端科学技術大学院大学/理化学研究所革新知能統合研究センター)
知識と自然言語処理


■招待論文講演 (3月19日)


会誌「自然言語処理」に発表された論文の中から選出された以下の5件の論文についての発表が行われました.


・CKYに基づく畳み込みアテンション構造を用いたニューラル機械翻訳
渡邊大貴, 田村晃裕, 二宮崇, Teguh Bharata Adji
Vol. 26, No. 1, pp. 207-230.

・ニューラルネットワークを利用した中国語の統合的な構文解析
栗田修平, 河原大輔, 黒橋禎夫
Vol. 26, No. 1, pp. 231-258.

・発話テキストへのキャラクタ性付与のための音変化表現の分類
宮崎千明, 佐藤理史
Vol. 26, No. 2, pp. 407-440.

・日本語の文法機能タイプ付き単語依存構造解析
田中貴秋, 永田昌明
Vol. 26, No. 2, pp. 441-481.

・複単語表現を考慮した依存構造コーパスの構築と解析
加藤明彦, 進藤裕之, 松本裕治
Vol. 26, No. 4, pp. 663-688.


■チュートリアル(中止)


3月16日に下記の 4件のチュートリアルを予定していましたが,オンライン開催によりチュートリアルは中止になりました.


・ガウス過程と自然言語処理
持橋大地 先生 (統計数理研究所)

・外国語学習者の言語情報処理はいかに熟達化するか−その心的プロセスに迫る
横川博一 先生(神戸大学)

・深層学習の理論
鈴木大慈 先生(東京大学)

・文献学への自然言語処理技術の応用 ―スペイン語文献を例にして―
川崎義史 先生(東京大学)


■スポンサーイブニング(中止)


3月16日にスポンサーと参加者との交流を目的としたスポンサーイブニングを予定していましたが,オンライン開催に伴い中止になりました.


■(オンライン)懇親会(3月18日)


3月18日の 19:00 からホテルレイクビュー水戸での開催を予定していた懇親会は,オンラインによる懇親会に変更されました.本学会ではオンライン懇親会の前例がなく手探りでの企画でしたが,約200名の参加者のおかげで,オンライン懇親会は盛況でした.


○ スポンサー


オンライン開催へと変更になりましたが,多くの企業・団体がスポンサーを辞退せず,支援を維持して頂きました.内訳は以下の通りです.


 プラチナスポンサー数 19
 ゴールドスポンサー数 22
 シルバースポンサー数 17


○ 総括


今回の年次大会は,コロナウイルスの感染拡大防止のため,現地開催を断念し,オンライン開催に変更しました.そのため上記したように多くのイベントを中止せざるを得ませんでしたが,中心となる研究発表に関しては Zoom によるオンライン会議システムを利用して滞りなく実施できたと思います.大会賞などの表彰関係も例年通り行えました.事後アンケートの結果は好意的な意見がほとんどで NLP2020 は成功したと思っています.このようにオンラインとは言え,大会を中止とせずに,なんとか年次大会を実施できたのは,プログラム委員を中心とした大会関係者,スポンサーそして参加者皆様方のおかげであり,心より感謝申し上げます.

今回の大会は結果的にオンライン開催という点が最大の特徴となりました.これは間違いありませんが,もう一つ特徴があったと思っています.それは大会の規模です.本大会から発表者会員制限が導入されました.この制限のため,発表者が激減する不安もありましたが,実際は過去最大規模であった NLP2019と同程度の発表論文が集まりました.また予定されていた懇親会の規模は過去最大でした.更にオンライン開催に変更する時点でのスポンサーからの支援額や事前参加登録者数などから考えても,NLP2020 が通常通り開催されたとしたら,過去最大の規模になっていたと思います.この点で現地開催ができなかったことは,個人的に非常に残念でした.

年次大会の規模が拡大し,盛況になっていくことは喜ばしいことですが,それに応じて運営側の負担は増大し,なんらかの対策が必要です.この点から本大会ではいくつかの施策を試行していました.そのため本大会は今後の年次大会の形態が変わる転換点になると思っていたのですが,それらの施策は,オンライン開催に伴い全て曖昧な形で終わってしまい,転換点とまではいかなかったようです.ただ,このような取り組みは今後も継続されるので,会員の皆様方は運営側の負担などは心配せずに,今後も年次大会を盛り上げていって欲しいと思っています.

一方,皮肉なことに,このコロナウイルスの問題から,確かに本大会は別の観点で転換点になったようです.ウィズコロナがうたわれる現在の状況では,今後,年次大会の形態や規模がどのように変化していくのかわかりません.ただ年次大会の基本は研究者の交流の場であると思っています.どのような形態や規模となったとしても,それは提供されるはずですので,次回以降の年次大会も是非大勢の方が参加されることを願っております.



□ 言語処理学会第26回年次大会優秀賞・若手奨励賞の選考について

第26回年次大会プログラム委員長 白井清昭(JAIST)


言語処理学会年次大会の大会賞には優秀賞と若手奨励賞があります.優秀賞は,年次大会において論文の内容が優れていると認められた発表論文に与えられる賞です.また,優秀賞のうち特に優れたものがあれば,最優秀賞として選定されます(言語処理学会年次大会優秀賞規定).同様に若手奨励賞は,年次大会において論文の内容が優れていると認められた発表論文に関して,以下の条件を満たす著者に与えられる賞です(言語処理学会年次大会若手奨励賞規定).


・年次大会の開催年の4月1日において満30歳未満であること
・当該論文の筆頭著者であること
・過去に若手奨励賞を受賞していないこと
・ある論文が優秀賞を受賞する場合は,その論文の筆頭著者は若手奨励賞の対象とはならない


近年の年次大会と同様に,今大会においても大会の開始前に全論文を対象に審査を行い,大会賞を決定し,大会のクロージングにて表彰しました.


大会賞の選考のための内規では,


・優秀賞の中で特に評価の高いものを0件から2件の範囲で最優秀賞とする
・優秀賞は全発表件数の約2%を目安とする
・若手奨励賞は最大10件程度を目安に選出する


としております.


今回の年次大会では396件(前回398件;ほぼ同数)が優秀賞の対象となる論文であり,優秀賞の授賞件数は全体の2%にあたる7-8件を目安としました.また若手奨励賞の対象となる論文は269件(前回274件;約2%の減少)でした.

年次大会優秀賞・若手奨励賞の選考にあたっては,選考委員会を組織し,慎重な議論を重ねた上で選定を行いました.今回,選考委員会は計213名(前回194名;約10%の増加)の審査員で構成されました.各授賞論文には議論で合意された授賞理由が付記されます.授賞の最終的な責任はプログラム委員長の白井が負います.

大会賞の選考は論文審査と最終選考の二段階で行いました.論文審査に先立ち,投稿カテゴリにより全ての論文を5つのグループ(A, B-a, B-b, C-a, C-b)に分けました.グループ毎に,そのグループの研究分野を専門とする審査員を各論文に対し5名割り当て,審査を行いました.審査員はそれぞれ10件程度の論文を担当し,各論文に対して,総合評価(5段階),新規性(5段階),有用性(5段階),読みやすさ(5段階)の観点から審査しました.この際,優秀賞に推薦する論文については推薦理由を記述するようお願いしました.また,若手奨励賞の対象論文については,同賞に推薦するかについても5段階で審査を行い,同様に推薦理由の記述をお願いしました.

論文審査終了後,最終選考を行いました.選考委員は,白井清昭(北陸先端大;プログラム委員長),鈴木潤(東北大;副プログラム委員長),佐々木裕(豊田工大;前プログラム委員長),大関洋平(早大;大会賞担当プログラム委員)の4名です.最終選考では,原則として,論文審査において審査員が与えた総合評価の点数の高い論文を授賞論文として選びました.4名の最終選考委員のうち,授賞のボーダーライン付近にCOIのある論文があったときは,その委員は一時退席し,COIのない選考委員で授賞論文を決めました.

最終選考では,まず優秀賞を決定しました.最初に,審査員による評価点のばらつきを抑えるために,一般化線形混合モデルを用いて総合評価の点を補正しました.次に,補正後の評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,授賞の目安とした上位8件の論文を優秀賞として選びました.次に,これら8件のうち,補正後の総合評価の点数の2位と3位の論文の間に比較的大きな差があったことから,上位2件の論文を最優秀賞として選びました.

次に,若手奨励賞を決定しました.優秀賞受賞論文ではなく,かつ若手奨励賞の受賞資格を満たす論文について,若手奨励賞の総合評価の点数を同様に一般化線形混合モデルを用いて補正しました.補正後の評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,上位13件の論文を若手奨励賞として選びました.若手奨励賞の授賞件数の目安は10件ですが,補正後の評価点が3点(論文審査における5点満点の評価において若手奨励賞として推薦するときの点数)以上の論文が13件で,明確なボーダーラインがあったこと,若手奨励賞の対象論文数が近年増加傾向にあり,13件は全体の5%以下で授賞の乱発には当たらないことから,今回は13件の論文に対して若手奨励賞を授賞することとしました.

以下は,最優秀賞,優秀賞,若手奨励賞の論文とその授賞理由です.


■言語処理学会第26回年次大会 最優秀賞 (2件:発表番号順)


B4-5 ベクトル長に基づく自己注意機構の解析
小林悟郎 (東北大), 栗林樹生 (東北大/Langsmith), 横井祥, 鈴木潤, 乾健太郎 (東北大/理研)


本論文は,自己注意機構を解析するため,既存手法におけるアテンション重みに加えて,アフィン変換後のベクトルおよび足し合わされるベクトルの大きさを分析する新しいアプローチを提案しています.特に,アテンション重みだけに基づく既存手法で確認されていた,[CLS]や[SEP]の様な特殊トークンにアテンションが集中するという不可解な問題を解決し,自己注意機構の解明に向けて新たな一歩を踏み出したと言えます.BERTやTransformer等の自己注意機構を持つ深層ニューラルネットワークを用いる多くの研究者に影響を与える重要な成果であり,今後は様々な言語現象への応用も期待できることから,最優秀賞にふさわしいと判断しました.


D1-2 超球面上での最適輸送に基づく文類似性尺度
横井祥, 高橋諒, 赤間怜奈, 鈴木潤, 乾健太郎 (東北大/理研)


本論文は,単語ベクトルの構成要素であるノルムと方向に,それぞれ単語の重要度と意味がエンコードされているという仮説を立て,単語ベクトルをノルムと単位方向ベクトルに分けて利用する文類似尺度 Word Rotator's Distance (WRD) を提案しています.WRDは,ノルムで重み付けられた単位方向ベクトルの集合間のEarth Mover's Distance として定義されます.3種類の Semantic Text Similarity (STS) データセットを用いた実験において,単語ベクトル変換とWRDを適用することで最高精度を達成した点は非常に優れています.論文の構成も論理的でわかりやすく,最優秀賞にふさわしいと判断しました.


■言語処理学会第26回年次大会 優秀賞 (6件:発表番号順)


D1-4 擬似タグと線形移動ベクトルを用いた単一モデルによる擬似モデルアンサンブル
桑原亮介 (東大), 鈴木潤 (東北大), 中山英樹 (東大)


本論文は,深層ニューラルネットワークのモデルアンサンブルにおける様々なコスト問題を解決するため,擬似タグと線形移動ベクトルを用いた単一モデルに基づく擬似モデルアンサンブル手法を提案しています.特に,テキスト分類と系列ラベリングのベンチマーク上で,提案手法が,従来の約10分の1のパラメタ数で,通常のモデルアンサンブルに匹敵ないし凌駕する性能を達成できるという特筆すべき結果を示しています.提案手法が単なるデータ拡張やランダムノイズでは無いことも実験で確認しており,ドロップアウトの理論的分析には将来性も伺えることから,優秀賞にふさわしいと判断しました.


D3-2 テキストを通して世界を見る:機械読解における常識的推論のための画像説明文の評価
Diana Galvan-Sosa (東北大), 西田京介 (NTT), 松田耕史 (理研/東北大), 鈴木潤, 乾健太郎 (東北大/理研)


本論文は,詳細な説明文付き画像データセット Visual Genome を機械読解に利用する手法を提案しています.具体的には,テキストと質問文から選択したキーワードをクエリとして,Visual Genomeから類似する説明文を取得し,取得した説明文と選択肢を照合する手法を提案しています.機械読解に関するデータセット MCScript,MCScript 2.0 を用いた機械読解の実験を行い,画像の説明文を用いてBERTを微調整することで高い正解率が得られ,特に常識が必要となる問題に対して2つのデータセットともに高い正解率が得られることが示されています.画像の説明文を使って常識が必要となる機械読解問題を解く手法は新しく,その有効性も実験により示されています.言語処理の新しいアプローチを提示した研究であり,優秀賞に値すると判断しました.


D4-1 大規模疑似データを用いた高性能文法誤り訂正モデルの構築
清野舜 (理研/東北大), 鈴木潤 (東北大/理研), 三田雅人 (理研/東北大), 水本智也 (フューチャー/理研), 乾健太郎 (東北大/理研)


本論文は,高性能な文法誤り訂正モデルを構築するため,(1)擬似データの生成方法,(2)擬似データの生成元データ,(3)擬似データを用いた最適化手法,の観点から体系的に実験を行い,効果的な擬似データの活用手法を提案しています.特に,提案手法を用いると,一般的なEncoder-Decoderモデルでも,複数のベンチマークデータセット上で世界最高性能を達成できるという頑健かつ興味深い結果を示しています.エラー分析も実施しており,今後の発展の可能性に関しても極めて有望であることから,優秀賞にふさわしいと判断しました.


F1-3 センター試験を対象とした高性能な英語ソルバーの実現
杉山弘晃, 成松宏美 (NTT), 菊井玄一郎 (岡山県立大), 東中竜一郎 (NTT), 堂坂浩二 (秋田県立大), 平博順 (大阪工大), 南泰浩 (電通大), 大和淳司 (工学院大)


本論文は,センター試験の英語問題を高精度に解くことを第一の目的としています.提案手法自体は,現在自然言語処理分野で盛んに取り入れられている大規模な事前学習済み言語モデルを適用するという大きな新規性はないものの,その試験問題の種類に合わせて実用的な活用法を提示している点は評価できます.また,本論文で特に高く評価された点は,試験200点満点中185点という驚異的なスコアを獲得した点です.現在の技術の成果としてここまで到達できるということを示したことは学術的にも自然言語処理応用の観点からも非常に高い価値があり,十分に優秀賞に値する論文と判断しました.


P4-12 会話ドキュメントに対する発話単位系列ラベリングのための自己教師あり事前学習
増村亮, 庵愛, 高島瑛彦 (NTT)


本論文は,自己教師あり事前学習を提案し,ラベルありデータを必要としない事前学習法を提案しています.提案手法は新規性も高く,また実験ではコールセンターの会話ドキュメントに対する発話単位系列ラベリングタスクにおいて有用性を示しています.特に,実験を精緻におこない,結果の信頼性が高い点が高く評価されました.また,論文内の説明がとても明解で読み手が理解しやすいように丁寧に書かれている点も高い評価を得ました.手法の新規性,実験の信頼性,分野への貢献,論文の構成など総合的にみて十分に優秀賞に相応しい論文だと判断しました.


P6-2 鏡映変換に基づく埋め込み空間上の単語属性変換
石橋陽一, 須藤克仁, 吉野幸一郎, 中村哲 (NAIST)


本論文では,単語埋め込み空間上で単語の属性を変換する方法論の構築に取り組み,鏡映変換という独自の方法論を導入しています.特に入力単語が持つ属性を事前知識として与える必要がなく,方法論の中で自動的に判別できる点がこれまでにない大きな特徴となっています.また実験では,提案法の効果により,対象とする属性を持つ単語は高い精度で変換し,逆に対象とする属性を持たない単語は変換しないという理想的な挙動となることを示しています.現在の自然言語処理の基盤資源とも言える単語埋め込みに新たな性質を追加できるという観点だけでも非常に有益な論文であり,優秀賞にふさわしいと判断しました.


■言語処理学会第26回年次大会 若手奨励賞 (13件:発表番号順)


A3-1 出力と文脈の自己相互情報量に基づく文脈翻訳
杉山普 (東大)


本論文は,文脈翻訳モデルにおいて文脈付き対訳コーパスを用いない方法を提案しています.具体的には,目的言語の単言語コーパスで学習した言語モデルによって翻訳モデルの出力に文脈を考慮した修正を加えることで文脈翻訳を実現する手法を提案しています.複数のデータセットにおける実験から,文脈付きコーパスを用いたEnd-to-Endモデルと同等以上の性能が得られることを示しており,有望な研究であると考えられることから,若手奨励賞にふさわしいと判断しました.


A4-2 見出し生成の忠実性の改善
松丸和樹 (東工大)


本論文は,見出し生成問題において忠実性の高い見出しを生成する手法を提案しています.具体的には,記事に忠実でない見出しが生成される原因を見出し生成のタスク設定の不備や訓練データにあるのではないか,という仮説を立て,その仮説を検証するとともに,訓練データから記事に忠実でない見出しを含意認識モデルを用いて排除することによって見出し生成の忠実性が向上することを示しました.重要な問題提起を行っているとともに,丁寧な分析に基づき忠実性の高い見出し生成のための手法を提案している点で有用性が高く,若手奨励賞にふさわしいと判断しました.


B4-2 文脈を考慮した単語ベクトル集合からの単語領域表現
山内崇史 (阪大)


本論文は,ELMoやBERTなどで得られた文脈依存の単語ベクトル集合に対して,動的にクラスタ数を決定できるクラスタリング手法を適用することにより,各単語の領域表現を得る手法を提案しています.word2vec登場後に行われていた単語の意味の広がりを求める研究を文脈依存ベクトル登場後に再考した形となっていて大変興味深く,また,複数の評価セットで比較実験を丁寧に行っていることも高く評価でき,若手奨励賞に値すると判定しました.


B5-3 談話の削除不可能性に基づく教師なし談話核性分類
西田典起 (東大)


本論文は,談話構造解析における談話核性分類タスクにおいて,抽出型文書要約で用いられる文の重要度計算を再帰的に適用することにより,削除の不可能性を計算する手法を提案しています.談話構造解析が依然として難しいタスクである原因の一つに談話構造のアノテーションのコストが高いことがあり,本論文で提案しているような教師なし学習のアプローチは非常に重要になります.木構造推定タスクとの統合などの今後の拡張も期待されることから,若手奨励賞に選定しました.


C5-3 BERTとRefinementネットワークによる統合的照応・共参照解析
植田暢大 (京大)


本論文は,日本語意味解析において非常に重要な述語項構造・共参照・橋渡し照応解析にBERTを適用し,また,格ごとに独立に予測している問題に対してRefinementネットワークを導入することにより予測を修正する手法を提案しています.多くの研究において独立に解かれていた解析を同時に解くことにより精度が向上すること,ならびに,Refinementネットワークの有効性が示されており,今後の意味解析の研究のベースになると考えられますので,若手奨励賞に選定しました.


D2-5 JParaCrawl: 大規模Webベース日英対訳コーパス
森下睦 (NTT)


ParaCrawl プロジェクトでは,インターネットをクロールし EU 公式言語と英語間の大規模な対訳コーパスを作成しています.本研究では,ParaCrawlに基づいて,大規模な日英対訳コーパスを構築し,機械翻訳の性能向上を実現しています.自動構築した対訳コーパスの品質やテスト文との類似性などの分析があると,さらに有用でしたが,インターネット上のWebページをクロールし,圧縮後で14.4TBのWebページを収集し,また,このWebページに機械翻訳を適用して対訳候補を選択することにより構築した1000万文対以上からなる大規模日英対訳コーパスを公開していることから,今後の機械翻訳研究に貢献する研究であり,若手奨励賞にふさわしいと判断しました.


D4-2 文法誤り訂正のための自己改良戦略に基づくノイズ除去
三田雅人 (理研/東北大)


本論文は,文法の誤り訂正タスクにおいて,学習データにノイズ(揺れ)が含まれやすいという事象に着目し,自己改良戦略に基づくノイズ除去手法を提案しています.シンプルな手法ですが問題の性質がよく考慮されており,実験によって期待した効果が得られたことが示されています.また,論文の構成・主張・記述が明快でわかりやすく,異なる分野の読者も考慮した完成度の高い論文であることから,若手奨励賞にふさわしいと判断しました.


F5-3 多言語極性辞書の構築とその包括的評価
岩本蘭 (慶應大)


本論文は,評価表現抽出のための多言語極性辞書の構築方法を提案しています.英語の極性辞書を元に,既存の翻訳機を用いた手法や,訓練済み多言語分散表現データを用いた手法を提案しています.Universal Dependencies の構文解析器を用いる工夫を行い,16言語に対する包括的な評価を行いました.これだけの数の言語について辞書の作成を行い,評価実験を行ったことを評価し,若手奨励賞に選定いたしました.


G4-1 Data Augmentation Technique for Process Extraction in Chemistry Publications
Yuni Susanti (富士通研)


本論文は化学分野・物質材料系科学分野の論文からの情報抽出技術について訓練データを増加する手法について提案しています.論文の構成が適切で,内容がわかりやすく記述されています.提案手法は既存手法を応用したシンプルなものでありますが,目的に合わせた堅実な内容であり,実験結果に対する考察も充実しています.今後の発展を見込み,若手奨励賞に選定いたしました.


P1-19 回答の根拠を解釈可能な機械読解
西田光甫 (NTT)


参照テキスト中から質問に対する回答を抽出する機械読解の問題において,根拠となる部分文を提示するパイプラインを挟むことで,機械読解の精度を向上させると同時に根拠文の提示を可能とする手法を提案しています.また,全体をEnd-to-Endの追加学習で最適化することで,回答の精度が上がるものの根拠の提示精度が下がるということも示されています.機械読解の研究でこれまでに検討されてきた文書の検索と回答文の抽出というパイプラインを回答の根拠という観点から再定義し,その根拠についても機械読解結果の解釈という観点から有用であることを示しています.これらの理由から,若手奨励賞にふさわしいと判断しました.


P3-15 ゲーミフィケーションを用いたアノテーション付き対話データの収集基盤
小河晴菜 (東工大)


本論文は,対話データ収集を目的とし,参与者によるフィッシュボール方式のアノテーションタスクにゲーミフィケーションを適用しています.グループディスカッションに対して参与者によりフィッシュボール方式でアノテーションする枠組は,ディスカッション教育の分野で提案されています.その実践においては動機付けが大きな課題でした.本論文ではこれをゲーミフィケーションを通じて実現する手法を提案している点が評価できます.今後,大規模な実践に期待して,若手奨励賞に選定いたしました.


P4-7 数学概念への数式グラウンディングのためのデータセット
朝倉卓人 (総研大/東大)


本論文は,科学技術論文等に含まれる数式について,各数式の意図を理解するという観点からデータのアノテーション・分析手法を提案し,実際にタグ付けを行った結果を報告しています.問題を数式の単語・形態素に分割するステップと,各単語を辞書上で定義される数学概念にグラウンディングするステップに分けたアノテーションが提案されています.取り組む問題が独創的でありつつ,これまでの言語処理で検討されてきた手法を踏まえた基準作成とアノテーション付与を行っており,今後の展開が期待されることから若手奨励賞にふさわしいと判断しました.


P4-33 事前学習された多言語の文符号化器を用いた機械翻訳の品質推定
嶋中宏希 (首都大)


本論文は,機械翻訳において参照文を利用しない翻訳文の品質推定手法について提案しています.既存の手法では,参照文と翻訳文を入力として品質を推定する手法が高い精度を示していますが,本研究では原文と翻訳文を入力として翻訳文の品質を予測する回帰モデルを多言語BERTに基づいて構築しています.提案手法は,既存手法よりも高い精度を達成するとともに,複数言語での学習を行うことからゼロショット学習の設定においても一定の精度を示しており,有望な研究であると考えられることから,若手奨励賞にふさわしいと判断しました.


さて,最優秀賞・優秀賞の選考は,前回の大会までは1次審査,1次選考,2次選考の三段階で実施していましたが,既にご説明したように,今大会では論文審査(従来の1次審査)と最終選考の二段階で実施しました.審査員による評価点のばらつきを抑えるため,一般化線形混合モデルによる評価点の補正も試みました.大会賞の選考では,発表申込締切から年次大会開催までの短期間に400件近い論文を審査することが求められており,審査員の負担が大きいことが問題となっていました.選考の手続きを少し簡略化し,論文審査にかける時間を長くすることで,審査員の負担を間接的に軽減しました.今後もより良い選考方法を模索していきます.


最後に,今大会では,ポスターセッションの活性化のためにポスター賞を企画しました.ポスター賞は,ポスター発表の聴衆の投票により大会会期中に決定する賞であり,投稿論文に対して事前に審査をする大会賞とは異なり,参加者の視点で顕著なポスター発表を表彰する制度です.聴衆は,ポスターの内容の分かりやすさ,デモンストレーションに工夫があるかなど,ポスタープレゼンテーションスキルを評価し,全ポスター発表の中から5件まで「発表+発表者」単位に投票を行います.ポスター賞は前回の大会から始められた企画で,電子投票から紙での投票へ変更したり,投票はセッション毎に5件ではなく全ポスター発表から5件に変更したりするなど,更なる工夫を凝らしました.しかし,今大会は現地開催からオンライン開催に変更されたことにより,参加者が全てのポスターを対象に投票することは難しいと判断し,ポスター賞の表彰はやむなく中止することにいたしました.



□ 言語処理学会第26回通常総会報告

総務担当理事 鶴岡慶雅(東大)


日時: 2020年3月17日(火) 12:20-12:45
場所: 茨城大学 共通教育棟12番教室
出席者: 代議員31名(内,書面による議決権行使者25名),理事:15名,監事:2名


議題
■第1号議案 2019年度決算報告
資料「第26回通常総会」に基づき,2019年度の決算報告があり,その内容が承認されました.


■第2号議案 理事の選任
以下の17名が理事として選任されました.
奥村学(東京工業大学), 乾健太郎(東北大学), 内山将夫(情報通信研究機構), 金山博(日本アイービー・エム), 松田寛(Megagon Labs), 新納浩幸(茨城大学), 堂坂浩二(秋田県立大学), 鶴岡慶雅(東京大学), 二宮崇(愛媛大学),
荒牧英治(奈良先端科学技術大学院大学), 荒瀬由紀(大阪大学), 山下達雄(ヤフー株式会社), 富士秀(富士通研究所),
大熊智子(富士ゼロックス), 松原茂樹(名古屋大学), 徳久良子(豊田中央研究所), 賀沢秀人(Google)


■第3号議案 監事の選任
以下の1名が監事として選任されました.
落谷亮(富士通)


■第4号議案 定款の改訂
資料「第26回通常総会」に基づき,定款の改訂が提案され,改訂が承認されました.


■第1号報告 2019年度事業報告
資料「第26回通常総会」に基づき,2019年度の事業内容が報告されました.


■第2号報告 2019年度監査報告
資料「第26回通常総会」に基づき,2019年度の監査の結果,会計監査,業務監査ともに問題のないことが報告されました.


■第3号報告 2020年度事業計画
資料「第26回通常総会」に基づき,2020年度の事業計画が報告されました.


■第4号報告 2020年度予算案
資料「第26回通常総会」に基づき,2020年度の予算案が報告されました.


■第5号報告 2021年度からの学会誌「自然言語処理」の発行計画
資料「第26回通常総会」に基づき,学会誌「自然言語処理」の発行計画が報告されました.


■第6号報告 2020年度代議員構成
資料「第26回通常総会」に基づき,2020年度の代議員の一覧が報告されました.


配布資料 ■第26回通常総会 資料



□ 言語処理学会第27回年次大会について

第27回年次大会委員長 金山博(日本IBM)


□第27回年次大会について
言語処理学会第27回年次大会の開催予定は以下の通りです.
日時: 2021年3月15日--19日
会場: 北九州国際会議場(福岡県北九州市小倉北区)
大会委員長:     金山 博 (日本IBM)
大会実行委員長:   須藤 克仁(奈良先端大)
大会プログラム委員長:鈴木 潤(東北大)


2020年春以降,議論や交流が限定的になり残念に思っている方も多いことでしょう.この状況のなかでも,引き続き進展が期待されている自然言語処理の発展を止めぬよう,第27回年次大会(NLP2021)の企画を進めています.従来のように千数百名が一堂に会することこそかなわなくても,技術と運用の工夫により,快適な発表や議論、そして参加者同士やスポンサー団体との活発な交流ができる場を提供します.研究を進めている皆様,投稿に向けてぜひご準備ください.また,今回は試行的に会期を5日間に戻して余裕のあるプログラムとするとともに,3年ぶりにワークショップを募集します.自由な形式で議論・研鑽をするアイデアをお待ちしています.



□ 論文の電子化について

論文誌編集委員会 委員長 内山将夫(NICT)


現在,会誌「自然言語処理」は紙媒体で発行されるとともに,発行3ヶ月後に電子化され,J-STAGEで公開されています.一方で,近年,多くの学会で主要な事業に関する電子化が推進され,論文誌などの刊行物を完全に電子化し,紙媒体を廃止している学会も少なくない状況です.これは,刊行物の電子化が,省力化や経費節減に寄与することが一因であると考えられます.そこで本学会でも検討を重ね,2021年度(2021年1月)から紙媒体での会誌の出版を廃止し,J-STAGE上でのオンライン出版(論文は随時掲載)に移行することといたしました.印刷コストの低減分は,会員サービスの向上などに活かしていきたいと 考えています.
 一方で,電子化されると,会員は電子媒体にアクセスしなければ,会誌にどのような論文が掲載されたかも把握できない状況が生じる懸念があります.そこで,会誌の目次(実際には,表紙)に当たる情報は,本学会のニュースレターで随時配信していくようにしたいと考えています.ご理解を賜れれば幸いです.
よろしくお願いいたします.



学会に関する問い合わせ先

中西印刷株式会社内 言語処理学会事務局
 〒602-8048 京都市上京区下立売通小川東入ル
 e-mail: nlp@nacos.com

ニュースレター担当
 大熊智子 (理事・富士ゼロックス)
 e-mail: ohkuma.tomoko@fujixerox.co.jp