NLP2023大会委員長 松田 寛(大会担当理事・株式会社リクルート Megagon Labs)
同プログラム委員長 東中 竜一郎(名古屋大学)
同実行委員長 石野 亜耶(広島経済大学)
■実施概要
○会期
・チュートリアル 2023年3月13日(月)
・本会議 2023年3月13日(月)〜 16日(木)
・ワークショップ 2023年3月17日(金)
〇 開催形式・会場
NLP2023は沖縄コンベンションセンター (沖縄県宜野湾市)を現地会場とし,全ての口頭発表セッションをZoomでオンライン中継するハイブリッド形式で開催しました.現地会場にはWi-Fiを整備し,参加者Slackを通じた現地・オンライン間のディスカッションの醸成に取り組みました.ポスター発表のうちオンライン発表分については,新たに現地に中継用PCを設置し,現地参加者が発表を見て質問することを可能にしました.また,内閣府通達にもとづき,アルコール消毒液の設置等の感染防止対策を実施しました.今大会から託児室の運用を再開しました.
〇 参加状況
参加者数は過去最高の1,859名となりました.今回から当日参加登録(オンライン受付)が可能になりました.登録種別毎の参加者数は次の通りです.
・ 一般
・会員 550 (426)
・ 非会員 386 (226)
・ 学生
・会員 473 (360)
・ 非会員 163 (178)
・ 招待
・ スポンサー 211
・ 賛助会員 29
・ 講師等 17
※ ()内はNLP2022の実績値
〇 参加費・支援制度
今大会は言語処理学会年次大会として初めての本格的なハイブリッド開催となり,現地会場でのセッション進行とオンライン中継を同時かつ円滑に運用するために,業務委託先へのアウトソーシング範囲を拡大する必要が生じました.これに伴い,予算が当初見積より増大したため,参加費の値上げを行いました.また今大会は沖縄観光コンベンションビューローの開催支援制度,ならびに,沖縄コンベンションセンターの利用料減免制度の適用を受けることができました.最終的に,参加者数・スポンサー申込数が増加したことに加えて,OKICA事前販売により路線バスの利用性が高まり,シャトルバス運行に要する費用を圧縮できたことで,大会収支は軽微な赤字に抑えることができました.
○ プログラム概要
■本会議 (3月13日-16日)
一般セッション・テーマセッションには,昨年を約5割上回る579件の論文投稿がありました.発表件数の急激な増加に対応するため,今大会では口頭発表5セッションとポスター発表2セッションを同時並列で実施し,ポスター発表の比率を高める対応を行いました.また,チュートリアルに続いてオープニング・招待論文セッションを初日に実施することで,本会議で発表セッションに割り当てる時間帯を増やすことができました.
・口頭発表(一般) 260件 (221件)
・口頭発表(テーマセッション) 37件 (33件)
・ポスター発表 282件 (132件)
■テーマセッション
公募により採択された次の3件のテーマセッションが本会議中に開催されました.
・金融・経済ドメインのための言語処理 (15件)
・ことばの評価と品質推定 (9件+総合討論)
・地理空間情報と自然言語処理 (13件+総合討論)
■ワークショップ (3月17日)
昨年度に引き続きワークショップの募集を行い.次の2件が開催されました.いずれも多くの参加者が集まりました.
・日本語言語資源の構築と利用性の向上
・深層学習時代の計算言語学
■チュートリアル (3月13日)
次の4つのチュートリアルを実施しました.
・音声合成は次にどこに向かうのか/高道 慎之介 先生(東京大学)
・自然言語処理から見た古典語と現代語/近藤 泰弘 先生(青山学院大学)
・医療言語処理ことはじめ/荒牧 英治 先生(奈良先端科学技術大学院大学),中村 優太 先生(東京大学)
・構文文法の基本的な考え方:言語使用から創発する言語知識のありようを探る/大谷 直輝 先生(東京外国語大学)
■緊急パネル:ChatGPTで自然言語処理は終わるのか?(3月14日)
ChatGPTに代表される巨大言語モデルの出現でNLPはどう変わるかをテーマに,次の6名の登壇者が議論しました.この緊急パネルの動画は,言語処理学会YouTubeチャンネルで後日一般公開されました.
・ 乾 健太郎 氏(東北大学)
・ 黒橋 禎夫 氏(京都大学)
・ 相良 美織 氏(バオバブ)
・ 佐藤 敏紀 氏(LINE)
・ 鈴木 潤 氏(東北大学)
・谷中 瞳 氏(東京大学)
■招待講演(3月15日・16日)
次の2名の先生をお招きし,招待講演を実施しました.今大会では招待講演のYouTube Liveによる一般配信も実施しました.
・谷口 忠大 先生(立命館大学)
社会における分散的ベイズ推論としての記号創発
〜集合的予測符号化としての言語観〜
・田窪 行則 先生(国立国語研究所)
危機言語の記録・維持・再生の諸問題:琉球諸語を中心に
■招待論文講演 (3月13日)
会誌「自然言語処理」の発表論文から選出された次の4件の論文の発表が行われました.
・負例を厳選した対話応答選択による対話応答生成システムの評価
佐藤 志貴, 赤間 怜奈, 大内 啓樹, 鈴木 潤, 乾 健太郎
・対話における間接的応答と直接的応答からなる言い換えコーパスの構築と分析
高山 隼矢, 梶原 智之, 荒瀬 由紀
・マスクされた単語埋め込みと2段階クラスタリングを用いた動詞の意味フレーム推定
山田 康輔, 笹野 遼平, 武田 浩一
・BioVL2データセット: 生化学分野における一人称視点の実験映像への言語アノテーション
西村 太一, 迫田 航次郎, 牛久 敦, 橋本 敦史, 奥田 奈津子, 小野 富三人, 亀甲 博貴, 森 信介
■スポンサーイブニング・スポンサー交流会 (3月13日)
スポンサーと参加者との交流を目的として,スポンサーイブニングとスポンサー交流会を開催しました.交流会ではエイサー演舞(道ジュネー)が場を盛り上げました.
■参加者交流イベント(3月14日)
感染症対策で立食パーティー形式での懇親会の開催が間に合わなかったため,広大な展示場スペースを活かしてノンアルコールの参加者交流イベントを開催しました.参加者は900名に達しましたが,現地担当・会場担当の委員による入念な準備が奏功し,参加者を安全に誘導することができたことで,新しい交流のスタイルとして多くの支持を得ることができました.
〇 総括
今大会は学会として初の本格的なハイブリッド開催となり,周到な事前準備が必要となりました.実行委員会・プログラム委員会・大会秘書がそれぞれの担当領域を主導して業務フローを綿密に設計し,業務委託先を含め総勢100人以上のスタッフにより,600件近い発表を現地1,200人以上+オンライン600人以上の参加者に向けて提供することができました.この背後には,委員たちによる70項目以上の新たな取り組みがあり,それら努力の結実として実に多くの参加者の皆さまから満足の声をいただくことができました.
今大会を通じて,大会委員会と学会理事会はコロナ後の新しい時代の大会開催に向けた貴重な経験を積むことができました.プログラム委員会は理事会と連携して国際会議査読スケジュールとの競合の問題を整理し,年次大会への論文投稿に関する制約を軽減することができました.また論文投稿数の飛躍的な増加に対応するため,プログラム編成プロセスの効率化・大会サイトのCIデプロイ・大会賞選考基準の見直し等に意欲的に取り組んでいただきました.実行委員会は,発表件数・参加者数の激増にも益々士気を高め,実行委員12名+アルバイト2名の総力戦で最後まで発表者満足・参加者満足を追求していただきました.一部で準備が行き届かなかった部分は,ひとえに大会委員長の不徳の致すところであり,この場をお借りして深くお詫び申し上げます.今後に向けて,負担が重くなる傾向にある委員の業務負荷軽減を目指すために,さらなる業務効率化とアウトソーシングを進められるよう,改善を進めてまいります./p>
最後に,今大会を支えていただきました参加者・発表者・座長・スポンサー団体の皆さま,招待講演・チュートリアルの講演者の皆さま,現地開催を支援いただいた沖縄県・沖縄観光コンベンションビューロー・沖縄コンベンションセンターの職員の皆さま,初のハイブリッド開催を成功させた実行委員会・プログラム委員会・大会秘書・業務委託関係先の皆さまに心よりお礼申し上げます.
第29回年次大会プログラム委員長 東中 竜一郎(名古屋大学)
■優秀賞・若手奨励賞
言語処理学会年次大会の優秀賞は,年次大会において論文の内容が優れていると認められた発表論文に与えられる賞です.また,優秀賞のうち特に優れたものがあれば,最優秀賞として選定されます(言語処理学会年次大会優秀賞規定).同様に若手奨励賞は,年次大会において論文の内容が優れていると認められた発表論文に関して,以下の条件を満たす著者に与えられる賞です(言語処理学会年次大会若手奨励賞規定).
・年次大会開催年の4月1日において満30歳未満のもの
・当該論文の第1著者であること
・過去に若手奨励賞を受賞していないこと
・ある論文が優秀賞を受賞する場合は,その論文の第1著者は若手奨励賞の対象とはならない
近年の年次大会の場合と同様に,今大会においても大会の開始前に全論文を対象に審査を行い,授賞論文・著者を決定し,大会のクロージングにて表彰しました.
賞選考のための内規では,
・優秀賞は全発表件数の約2%を目安とする
・優秀賞の中で特に評価の高いものを0件から2件の範囲で最優秀賞とする
・若手奨励賞は対象論文のうち最大4%程度を目安に選出する
としております.なお,前大会では若手奨励賞の選出数については,10件を目安としていましたが,発表件数の増加を受けて,プログラム正副委員長と大会賞委員の議論を経て割合にしました.4%は前大会に準じた 割合です.
今大会の全発表件数は579件(前大会386件)であり,優秀賞の授賞件数は全体の約2%にあたる12件?14件を目安としました.また若手奨励賞の対象となる論文は406件(前大会280件)でした.受賞件数はこの4%程度にあたる16件〜18件を目安としました.
年次大会優秀賞・若手奨励賞の選考にあたっては,選考委員会を組織し,慎重な議論を重ねた上で選定を行いました.今回,選考委員会は計244名(前大会248名)で構成されました.各授賞論文には議論で合意された授賞理由が付記されます.授賞の最終的な責任はプログラム委員長の東中が負います.
賞選考は「論文審査」と「最終選考」の二段階で行いました.論文審査に先立ち,投稿カテゴリにより全ての論文を5つのグループ(A,B-a,B-b,C-a,C-b)に分けました.グループ毎に,そのグループの研究分野を専門とする選考委員を各論文に対し5名割り当て,審査を行いました.審査委員はそれぞれ最大13件の論文を担当し,各論文に対して,総合評価(6段階),新規性(5段階),有用性(5段階),読みやすさ(5段階)の観点から審査しました.この際,優秀賞に推薦する論文については推薦理由を記述するようお願いしました.また,前大会と同様,若手奨励賞のための推薦項目は設けず,優秀賞と若手奨励賞の選考は同じ総合評価の点に基づいて行いました.
論文審査終了後,最終選考を行いました.選考委員は,東中竜一郎(名古屋大;プログラム委員長),高村大也(産総研;プログラム副委員長),河原大輔(早稲田大;前プログラム委員長),中山 祐輝(楽天;大会賞担当プログラム委員)の4名です.最終選考では,原則として,論文審査において審査員が与えた総合評価の点数の高い論文を授賞論文として選びました.4名の最終選考委員のうち,授賞のボーダーライン付近にCOIのある論文があったときは,COIのない選考委員で授賞論文を決めました.
最終選考では,まず優秀賞を決定しました.最初に,審査員による評価点のばらつきを抑えるために,一般化線形混合モデルを用いて総合評価の点を補正しました(以下では,補正後の評価点を単に「評価点」と呼びます).次に,評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,上位13件の論文を優秀賞として選びました.優秀賞の授賞件数の目安は12件〜14件ですが,13位と14位の論文の評価点に開きが見られたことから今大会では13件に対して優秀賞を授賞することにしました.次に,これら13件のうち,2位と3位の論文の評価点に大きな差があったことから,上位2件の論文を最優秀賞として選びました.
次に,若手奨励賞を決定しました.優秀賞受賞論文ではなく,かつ若手奨励賞の受賞資格を満たす論文について,評価点が高い論文から順に,審査員の推薦理由をチェックして受賞するにふさわしい論文であることを1件ずつ確認し,上位18件の論文を若手奨励賞として選びました.若手奨励賞の授賞件数の目安は16件〜18件ですが,16位から18位の論文の評価点が僅差でボーダーラインを入れることが難しいこと,内規を満たすことから,今大会では18件に対して若手奨励賞を授賞することにしました.
以下は,最優秀賞,優秀賞,若手奨励賞の論文とその授賞理由です.
*言語処理学会第29回年次大会 最優秀賞(2 件:発表番号順)
B3-3 文書レベル関係抽出における根拠認識の統合
Youmi Ma, An Wang, 岡崎直観 (東工大)
本論文では,文書レベル関係抽出(DocRE)において,ATLOPをベースモデルとし,根拠認識を取り込んだ新たな手法DREEAMを提案しています.加えて,DocREの根拠の教師信号の自動付与を行うことで,大量の自動ラベル付きデータを生成し,これを学習時に利用しています.評価実験の結果,提案手法が既存の手法よりも高い性能を示し,提案手法の有効性を示しています.これらの新規性・有効性の高さから,最優秀賞にふさわしいと判断しました.
Q3-10 対訳データを使わないマルチリンガル表現学習に必要な分布構造とは何か
李凌寒, 鶴岡慶雅 (東大)
本論文では,対訳を使わないマルチリンガル表現学習手法が,どのような分布構造を利用して言語間の対応関係を発見しているのかを,自然言語の局所的な分布と大域的な分布の二つの観点から分析しています.分布に関する一部の情報を除去するデータ改変操作を導入する分析方法は,非常に独自性の高いアイデアと考えられます.実験によって,局所的/大局的な分布のいずれかだけを用いて言語間対応関係を学習できる一方で,アルゴリズムによっては大局的な分布のみでは言語間対応を捉えられないことが示唆されました.この知見は,ニューラル言語モデルに基づく表現学習の理解に大きく貢献することが期待されます.以上の観点から最優秀賞にふさわしい論文と判断しました.
*言語処理学会第29回年次大会 優秀賞(11件:発表番号順)
C3-1 埋め込み表現の意味適応による知識ベース語義曖昧性解消
水木栄, 岡崎直観 (東工大)
本論文では,BERT埋め込みを変換してWSDに適応させる新たな手法を提案しています.WordNetに基づく吸引・反発学習と自己学習を組み合わせることで,評価実験において高い性能を示しています.また,提案手法の一部を無効化した実験なども行っており,本実験に対する信頼性は高いです.新規性・信頼性の高さから,優秀賞にふさわしいと判断しました.
B3-2 Cross-stitching Text and Knowledge Graph Encoders for Distantly Supervised Relation Extraction
代勤 (東北大), Benjamin Heinzerling (理研/東北大), 乾健太郎 (東北大/理研)
遠隔学習(Distant Supervision)に基づく関係抽出において,テキストのエンコードと知識グラフのエンコード時にクロスステッチをかけることで相互参照する手法を提案しています.提案手法は,評価実験で他を圧倒する世界最高性能を達成しており,アプローチ・性能の両面において高く評価できる研究です.二つの標準的な公開データセットを用いた実験設定になっているため,今後の比較手法としてふさわしく実用性があり,当該分野への貢献も大きいと考えられます.以上の観点から,優秀賞にふさわしい論文と判断しました.
C3-3 自己注意機構における注意の集中が相対位置に依存する仕組み
山本悠士, 松崎拓也 (東京理科大)
本論文は,Transformerの自己注意機構において,各トークンが周辺のトークンに注意を集中させるメカニズムを分析しています.分析の結果,自己注意機構は,学習された位置埋め込みから周期的な波形を抽出し,その波形の位相がずれる方向に注意を集中させていることを明らかにしました.これより,絶対位置埋め込みによって相対位置に基づく推論ができるという経験的な事実のメカニズムの一部が解明されたと考えられます.今後のTransformer研究,さらには自然言語処理に大きなインパクトを与える可能性があることから,優秀賞にふさわしいと判断しました.
Q3-12 スケール不変な木構造棒折り過程に基づく無限階層トピックモデル
江島舟星 (Harvard), 持橋大地 (統数研)
本論文では,階層的トピックモデルで用いられる木構造棒折り過程において,トピックの平均確率が深さに応じて指数的に減少するという問題に着目し,これを解決する新たな手法を提案しています.提案手法のアイデアは,ニューラルベースのモデルにも適用可能な汎用性の高いものであり,3種類のデータセットによる定量評価を行うなど,実験による検証も確実に行われています.論文の完成度も高く,幅広い応用が期待できる点から,優秀賞にふさわしいと判断しました.
A5-3 ReazonSpeech: A Free and Massive Corpus for Japanese ASR
Yue Yin , Daijiro Mori (Reazon), Seiji Fujimoto (Clear Code)
本論文は,日本語の音声認識用コーパスを大規模に自動構築する手法について報告しています.本手法は,テレビ番組から音声と字幕を抽出し,音声認識モデルと音声認識用コーパスをブートストラップ的手続きによって徐々に改良するものです.音声認識用コーパス,その構築ツール,学習した音声認識モデルを無償で公開しており,商用にも用いることができます.コーパスは日本語では最大規模であり,モデルは高い性能を達成しています.これらの貢献から優秀賞にふさわしいと判断しました.
D7-4 日本語WiCデータセットの構築と読みづらさ検出への応用
吉田あいり, 河原大輔 (早大)
本論文は,語義曖昧性を利用して日本語文の読みづらさを評価する方法を提案しています.曖昧性の判定は,各単語の各語義に例文が与えられているとし,対象単語について各例文と入力文が同義でありうるかを判定することにより行っています.同義性の判定の学習に用いるため,日本語版WiC (word in context)を構築し,また単語親密度を用いたデータ拡張も提案しています.手法のアイデアが面白いこと,また言語リソースとしての価値が高いことから,優秀賞に値すると判断しました.
Q8-10 大規模言語モデルに基づく複数の外部ツールを利用した推論フレームワーク
稲葉達郎, 清丸寛一, Fei Cheng, 黒橋禎夫 (京大)
本論文では,大規模言語モデルによる推論において,検索器や電卓などの複数の外部ツールの利用を可能にする新たなフレームワークを提案しています.プロンプトは,説明文,Few-Shot事例,問題文から構成されており,提案されたフレームワークでは,このプロンプトとGPT-3を用いています.評価実験より,提案したフレームワークの有効性を示しているため,有効性・実用性の高さから,優秀賞にふさわしいと判断しました.
B9-5 時系列構造化ニューラルトピックモデル
宮本望, 磯沼大 (東大), 高瀬翔 (東工大), 森純一郎, 坂田一郎 (東大)
本論文では,トピック間の依存関係を捉える時系列トピックモデルを提案しています.学術文献に関するデータセットを用いた実験によって,その効果を三つの尺度から入念に示しており,信頼性のある成果と考えられます.直前のトピックだけでなく,複数時刻に跨るトピック間の依存関係をモデル化するために,self-attention 機構を導入するという点において独自性の高い研究です.また,アテンションの解釈についても考察されており,トピック遷移の可視化や学術文献におけるトピックの動向調査への応用に大きく貢献すると考えられます.以上の観点から優秀賞にふさわしい論文と判断しました.
Q10-9 人間の多次元的な心的表象に基づく幼児語彙獲得モデルの構築
藤田守太, 南泰浩 (電通大)
本研究では,人間が物体を認識する際に用いる心的表象に注目すると共に幼児の内発的な動機付けである好奇心を導入することで幼児の語彙獲得機構のモデル化を行い,実験を通して提案手法が49個の特徴量の組み合わせで語彙獲得を行えることを確認したものです.特に言語獲得における古典的問題に対して計算モデルを用いてシミュレーションし,認知科学・認知言語学の知見に立脚した幼児の語彙獲得モデル化を行っている点,さらに幼児が自律的に特徴量の制約を課す機構を獲得していることを示した点など,当該分野に対し新たな知見をもたらすものと言えます.以上のことから優秀賞にふさわしい論文と判断しました.
A11-4 SlideVQA: 複数の文書画像に対する質問応答
田中涼太, 西田京介, 西田光甫, 長谷川拓, 斉藤いつみ, 齋藤邦子 (NTT)
本論文では,複数の文書画像を対象とした質問応答タスクおよびデータセットSlideVQAを提案しています.さらに,このタスクに対し,複数文書画像の同時理解を行うためのモデルM3Dを提案し,実験でその有効性を示しています.提案されているタスクは,複数枚の文書画像を対象として,複雑な推論を必要とするものであり,このようなデータセットが存在することは,分野にとって非常に有益であり,提案されたモデルも,強いベースラインとなりうると考えられます.以上の理由により,優秀賞にふさわしいと判断しました.
H12-4 構文解析と画像生成の統合による機能語の言語理解
山木良輔, 谷口忠大 (立命館大), 持橋大地 (統数研)
本論文では,テキスト画像生成モデルにおいて,機能語の意味を正しく捉えるための,構文解析を利用した手法を提案しています.CCGによる構文解析結果から,句や文の分散表現を計算し,これらを単語の分散表現とともに利用しています.テキストによる画像生成という,広い応用先の期待できるテーマにおいて,統語構造と実世界の関係を扱える新しい手法を提案しており,実験による検証も確実に行われていることから,優秀賞にふさわしいと判断しました.
*言語処理学会第29回年次大会 若手奨励賞(18件:発表番号順)
B2-4 トピックエントロピーに基づく学習データ選択による事前学習言語モデルの訓練安定性向上
永塚光一 (創価大)
本論文では,事前学習言語モデルの訓練安定化を目的にして,学習データ手法 Topic Entropy-based Data Selection (TEDS) を提案しています.事前学習言語モデルとしてRoBERTaを採用し,GLUEにより評価実験を行った結果,ベースラインよりも高い性能を示しており,新規性・信頼性・実用性の高さから,若手奨励賞にふさわしいと判断しました.
D3-1 言語モデルの第二言語獲得
大羽未悠 (NAIST)
本論文は,言語モデルの言語転移について第一言語での学習が第二言語の文法獲得にどのように影響するかという興味深いリサーチクエスチョンを掲げています.特に,L2の提示方法や,L1の違いの影響を検証しています.全体的な性能の検証にとどまらず,様々な文法項目に着目し丁寧な分析をしています.本研究は,言語モデルの言語転移について洞察を深めるという工学的な貢献とともに,計算心理言語学的な方面への発展性も期待できることから,若手奨励賞に値すると判断しました.
H3-4 Controlling Text Generation with Fiction-Writing Modes
Wenjie Zhong (東大/産総研)
本研究は,物語生成モデルの制御としてライティングモードを追加し,dialog,action,descriptionに分けて文章生成することにより文章内容の質を担保することを目指したものです.物語の文章生成に関して,カテゴリの設定から始まりデータセットの作成から自動評価まで着実に研究を重ねています.文生成において文体の様式を操作するために必要となるコーパスを整備するなど,当該分野への貢献も認められます.以上のことから若手奨励賞にふさわしいと判断しました.
D4-1 日本語有害表現スキーマの提案と評価
小林滉河 (LINE)
本論文は,日本語における有害情報のスキーマを提案し,当該スキーマに基づいたデータセットの構築を行っています.さらに,構築したデータセットから有害表現検知器を構築し,その精度評価を行っています.有害情報の検出は,SNSの研究のみならず,対話システムを含む,大規模言語モデルを用いた種々の研究においても,ますます重要なタスクとなってきています.この重要かつ実用的な課題において,今後の研究への方向性を示した点は高く評価できることから,若手奨励賞にふさわしいと判断しました.
C4-4 ガウス埋め込みに基づく文表現生成
陽田祥平 (名大)
本論文では,包含関係などの文同士の非対称的な関係を捉えるために,ベクトル表現(点)による文埋め込みの代わりに,ガウス分布(領域)として埋め込む手法,及び包含関係の認識のための類似度指標を提案しています.実験によって,点表現では困難であった包含関係の向きの推定が可能であることを示しており,発展性に富んだ研究結果です.特に,損失関数において,KL ダイバージェンスを考慮して包含関係の向きの推定を行う方法は,独自性が高いと考えられます.以上の観点から若手奨励賞にふさわしいと判断しました.
P6-2 Average Token Delay: 同時翻訳の遅延評価尺度
加納保昌 (NAIST)
本論文は,同時翻訳における遅延を評価する新たな尺度 Average Token Delay (ATD)を提案しています.翻訳の開始のタイミングに着目した既存の評価尺度に対して,提案尺度は終了のタイミングを考慮することで,終了の遅れが次の開始の遅れにつながるという同時翻訳の特徴を捉えようとしています.英独同時機械翻訳の実験により,提案尺度は,既存尺度では適切に測定できないチャンクベースのモデルにも対応できることを示しています.提案尺度に新規性があることに加えて,今後さらなる検証を経ることで同時翻訳タスクにおいて幅広く活用されると期待されることから,若手奨励賞にふさわしいと判断しました.
Q6-4 転移学習における強化学習を用いた効率的なトークナイザとモデルの同時学習
平子潤 (名大)
本論文では,事前学習言語モデルの転移学習時に効率的にトークナイザとモデルを学習する手法を提案しています.提案手法では,強化学習を用いており,評価実験によって,提案手法の性能の高さが示されています.また,強化学習を用いて定式化することにより,計算量も抑えられているため,これらの新規性・実用性の高さから,若手奨励賞にふさわしいと判断しました.
D6-5 ニューラル分類器の予測の解釈に基づく集団に特徴的なテキスト表現の抽出:アメリカ人を例に
渡邉幸暉 (京大)
本研究では,ある集団に特徴的なテキスト表現をその他の集団との比較により抽出する手法を提案したものです.このような対照研究は従来,事例分析を中心とする社会言語学や,アノテーションを必要とするコーパス言語学などで進められてきましたが,対象としうるデータの規模が限られるという問題がありました.この点を踏まえ,本研究では説明可能なAIを応用した手法を提案している点に新規性が認められます.対照研究に新たな方法論と知見をもたらしていることから,若手奨励賞に値すると判断しました.
H7-5 ゼロ照応解析に基づく項省略補完を取り入れた対話応答生成
上山彩夏 (静大)
本論文は,ゼロ照応解析に基づく項省略補完を用いた対話応答生成手法を提案しています.基本的なアイデアは,省略されている要素を補完した上で発話生成を行うというシンプルなものですが,複数のデータセットやモデルを用いた実験を綿密に行い,提案手法により発話の首尾一貫性および魅力度が改善するという結果を得ています.客観評価だけでなく,人手による主観評価も行っており,結果の説得性は非常に高いものです.今後の対話システムの改善に資すると考えられることから,若手奨励賞にふさわしいと判断しました.
P7-11 Improving Peer-Review Score Prediction with Semi-Supervised Learning and Denoising Networks
Muangkammuen Panitan (山梨大)
本論文は,投稿論文のピアレビューにおける観点別の自動スコア予測(automatic peer review aspect score prediction, PASP)を行う手法を提案しています.本研究はPASPにΓ-Transformer-LSを用いた半教師あり学習を適用した初めての試みであり,PeerReadデータセットを用いた評価実験において,提案手法は複数の観点で比較手法を上回るなど,一定の有効性を示しています.投稿される学術論文の数が大きく増加する中,本研究の発展が学術コミュニティに大きく寄与すると考えられることから,若手奨励賞にふさわしいと判断しました.
H8-2 Utilizing Pseudo Dialogue in Conversational Semantic Frame Analysis
Shiho Matta (京大)
本論文は,対話データに対する意味フレーム解析を行うためのデータ拡張手法を提案しています.具体的には,料理ドメインを対象とし,レシピから抽出した意味フレームと意味フレームから作成した対話データを対応づけることで,疑似的な意味フレーム付きの対話データを作成し,意味フレーム解析器の学習に用いています.シンプルな手法ながら,精度も高く,有効性が検証されています.本研究は対話の深い理解に欠かせない技術に取り組んでおり,今後の多様なドメインへの適用も期待できることから,若手奨励賞にふさわしいと判断しました.
A9-3 自然言語生成タスクの自動評価指標のためのドメイン外検出
伊藤拓海 (東北大)
近年,機械翻訳や要約生成などのテキスト生成タスクにおいて,学習を伴う自動評価指標が用いられるようになってきており,その頑健性が重要な研究課題となっています.本論文では,ドメイン外の入力に対しては誤った評価を招くという問題を提起し,ドメイン外の入力検出手法を提案しています.評価の信頼性向上という課題の重要性と,ドメイン外検出を参照なし評価指標に適用するという新規性,さらに提案手法は参照あり評価指標にも適用可能であるという将来性を鑑みて,若手奨励賞にふさわしいと判断しました.
Q9-3 On the Bias of CLIP for Object-Attribute Recognition
Yutaro Yamada (イェール大)
本論文は,視覚と言語の融合モデルの一つであるCLIPを分析し,Concept Association Bias (CAB)が存在することを明らかにしています.CABは,画像内に2つのconceptが存在するときに,テキストプロンプトには1つのconceptしか言及されていない場合に生じることを実験により示しています.CLIPを視覚と言語に基づく質問応答などに応用する場合にはCABに注意する必要があり,これは有益な知見と考えられます.本研究は独創性が高く,今後の発展も期待できることから,若手奨励賞に値すると判断しました.
H10-3 ARKitSceneRefer: 3D屋内シーンでの参照表現による小物の位置特定
加藤駿弥 (京大)
本論文は,3D参照表現理解のための新たなデータセットを構築したことを報告しています.既存のものと異なり,構築されたデータセットは小さな物体を主な参照先としていることを特徴としています.この特徴は,屋内で利用するロボットとのコミュニケーションなど,将来的な応用を見据えたものとなっています.また,このデータセットを用いて実際に参照表現に対応する物体を特定する実験を行い,その性能を検証しています.本研究は,実応用を意識しているという点で価値が高く,今後の発展も期待できることから,若手奨励賞に値すると判断しました.
Q12-1 JMultiWOZ: 日本語タスク指向型対話データセットの構築
大橋厚元 (名大)
本論文は,日本語のマルチドメインタスク指向型対話データセットの構築方法について報告しています.本手法は,オントロジーの定義,バックエンドデータベースの構築,対話ゴールの設計と作成,クラウドソーシングを用いた対話収集の4ステップからなります.構築したデータセットは,6つのドメインにまたがる4,254対話からなる大規模なものであり,ベンチマークとして用いることができることも示しています.本研究の成果は実用性が高く,対話システム研究の今後の活性化につながると考えられることから,若手奨励賞に値すると判断しました.
H12-2 実世界のマルチモーダル情報に基づく指示語を含んだ言語指示の外部照応解析
大山瑛 (立命館大)
本論文は,実世界のマルチモーダル情報を用いて言語表現における外部照応を解決することを提案しています.具体的には,言語表現に含まれる物体カテゴリの情報,指示語の言語情報,指差しの物理的情報を用いて,照応解決を行っています.また,実機実験を通して性能の検証を行っているという点でも価値が高い研究です.ロボットと人間のコミュニケーションの円滑化を促進する技術であることに加え,言語処理分野の隣接分野との連携を活性化させることも期待できることから,若手奨励賞に値すると判断しました.
P12-4 球体表面を利用した位置符号化
岡佑依 (NTT)
本論文では,Transformerで単語の位置情報を取り扱う位置符号化において,絶対位置と構造位置(依存構造木での深さ)を同時に符号化するための新たな手法を提案しています.2種類の位置情報を球体表面上の点として表現することで,従来手法における,位置の値の衝突等の問題を解決しています.提案されているアイデアは秀逸で,実験もしっかり行われ,実際に提案手法の有効性が確認できています.非常に有望な方向性を示しており,若手奨励賞にふさわしいと判断しました.
A12-5 読解問題における論理推論の一貫性評価
川畑輝 (NAIST)
本研究では,機械読解の論理的推論能力の信頼性を評価するデータセットRULE (Rationale Understanding for Logical reasoning Evaluation) を構築することで,論理的一貫性の評価実験を行なっています.結果,人間とモデルの精度には大きな乖離が見られること,また特に誤答選択肢の根拠理解に改善の余地が大きく残されていることなどを明らかにしています.ニューラルネットワークを用いたモデルではモデルの出力の根拠を明らかにすることが難しいため,本研究で構築したデータセットは今後,分野の発展に大きく貢献すると考えられます.以上のことから若手奨励賞に値すると判断しました.
■言語資源賞
言語資源賞は,言語処理学会と言語資源協会(GSK)との共同事業であり,年次大会で発表され,優れた言語資源を作成したと認められる論文に対して与えられる賞です.論文投稿時に言語資源賞の審査を申し込むかどうかの自己申告の選択肢が設けられており,今大会では,97件の応募がありました.応募のあった論文をGSKの審査員が審査し,今大会では以下の2件が選出されました.授賞理由は以下の通りです.
H1-1 日本語日常対話コーパスの構築
赤間怜奈 (東北大/理研), 磯部順子 (理研), 鈴木潤, 乾健太郎 (東北大/理研)
本論文は規範的な日本語で書かれた高品質な日常対話コーパスを構築しています.「日常生活」「学校」「旅行」「健康」「娯楽」の5つのトピックについて,作業者が対話を作文して,倫理的・道徳的に問題があるなど不適切な対話を除去し,さらに校正・校閲作業を行い表現を正規化してあります.その結果,5,261の対話,41,780の発話が収録されています.大規模であることに加え,雑談を収録した既存の対話コーパスと比べて,語彙的多様性,親密性,可読性をバランスよく兼ね備えています.同コーパスは2023年3月に公開を予定しています.実際の対話を収録したコーパスには人間によるリアルな言語表現が表出していますが,文法誤りやくだけた表現も多く,計算機で処理しにくい面もあります.これに対し,このコーパスにおける対話は高品質な日本語で書かれていることから,ノイズにわずらわされることなく対話技術の開発や評価を比較的容易に行うことができるため,価値の高い言語資源であると言えます.
A11-4 SlideVQA: 複数の文書画像に対する質問応答
田中涼太, 西田京介, 西田光甫, 長谷川拓, 斉藤いつみ, 齋藤邦子 (NTT)
SlideVQAはスライドデッキ(複数のスライドからなるプレゼン資料)に対する質問応答タスクのデータセットです.質問とスライドデッキが与えられたとき,質問に対する回答とその根拠となるスライドを返すタスクを想定し,それを解く際のマルチホップ推論(複数のスライドを参照して質問に回答すること)や数値推論を扱っています.SlideVQAには,2,619件のスライドデッキと,それに対するシングルホップ質問12,466件,マルチホップ質問2,018件とその回答が収録され,さらに890,945件のスライドの意味領域(タイトル,表など)や,数値推論が必要な質問に対しては算術式もアノテーションされています.既存の類似のデータセットと比べて規模が大きく,また算術式をアノテーションした初めてのデータセットです.複数の文書の内容を参照して理解する高度な自然言語処理技術・推論技術を要するチャレンジングなタスクのデータセットであり,これを用いた今後の研究の進展が期待されます.
■スポンサー賞
スポンサー賞の選考は,各スポンサーに委ねられており,独自の視点でそれぞれ選出していただきました.今大会ではスポンサー9団体からそれぞれ1件の論文を選出していただき,合計9件の表彰をいたしました.各スポンサーから公開されている授賞理由は以下の通りです.
*日本電気賞
B1-1 計算資源が限られた複数組織での出力選択による協働の検討
伊藤郁海 (東北大), 伊藤拓海 (東北大/Langsmith), 鈴木潤, 乾健太郎 (東北大/理研)
本論文は,限られた計算資源で構築された言語モデルを複数協働させることで,大規模な言語モデルと同等の精度を出せる可能性を示しました.課題意識が現実的で面白く,日本語の地位が巨大言語モデルの中で低い中,目指すべき一つの方向性を示唆していると感じました.評価タスクや設定がまだ限定的であるものの,今後の可能性に期待を持てるものであり,スポンサー賞に選ばせて頂きました.
*サイバーエージェント賞
A7-2 参照例を使わないキャッチコピーの自動評価
新保彰人, 山田寛章, 徳永健伸 (東工大)
本研究は,日本語としては初となるキャッチコピーとその評価値からなるデータセットを構築し,さらに本データセットを用いて参照なし自動評価手法を探究しています.弊社でもキャッチコピー含め広告理解に関する研究に取り組んでいますが,キャッチコピーは様々な広告の中でもその良し悪しの判断が最も難しい広告形態の一つであると考えています.本データセットはキャッチコピーの実際のコンテストにおける受賞情報をもとに評価値を付与されているためデータセット自体の信頼性・有用性が高く,またキャッチコピーの自動評価の方法論として,評価値の絶対値を再現するより評価値の相対的な差を再現する対照学習を用いた評価手法が有効であるなど弊社としても大変参考になる有用な知見を多く発見されていることから,スポンサー賞として選定いたしました.
*富士通賞
D2-2 権利侵害と不快さの間:日本語人権侵害表現データセット
久田祥平, 若宮翔子, 荒牧英治 (NAIST)
誹謗中傷やヘイトスピーチの線引きという,受け手側の主観に大きな影響を受ける問題設定において,法曹判断という客観的な基準を持ち込むことでデータセットの整備を行っていることに,妥当性と独自性があると評価しました.一般ユーザーが手軽に大規模言語モデルにアクセスできるようになった現在,AIと道徳やAIと倫理について,さらに議論を深めていく必要があります.本研究は,このような難しいテーマに切り込み,客観的判断基準によって議論を一つ先に進めている点で高く評価できます.また,予稿の読み物としてのクオリティも非常に高く,多くの人に推薦できる研究発表であると判断しました.今後のデータセットの拡充や,新たな分析への展開を期待しています.
*Helpfeel賞
A4-2 FAQ検索における言い換え生成を利用したデータ拡張手法
曹羽隆, 小川泰弘, 外山勝彦 (名大)
Helpfeelは質問文の言い換え表現を追加することで高い検索精度を実現するFAQシステムですが,一部は人力で生成しているため,より効率的な言い換え表現生成を目指して研究を行っています.その観点で,既存のデータから言い換え表現を自動生成する本研究のアプローチは,弊社が目指している方向性と非常に近いと感じました.
*LINE賞
C12-3 Wikipedia協調フィルタリング法
竹内皓紀 (群大), 林克彦 (北大)
賞審査にあたっては,COIを除く学生主著のものを対象とし,対象の論文全てについてチームの有志で読み数本に候補を絞った.その後,各発表を聴講し決定した.受賞論文については,これまでほとんど活用されてこなかったWikipediaの編集者情報を用いるというアイデアそのものが非常に面白い.さまざまな応用タスクでも活用が期待される汎用的な基礎技術で,社内のプロジェクトでも使いやすいと感じた.推薦タスク上でベースラインを大きく上回る性能を複数のドメインで達成するなど,高い効果が示されており,スポンサー賞を与えたいと思う.
*博報堂DYホールディングス賞
H11-5 大規模言語モデルによる脚本データの解析: プロダクト・プレイスメント挿入箇所の探索と評価
山木良輔 (立命館大), 楢木悠士 (早大), 長沼大樹 (UdeM/Mila)
広告業界において特に関心が高まっている,「映像作品中に実在商品を登場させる」という広告であるプロダクトプレイスメントを題材とされていることで関心を持ちました.本研究では2つの観点,すなわち顕在性の高いシーンの探索と広告挿入箇所の探索が重要と整理され,それぞれに対応する手法が別個に提案されています.実際の映画を用いた実験では,広告として適切でないシーンが抽出される場合があることが指摘されていました.本研究は確たる先行研究がない中,研究の方針を策定することがまず大変だったと思います.大変興味深く,広告ビジネスに新しい洞察の方向性や,さまざまな手法の可能性を与えてくれると思い,本賞に選びました.
*日立製作所賞
H5-2 クエリ指向要約におけるクエリと要約の統合的な生成
服部翔, Youmi Ma, 岡崎直観 (東工大)
本論文は,文書からクエリと要約文の両方を同時に複数生成するクエリ推薦付き要約を提案しています.この提案の課題としてユーザ・エクスペリエンスの向上を掲げており,実用的な課題に基づく研究立案の姿勢は,日立グループの掲げる「人々の幸せを支える」という理念ともマッチしています.論文発表のみにとどまらず,デモサイトを公開することで,課題としていたユーザ・エクスペリエンスの向上を実際に体験させられるよう研究を昇華されている点も素晴らしいと感じました.このような研究成果としての一貫性もさることながら,複数の手法を用いた網羅的な実験を行っている点など論文としての完成度も評価し,スポンサー賞とさせて頂きました.
*高電社賞
A2-2 文単位のNbest候補制約に基づく文書翻訳
駒田啓伍 (東北大), 森下睦 (NTT), 鈴木潤 (東北大)
駒田啓伍 (東北大), 森下睦 (NTT), 鈴木潤 (東北大)
*coly賞
H3-4 Controlling Text Generation with Fiction-Writing Modes
Wenjie Zhong (東大/産総研), Jason Naradowsky (東大), 高村大也 (産総研), 小林一郎 (お茶大/産総研), 宮尾祐介 (東大/産総研)
本論文では, ストーリーのテキスト生成にWriting Modeという概念を導入し, データセットの構築を行っています.また, 実験において, Writing Modeを導入することで, 指定されたWriting Modeに沿った文章がより生成できることが確認されています. 私たちエンターテインメント業界にとって, 魅力的なストーリー生成は非常に重要な要素です.本論文は, より魅力的なストーリーを生み出すことへの貢献度が高いと考え, 今回スポンサー賞に選考しました.
■委員特別賞
委員特別賞は,「ある特定の観点で光る論文を拾い上げたい」「多様な論文に光を当てたい」「論文の完成度よりも将来性を重視したい」といった理念のもと,優秀賞・若手奨励賞とは異なる観点で優れた論文に与えられる賞です.優秀賞・若手奨 励賞を受賞した論文を除外した上で,賞審査の項目点を基準とした一次選考,委員特別賞選考委員による二次選考を経て,26件を選出しました.
B1-1 計算資源が限られた複数組織での出力選択による協働の検討
伊藤郁海 (東北大), 伊藤拓海 (東北大/Langsmith), 鈴木潤, 乾健太郎 (東北大/理研)
【有用性】【将来性】の観点での評価
D1-3 日本語話者の項省略判断に関するアノテーションとモデリング
石月由紀子 (東北大/理研), 栗林樹生 (東北大/Langsmith), 松林優一郎 (東北大/理研), 笹野遼平 (名大/理研), 乾健太郎 (東北大/理研)
【有用性】の観点での評価
Q1-4 問題タイプを考慮した英単語穴埋め問題の不正解選択肢の自動生成
吉見菜那, 梶原智之 (愛媛大), 内田諭 (九大), 荒瀬由紀 (阪大), 二宮崇 (愛媛大)
【有用性】【将来性】の観点での評価
D2-4 逆接の推論関係に着目した日本語談話関係アノテーション
窪田愛, 佐藤拓真, 天本貴之, 秋吉亮太, 峯島宏次 (慶應大)
【将来性】の観点での評価
C2-5 最長一致パターンに基づく高速・高精度な日本語形態素解析
吉永直樹 (東大)
【新規性】【有用性】の観点での評価
P2-14 視覚と言語の融合モデルにおける知識の振る舞いを調査するための表と画像の生成タスクの提案及びその調査結果
上垣外英剛 (NAIST), 林克彦 (北大), 渡辺太郎 (NAIST)
【新規性】【将来性】の観点での評価
Q3-1 事前学習済みTransformerモデルのための注意教師付きFew-shotデータの蒸留
前川在, 小林尚輝, 船越孝太郎, 奥村学 (東工大)
【新規性】【有用性】の観点での評価
P3-6 形態論情報付き日本語Universal Dependencies
田口智大 (ノートルダム大), 宮川創 (国語研)
【有用性】【将来性】の観点での評価
P3-13 要素の重複と不連続性を扱える抽出型の語構成要素解析: 並列分散型形態素解析の提案
黒田航 (杏林大), 相良かおる (西南女学院大), 東条佳奈 (阪大), 麻子軒 (関大), 西嶋佑太郎 (フリー), 山崎誠 (国語研)
【有用性】【将来性】の観点での評価
H4-1 服飾の色情報に基づいたポエティックな商品名の作成支援システム
飯塚柚稀 (群大), 林克彦 (北大), 永野清仁 (群大), 宮尾祐介 (東大)
【有用性】【将来性】の観点での評価
H4-2 入力文章の内容に沿った新たな歌詞を生成する作詞支援システムと剽窃リスクを下げる歌詞生成手法
渡邉研斗, 後藤真孝 (産総研)
【新規性】【将来性】の観点での評価
C4-5 ニューラル数式ソルバーにおける途中結果の追跡と操作
松本悠太 (東北大), Benjamin Heinzerling (理研/東北大), 吉川将司 (東北大), 乾健太郎 (東北大/理研)
【将来性】【有用性】の観点での評価
H4-5 人間とシステムの議論に基づく NLP タスクの問題に対する予測
金子正弘 (東工大), Graham Neubig (CMU), 岡崎直観 (東工大)
【新規性】【将来性】の観点での評価
B5-4 言語モデルの学習における知識ニューロンの形成過程について
有山知希 (東北大), Benjamin Heinzerling (理研/東北大), 乾健太郎 (東北大/理研)
【将来性】の観点での評価
H5-4 InstructSum: 自然言語の指示による要約の生成制御
西田光甫, 西田京介, 斉藤いつみ, 齋藤邦子 (NTT)
【新規性】【有用性】の観点での評価
A7-2 参照例を使わないキャッチコピーの自動評価
新保彰人, 山田寛章, 徳永健伸 (東工大)
【有用性】【新規性】の観点での評価
B7-3 DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル
西田京介, 長谷川拓 (NTT), 前田航希 (東工大), 齋藤邦子 (NTT)
【有用性】の観点での評価
D7-3 百聞は一見に如かず?視覚情報は言語モデルに文の階層構造を教示するか
栗林樹生 (東北大/Langsmith)
【新規性】【将来性】の観点での評価
P7-4 Subspace representation for text classification with limited training data
Erica Kido Shimomoto, Edison Marrese-Taylor, 高村大也 (産総研), 小林一郎 (お茶大), 宮尾祐介 (東大)
【新規性】の観点での評価
C8-2 What can Short Answer Scoring Models Learn from Cross-prompt Training Data?
Hiroaki Funayama, Yuya Asazuma, Yuichiroh Matsubayashi (東北大/理研), Tomoya Mizumoto (理研), Kentaro Inui (東北大/理研)
【新規性】の観点での評価
D9-2 連続時間フラクショナル・トピックモデル
中川慧 (野村アセット), 林晃平 (東大), 藤本悠吾 (野村アセット)
【将来性】の観点での評価
A11-3 専門性の高いオープンブック質疑応答システムの構築と専門家添削による誤答抑制
後藤成晶, 上山道明, 須藤栄一, 清水司, 木村英彦 (豊田中研)
【有用性】の観点での評価
H11-4 広告文生成タスクの規定とベンチマーク構築
三田雅人, 村上聡一朗, 張培楠 (サイバーエージェント)
【有用性】の観点での評価
Q11-6 単語ベクトルの平行四辺形を特徴づける図形距離
前田晃弘 (JAIST), 鳥居拓馬 (東京電機大), 日髙昇平 (JAIST)
【新規性】の観点での評価
H12-1 実世界における総合的参照解析を目的としたマルチモーダル対話データセットの構築
植田暢大 (京大), 波部英子, 湯口彰重, 河野誠也, 川西康友, 黒橋禎夫, 吉野幸一郎 (理研)
【有用性】【将来性】の観点での評価
A12-4 JCommonsenseQA 2.0: 計算機と人の協働による常識推論データセットの改良
栗原健太郎, 河原大輔 (早大), 柴田知秀 (ヤフー)
【将来性】【有用性】の観点での評価
以上