ワークショップ会場周辺には食事をする場所がほとんどないとのことです.
そのためワークショップ当日は,昼食をご持参下さるようお願いいたします.
従来,言語処理学会論文誌に投稿される論文は,学術的な意味での新規性を重要点の1つとして評価されてきました.一方で,言語処理技術を実世界で役立つシステムとして実用化あるいは商用化するためには,斬新なアイデアだけでなく,それを実世界で実際に運用し,検証するための多大な労力を要しますが,その重要性は,「学術上の新規性がない」ということで,あまり重視されてこなかったように思います.しかし,近年言語処理技術が成熟するとともに,実世界で用いられる,言語処理技術を元にしたシステムも数多く見られるようになってきています.広く言語処理技術の発展に寄与することを目的とする当学会としては,これまで軽視されてきたシステム開発へも投稿分野のカテゴリーを拡げ,その論文としての価値を新たな観点から評価し,掲載への道を拓き,更なる論文誌の充実を図るため,論文誌編集委員会において従来の投稿規定を一部改編することを検討しています.そこで,そのための一歩として,言語処理技術を元にして開発されたシステムに関する論文を幅広く集める特集号を企画しました.なお,ここで「言語処理技術を元にして開発されたシステム」とは,企業で開発された(商用化された)システムはもちろんのこと,大学・公立研究機関で開発されたシステムなども範疇に含まれます.エンドユーザに提供されるものならば,どのようなものでも構いませんし,社内で用いられているような,一般に公開されていないものでも構いません.
言語処理学会論文誌 特集号:http://www.anlp.jp/topics/topic151125.html
特に,企業で基礎技術を実用化まで進めた事例,大学・研究機関や産学連携で言語処理技術を実世界の問題に適用しようとする応用研究事例などを幅広く募集いたしますので,多くの皆様の投稿をお待ちしております.
なお,特集号論文は,通常号論文と採録基準を別にして査読することを予定しています.たとえ既存の技術の組み合わせによりシステムが構築されていても,組み合わせや設計コンセプトの新しさ,出来上がったシステム全体に対する新規性,得られた知見の有用性を査読の評価対象とします.したがって,本特集号では技術的な新規性は重視しません.システムの有用性として,言語処理技術を総合的に組み合わせたりして構築されたシステムが,現実的問題へ対応できていることを,定量的あるいは定性的に示すことができているかどうかを重視します.
この特集号を企画するのに合わせ,今回年次大会に併設するワークショップを企画しました.言語理解とコミュニケーション研究会の主催するテキストマイニングシンポジウムで多数発表されているような,実世界のビッグデータに対するテキストマイニングシステムの適用事例,過去に何回かワークショップが企画されている,言語処理技術を用いた教育支援システムの開発事例など,言語処理技術を用いた応用システムに関する発表を広く募集しますので,多数の投稿をお待ちしています.なお,提案するシステムが製品化されている場合は,その製品名で提案システムを参照しても問題はないですが,単なる製品紹介や過剰な宣伝にならないように留意してくだされば幸いです.
2016年3月11日(金)
仙台国際センター 会議棟2階 大会議室「橘」
所在地:〒980-0856 宮城県仙台市青葉区青葉山無番地
アクセス:仙台市営地下鉄東西線 国際センター駅下車 徒歩1分
電車以外でのアクセス方法はこちらをどうぞ
不要(本会議参加費に含まれます)
2016年2月12日(金)
2016年2月19日(金)
2016年3月11日(金)
司会: 永田亮(甲南大)
社会学では職業や産業は性別や年齢などと同様に重要な変数であるとの認識から,正確を期するために,自由回答で収集したデータを研究者自身がコードに変換することが多い.これは職業・産業コーディングとよばれるが,大規模調査の場合,膨大な労力と時間がかかる上に,結果における一貫性の問題も存在する.そこで,自然言語処理と機械学習(SVM)を適用したコーディング自動化システムを開発した.本システムは第3位までのコードを予測して提示し,第1位の予測コードには3段階の確信度も付与する.東大社会科学研究所からWebによる利用サービスの試行提供が開始されて以来,大規模調査だけでなく研究者グループや個人による利用も増えている.
コールセンターを運営する企業ではコスト削減を目的として,想定質問をFAQとして蓄積していることがある.FAQの質問は,オペレータが意味的に似た問い合わせ履歴をまとめて代表的な表記で作成したものである.そのため,そのFAQで回答できるような問い合わせであっても語彙が一致せず,全文検索エンジンによるFAQ 検索システムでは,適切なFAQを上位にランキングできないことがある.本稿では,自然文を入力として受け付けるFAQ検索システムに文書分類器を利用することで,問い合わせと語彙が一致しなくても,適切なFAQをより上位にランキングする方法を提案する.文書分類器を学習するためには,過去の問い合わせがどのFAQで回答されたかという情報が必要であるが,本稿で扱うデータには明示的にどのFAQで回答されたという情報がない.そこで,本稿ではFAQで回答できる問い合わせの集合を自動で収集し,FAQごとに二値分類器を学習することで,問い合わせがそのFAQで回答できるかどうかを予測する.実験をおこない,FAQごとの二値分類器を用いることで,FAQと問い合わせの語彙が一致しないような場合でもFAQのランキング性能が向上することを示す.
企業内の営業活動を記録するSales Force Automation(SFA)システムには大量の営業日報テキストが蓄積されており,営業活動の改善に活用したいというニーズが高まっている.本研究では営業担当者はお客様の課題に関する情報を求めており,類似した課題の商談を参考にすることでお客様に対してより適切な提案を可能にすることが出来ると言う仮説に基づいて過去の商談事例を検索するシステムを提案する.この仮説を検証するために,営業日報テキストからお客様の課題に関する情報を抽出する技術を開発し,営業担当者が課題の類似した商談事例を検索するシステムを構築した.さらに,構築したシステムを試験的に利用してもらい,システムの有用性を検証した.システムの利用者アンケートの結果から,営業担当者がお客様に興味喚起を行う際の情報を獲得するための手段として,本システムが有効であることが分かった.
司会: 貞光九月(NTTメディアインテリジェンス研究所)
NHKでは2012年4月より,ウエブサイトNEWSWEB EASYにてやさしい日本語のニュース5記事を毎日提供している.これらのニュースは日本語教師と記者が共同作業でWEBのニュースをやさしい日本語に書き換えて作成したものである.書き換え作業には,著者らが開発した,書き換え支援エディタ,翻訳メモリ,ふりがななどの読解支援情報付与システムの3つのシステムを利用している.本報告ではこれらのシステムの狙いと機能の詳細を説明する.また書き換え作業に携わっている日本語教師に対して行った聞き取り調査を元に,これらのシステムの有効性と課題を議論する.
計算機による対訳表現抽出を可視化することにより,対訳辞書構築や翻訳を支援するツール Bilingual KWIC について紹介する.本ツールは形態素解析などを使用せず,文字列情報だけから対訳を抽出するため,どのような言語対にも適用可能であり,また単語以外の表現に対しても対訳を表示することが可能である.対訳表現をKWIC形式で表示することにより,システムの抽出誤りの修正を容易にするだけでなく,派生表現の獲得や複数の対訳表現の比較も可能としている.
本研究では,情報システムの開発における意思疎通の障害である設計用語の不統一を解消するため,SE作業工程の現状を調査し,各工程の用語に関する課題調査,及び,問題解決の技術用件について整理・考察した.前記の考察結果に基づき,設計用語の不統一が起きやすい設計書の作成工程にリアルタイムかつインタラクティブに設計用語の誤入力を指摘できるツールを開発した.このツールを,現場で頻出するプロジェクトの設計用語(機能名,項目名)の表記不統一の例に適用して評価した結果,指摘正解率86%を達成した.
司会 : 大熊智子(富士ゼロックス株式会社)
近年音声対話エージェントの実用化が進んでおり,短いユーザ音声発話の中から,ユーザの意図を的確に把握することが課題となっている.本研究では,「巨人の先発は誰?」のように,リアルタイムな情報を問うている可能性の高い発話を自動的に判別し,その判別結果に応じて適切な回答を行う質問応答システムを提案する.さらに,リアルタイムな質問判別のために有効な日替わり語という語のクラス,及びその自動獲得方法を提案する.実験において,自動獲得した日替わり語を用いた質問文のリアルタイム性判別実験を行い,有意に精度が改善したことを示す.
グノシーは株式会社Gunosyが提供するスマートフォンアプリを中心に展開する情報サービスである.当サービスは複数のウェブメディアから提供されたコンテンツを取捨選択しアプリの利用者に提供しており,キュレーションメディアとも呼ばれる.Gunosyではコンテンツの取捨選択を編集者の意思決定ではなく,自動的にもしくは半自動的に行っている.ウェブにおけるコンテンツは大半がテキスト情報であり,取捨選択の自動化のために言語処理技術が用いられている.本発表ではGunosyにおいてどのように言語処理技術が用いられているかについて述べ,サービスを運営するなかでどのように改善が進められているか,現在どのような課題に取り組んでいるか等についても紹介する.
弊社では,LyncIM(インスタントメッセンジャー)において,機械翻訳により外国語話者とのコミュニケーションを支援する「LyncIM翻訳」機能を提供している.しかし,翻訳品質が不十分な場合には,伝達内容の齟齬が生じ,不要な会話が増加して効率が損なわれる恐れがある.特に,日本語の会話やインスタントメッセージでは主語や目的語が省略されることが多く,不明確または不自然な訳文になる場合が多い.本研究はこの問題に鑑み,主語が省略された日本語文に対して主語を補完する前処理を行うことで,翻訳品質を向上させる試みである.簡易なルールを用いて主語推定および主語補完を行う方式を開発し,社内SNSのインスタントメッセージの7.6%にあたる文で翻訳品質の改善を確認した.さらに,開発方式を搭載した,LyncIM翻訳から利用できる日本語チェックサーバのプロトタイプを開発した.
言語理解とコミュニケーション研究会では2011年からテキストマイニングシンポジウムを開催し現在8回開催されている.そこで行われた研究発表からどのようなテーマが議論され,どのような手法が提案され,どのような問題が残り,言語処理がどのように役立つかを論じたい.全てを紹介しきれないが,コールセンター,事故事例,医療,旅行情報,金融情報,経営情報といったテキストが対象となり,こうした広範な分野に対して,それぞれに特徴の異なる手法が提案されて状況を報告する.これにより言語処理の実応用研究の可能性について議論する.
口頭発表のみとなります.
short(15+5分),long(25+5分)のどちらかをお選びください.
口頭発表の後に別途デモセッションを設ける予定ですので,発表者でデモをご希望の方は,その旨ご連絡ください.
予稿(各発表原稿)のフォーマットは,一般発表に準じ,http://www.anlp.jp/nlp2016/#application_noticeの7に「LaTeXのスタイルファイルの見本」がありますので,よろしければ,これを参考にしてください.
ワークショップの論文も本会議の予稿と同様の扱いとなります.
ただし,ワークショップの論文は本会議の投稿webサイトを経由しないので原稿の提出の際に「著作権譲渡に『同意』」ボタンを押すという形での意思確認ができません.
したがいまして,予稿をお送り下さる際に,著作権譲渡に同意する旨を合わせて明記してしてお送りください.
なお,著作権の譲渡が難しい場合は,個別に協議いたしますので,nlp2016-inquiryanlp.jpまでお申し出ください.
nlp2016-workshoplr.pi.titech.ac.jpまで
Subject: ワークショップ発表申し込み
とした,以下の内容を含むメイルをお送りください.
発表タイトル:
発表者(所属):
発表概要:
発表時間: short/long のどちらか
デモセッション: デモを希望するか否か
nlp2016-workshoplr.pi.titech.ac.jp まで
Subject: ワークショップ原稿投稿
としたメイルに論文を添付しお送りください。
(注意:年次大会本会議の原稿提出サイトからの投稿はできません)
PDF(10MBまで,ページ数は8ページまで.)
ワークショップの論文の著作権も言語処理学会に帰属します.
論文提出時に以下の文言をメイル本文にお書きください.
言語処理学会第22回年次大会:発表申込、原稿提出、大会発表各要項(http://www.anlp.jp/nlp2016/submit.html)の発表申込要項8にある「執筆に際しての注意事項」ならびに「著作権および電子媒体による論文の公開」に同意します。