言語処理学会ニュースレター

Vol. 17 No. 1 (2010年2月22日発行)

目次

言語処理学会第16回年次大会 開催案内
第16回通常総会開催案内

□言語処理学会第16回年次大会 開催案内

言語処理学会第16回年次大会(NLP2010)は,情報処理学会創立50周年記念全国大会と共催で以下の要領で開催いたします.情報処理学会との共催イベントも予定されております.皆様の奮ってのご参加をお願い申し上げます.

事前予約は2月26日(金)19:00が締め切りとなっております.事前予約をしますと,無料の大会プログラム・チュートリアル資料や有料の資料を確実に入手いただけます.当日登録の場合,資料がなくなり次第,入手できなくなる可能性がありますので,事前の予約を是非お願い致します.

また,大会中は,言語処理研究の最前線とそれによって予見される社会的インパクトについて紹介する共催イベント「言語と知識 −最新言語処理研究の射程−」が Plenary sessionとして催されます.皆様,是非ご参加下さい.(詳細は,下記をご覧下さい)

  • 開催日時: 2010年3月 8日(月)〜3月11日(木)
    3月8日(月) チュートリアル
    3月9日(火) 本会議 第1日,情報処理学会との共催イベント
    3月10日(水) 本会議 第2日,総会,招待講演,懇親会
    3月11日(木) 本会議 第3日
  • 会場
    東京大学 本郷キャンパス
    東京都文京区本郷7-3-1 (〒113-8654)
    東京大学本郷キャンパス,交通アクセス
    http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html
  • 年次大会Webサイト
    http://nlp2010.anlp.jp/

    年次大会に関する最新情報はこちらのサイトからご覧頂けます.

    情報処理学会創立50周年記念全国大会のサイトは以下になります. http://www.ipsj.or.jp/10jigyo/taikai/72kai/index.html

    ★★★ 情報処理学会との共催イベント ★★★

    言語と知識 −最新言語処理研究の射程−

    言語処理関連のプロジェクトのリーダーらによる講演を通じて,変貌著しい言語処理研究の最前線と,それによって予見される社会的インパクトについて紹介し,言語への工学的アプローチに関する理解を深めます.

    http://www.ipsj.or.jp/10jigyo/taikai/72kai/event/6.html

    開催日時:  2010年3月9日(火) 15:30-18:00
    会場: 東京大学 安田講堂

    講演:
    「これからの言語処理とその応用」
    長尾 真 氏(国立国会図書館 館長)

    「総合学術オントロジー」
    橋田 浩一 氏(産業技術総合研究所 社会知能技術研究ラボ長)

    「MASTARプロジェクト&ALAGINフォーラム」
    中村 哲 氏(情報通信研究機構 知識創成コミュニケーション研究センター 副研究センター長)

    司会: 鳥澤健太郎(情報通信研究機構)

    ★★★ 第16回年次大会における特別事項 ★★★

    発表申し込みの受付,プログラム作成はそれぞれの学会で独立に行いますが,聴講参加のための事前予約,印刷物,CD-ROMの購入の申込先が例年と異なっております.また,参加費などについても例年からは大きく変わっております.詳細は本案内,大会Webサイトにてご確認下さい.ご不明な点がありましたら,本ページ末尾のプログラム委員会までご連絡ください.

  • チュートリアル

    開催日時: 2010年3月8日(月)

    トラック1: 自然言語処理と関連領域
    場所: 理学部2号館3F講堂

    (T1-a) 10:00-12:00
    「推薦システム ---機械学習の視点から---」
    神嶌 敏弘 氏(産業技術総合研究所)

    推薦システムとは,利用者が探している情報やものを予測し,その結果を利用者に提示するシステムである.このシステムについて,概要を述べたのち,予測に使われる機械学習の手法,特にGroupLens,pLSA,行列分解の三つの方法を中心に紹介する.その後,プライバシやサクラ攻撃といった現状のシステムに対する課題を紹介し,これらへの対応策について述べる.最後に,推薦システム研究の今後の展望についてもふれる.

    (T1-b) 13:00-15:00
    「並列テキスト処理のための環境・ツール (EC2上での並列処理体験付き)」
    田浦 健次朗 氏(東京大学)

    自然言語処理, ゲノム解析をはじめとしたデータ集約的計算を行うための, 環境構築の方法から, 並列実行するためのツールやプログラミングフレームワーク, 性能を理解する上で重要な要素となる要素(特にファイルシステムなど)について概観する. クラスタ型計算機の一般的な構成や利用環境について簡単に述べた後, データ処理の並列化を行う方法として, 講演者が開発しているGXPmake (並列make), 近年ポピュラーになっているMapReduceなどについて紹介する. そして, ワークフローを実行する際に性能に大きな影響を与えるファイルシステムの構成, 特に, NFS, Lustre, Gfarm, Hadoop FS などの違いについて述べる. 講演中にAmazon EC2上に構築されたクラスタ環境上でデモを行い, 聴衆にも開放し, 並列処理をその場で体験することが出来るようにします. ※講義の中に実際のクラスタ環境を体験できる時間帯があります.無線LANに接続できるノートパソコンを持参してご参加いただきますと理解が深まります.

    (T1-c) 15:30-17:30
    「はてなで利用している言語処理技術」
    伊藤 直也 氏(株式会社はてな)

    株式会社はてながブログやソーシャルブックマークなどのウェブサービスの開発にあたって取り組んでいる言語処理的な取り組みについて紹介する. 検索,テキスト分類,記事推薦などの各種機能がどのような手法を用いて実装されているか,またその実装のために解決すべきだった課題は何かといった点に焦点を当てて解説,理論的な成果を製品に仕上げるまでの過程や課題などを紹介する.


    トラック2: 自然言語処理学基礎論
    場所: 赤門総合研究棟2F 6番教室

    (T2-a) 10:00-12:00
    「超高速テキスト処理のためのアルゴリズムとデータ構造」
    岡野原 大輔 氏(東京大学)

    近年,膨大な量のテキストを解析する要望が高まり,より洗練されたアルゴリズムやデータ構造が必要とされている.本チュートリアルでは最新のデータ構造とアルゴリズムを紹介し,これらを利用することで従来手法と比較し文字通り桁違いに高速かつ省スペースでテキスト処理ができることを示す.具体的には教師有/無のオンライン学習,疎ベクトルの効率的かつ高速な操作方法,文字列上の統計量の高速な計算手法などについて取り上げる.

    (T2-b) 13:00-15:00
    「NICT発の言語資源 ---ALAGINフォーラムの活動を中心に---」
    風間 淳一 氏,橋本 力 氏,山田 一郎 氏(情報通信研究機構)

    Web上のいわゆる情報爆発によって,言語処理技術の重要性はますます増している.高度に知的な言語処理技術の実現にとって,高品質な言語資源の継続的な開発,流通は不可欠である.情報通信研究機構(NICT)では,辞書やコーパス,知識獲得システムなどの言語資源を構築し,高度言語情報融合フォーラムALAGIN を経由して公開している.本チュートリアルでは,ALAGINフォーラムの活動と,NICT発の言語資源について紹介し,言語資源の活用方法やALAGINフォーラムに参加する企業における応用事例について解説する.

    (T2-c) 15:30-17:30
    「『現代思想』と言葉------脳・認知から遠く離れて」
    影浦 峡 氏(東京大学)

    言語処理の領域から見える限りで言うならば,言語をめぐる研究は,一方で潜在的に無限の適格な発話を許容する規則を求めて認知・脳へと遡り,他方で与えられた及びそれに類した与えられうる言語表現の編成を記述したり処理する方向に向かいます.本チュートリアルでは,両者の間に「存在」する生々しい言語の具体性をその直接性を失わずに触知しようとする試みがどのようなものかを,主にその周辺を埋めていくことにより感じてもらうことを目指します.

    ※次のテクストを事前に読んでおくことが望ましい.
    ミッシェル・フーコー著/松浦寿輝訳
    「侍女たち」『フーコーコレクション3』
    ちくま学芸文庫

  • Plenary session

    イベント名: 言語と知識 −最新言語処理研究の射程−
    開催日時:  2010年3月9日(火) 15:30-18:00
    場所: 安田講堂

    概要:
    知識の表現と伝達のための最も一般的な手段である言語が果たすべき役割は知識社会においてますます重要性を増している.そして,近年の言語処理技術は,そのような言語の機能を増幅することによって社会における知識循環を高度化することを射程に入れつつある.本セッションでは,そのような言語処理に関する研究プロジェクトに関するプロジェクトリーダーらによる講演を通じて,変貌著しい言語処理研究の最前線とそれによって予見される社会的インパクトについて紹介し,言語への工学的アプローチに関する理解を深めてもらうことを狙う.

    講演1「これからの言語処理とその応用」
    講演者 長尾 真 氏(国立国会図書館 館長)

    今日インターネット上には会話文,論説文,小説文など種々のスタイルの文章がぼう大に存在している.またテキストと他言語への翻訳文の対などもある.これらのテキストを何十億文と収集しデータベース化すれば,これは言語のあらゆる可能な表現の集りとみなすことができよう.言語の総体がこのように客観的な形で把握できれば,言語研究は自然科学的手法で行うことが出来ることになる.そういった立場からスーパーコンピュータの力を借りて言語処理が行われ,多くの優れた成果が出て来ている.これらは機械翻訳,情報検索,情報信頼性,電子図書館などの研究開発に大きく貢献するようになっている.またこれら大量のテキストデータから知識を抽出し,これを組織化し言語処理過程に組み込むことによって,言語処理の精度が向上し,また種々の言語処理の応用分野のシステムの性能の向上につながるという好循環が実現している.これまでの半世紀の言語処理研究の努力がようやく実を結び,社会に具体的な形で貢献する時代に入って来た.

    講演2「総合学術オントロジー」
    講演者 橋田 浩一 氏(産業技術総合研究所 社会知能技術研究ラボ長)

    ますます困難になりつつある社会的課題を解決するためには,従来を上回る規模での科学的知識の体系化とその社会的共有が必須と思われる.それには,研究領域のタコツボ化を防ぎ領域間の融合を進めつつ,科学研究と実社会とを融合する必要があるだろう.その意味での「科学的根拠に基づく社会evidence-based society」の構築に資するため,情報処理学会の「次世代情報処理ハンドブック」および日本認知科学会の「認知科学オントロジー」を中核として,多数の学会の共同作業により,学術的な概念をオントロジーに基づいて構造化・体系化して「総合学術オントロジー」を編纂し,これによって研究分野の間および研究コミュニティと一般社会との間の相互作用を活性化する計画を進めている.

    講演3「MASTARプロジェクト&ALAGINフォーラム」
    講演者 中村 哲 氏(情報通信研究機構 知識創成コミュニケーション研究センター 副研究センター長)

    大量のコーパスと統計モデル,機械学習による音声言語処理手法の到来は,研究開発フェーズから実際の場面での性能向上を産業界,社会とリンクした形で持続的に直接行える,新しい研究開発プロセスの到来と考えることが出来る.さらに,Webの仕組み,Web上の情報を利用することで,世の中にある固有名詞の取り込み,多言語辞書の構築やコーパス収集,単語の関係抽出などの解析を行うことも可能になる.当機構では,Web,ネットワークを利用し,持続的に研究開発を進めるMASTARプロジェクトを2008年4月から開始した.具体的には,ネットワーク型の音声翻訳,機械翻訳,音声対話システム,言語資源の研究開発を進めている.また,2009年3月には,当プロジェクトの成果だけでなく,産学官が成果を持ち寄り,成果を融合し,新たな展開を促進する高度言語情報融合(ALAGIN)フォーラムが設立された.これらの活動の現状と狙いについて紹介する.

  • テーマセッション
    • テーマセッション1: 「言語表現」と「言語」のあいだ

      言語学でも自然言語処理でも,多くの場合,例えば日本語というまとまりの存在を自明のものとみなしていますが,よく考えてみるとこれはとても不思議なことです.例えば「日本語の母語話者」と言われるグループの中でも,誰一人同じ言葉を話している人はいませんし,それに対応して,おそらく「日本語」として実際に想定する範囲,「日本語」として潜在的に操作可能な範囲も,誰一人同じではないでしょう.実際,観察可能なかたちで存在するのは,そうした個々人の言語表現の集積に過ぎないにもかかわらず,どうしてそれを集めた「コーパス」が抽象的な「日本語」なるものの一つのサンプルと言えるのか,そのような「コーパス」から学習させた言語のモデルは,例えば「平均人」なるものの不在とアナロジカルに考えるならば,一体,「何の」モデルなのか,立ち戻って個別の言語表現----それらは個々人のものであり「日本語」なる抽象体に還元できないかも知れないにもかかわらず----を「日本語」のモデルに基づいて処理することは何を意味し,どこまで可能なのか.言語処理応用が根づき,実社会での言語表現を前にした課題への取り組みが展開している現在,こうした視点から言語処理を考える必要が大きくなっています.本テーマセッションでは,個別的な「言語表現」と抽象的な「言語」の差異を意識した研究,既往の手法をこの点から再検討した研究を募集します.

      具体的には,例えば,

      • 与えられた言語表現の位置づけをめぐる言語哲学的・歴史哲学的考察
      • 人間の知的な言語活動における個別性の位置づけをめぐる社会言語学的研究
      • 「与えられたテクストおよびそれに類するもの」ではなく「与えられたテクストそしてそれ以外ではないもの」を対象としたIRやWebの応用研究
      • アダプティヴ・ラーニングと言語表現の個別性
      • 言語表現のインスタンス生成をめぐる技術的な研究
      などがあげられますが,もちろん,これにとどまらず,野心的な研究を広く募集します.

      言語表現の個別性と言語の一般性,言語表現の歴史的一回性と言語処理が必然的に要請する一般化との関係などをめぐり,具体的な研究をもとに議論することに主眼を置いたセッションです.

    • テーマセッション2: 協調的な自然言語処理

      インターネットの世界的な展開により,様々な場で協調的処理やコミュニケーションが発生しています.本テーマセッションでは,人間と機械の協調による知的言語処理の高度化,crowdsourcingに基づく言語処理,人間間の協調を促す言語処理,言語処理の協働的高度化を促す人間の位置付けなど,広い意味での「協調」をテーマにした研究発表を募集します.

      例えば,

      • 対訳リソースの協調的収集と利用手法
      • タグクラウドを利用した情報処理手法
      • ディスカッション等の意見の集約手法
      などがあげられますが,これに限らず多様な協調的言語処理の発表を集めることで,協調的言語処理の全体像を共有することを目指します.

    • 特別セッション: 情報爆発特別セッション

      近年のいわゆる「情報爆発」は,特にWeb上において顕著であり,産業的,経済的に大きな変化をもたらしているのみならず,一般の人々の生活,ライフスタイルまで大きく変えています. また,爆発している情報のうち,現在一般の人々の目に直接触れているものの多くがテキスト情報であることから,情報爆発からのいわゆる新たな価値の創出において,自然言語処理技術が大きな役割をはたすべきであろうことは論を待ちません. さらに,スパム,違法有害サイトなど,情報爆発の負の側面から人々の生活を守るためにも,自然言語処理技術が有用であることもほぼ自明と思われます.

      こうした状況を踏まえて文部科学省特定領域研究「情報爆発IT基盤」が開始されてから,4年が経過しようとしており,そこでは様々な具体的成果が得られています. 本特別セッションでは文部科学省特定領域研究「情報爆発IT基盤」における成果に関する発表はもちろんのこと,特定領域研究に参加していない一般の研究者からも,情報爆発からの新たな価値の創出や,情報爆発の負の側面への対処などを狙った研究に関する発表を基礎的/基盤的研究から応用まで広く募集します. (なお,このセッションでは,他のテーマセッションとは異なり,総合討論の時間は設けない可能性があります.)

  • 招待講演

    開催日時: 2010年3月10日(水) 13:00〜14:00

    演題「The Challenge of the Multicores」
    講演者 Fran Allen 女史 (IBM名誉フェロー) *チューリング賞受賞者

    Computers have traditionally used complex “cores” to manage and execute computations and, over the years, these computers have achieved ever increasing levels of performance. However fundamental limitations of size, heat and energy have emerged. To overcome these limitations complex cores are being displaced by multicores that are not only simpler and more numerous but can be used more flexibly. So what is the challenge?

    Multicore computers are ushering in a new era of parallelism everywhere. As more cores are available, the potential performance of the system can increase at the traditional rate by the use of the inherent parallelism. Or can it? How will users and applications take advantage of all the parallelism? This talk will review some of the history of languages and compilers for high performance systems and consider opportunities for performance on multicore systems. The talk is intended to encourage the exploration of new approaches including how users will continue to code sequential for parallel systems.

  • 懇親会

    日時:2010年3月10日(水)18:30〜21:00
    会場:東京大学 本郷キャンパス 医学部研究棟13F Capo PELLICANO 本郷店
    費用:一般5000円 学生4000円

    懇親会に参加される方は,できるだけ事前予約で申込をお願いします.大会当日の参加申込も可能ですが,準備の都合上,先着順で少人数とさせていただきます.

★★★ 年次大会参加について ★★★

  • 事前予約申込スケジュール

    事前予約は情報処理学会全国大会の事前予約受付ページで行われます.既に開始しております.大会のサイトをご覧下さい.

  • 発表者に対して
    • 著者のうち,発表申込が採択された場合に当日発表なさる方1名を,発表申込時に指定していただきます. この方を当該発表の「★発表者★」と呼びます.なお,採択通知は12月28日の予定です.
    • 発表参加費について: 発表者のみから経費を徴収します. これを「★発表参加費★」と呼び,発表参加費は学生/一般,会員/非会員を問わず★一律2000円★とします.
      • 1件の発表に対して1件の支払いが発生します.発表者以外の共著者からは経費を徴収しません.
      • 複数の発表で発表者となる場合,発表件数分の発表参加費がかかります.
      • 発表参加費には参加章,大会プログラム,情報処理学会・言語処理学会共通CD-ROMの代金が含まれます. (共通のCD-ROMには情報処理学会と言語処理学会の全発表論文が含まれます.)
      • プログラム確定後(採録が通知された後),発表のキャンセルやいわゆる“No show”は原則認めませんが,いかなる事情であれ万が一そうした事態になった場合でも,発表参加費をご納入いただくことになりますので,あらかじめご注意ください.
    • 参加登録について: 発表申込が採択された場合,発表者については,自動的に参加登録をしたものとみなされます.
      • 採択された発表の発表者には請求書と引換証を郵送またはメールでお送りします.
      • 発表参加費に含まれるものに加えてCD-ROMや印刷製本版論文集,印刷製本版チュートリアル資料集などをご希望の場合,情報処理学会全国大会の事前予約受付ページから別途事前予約を行ってください.
      • 発表申込には,懇親会への参加表明は含まれません.事前予約をお願いします.
  • 発表者以外の参加者に対して
    • 次のいずれかの方を「★参加者★」と呼びます.
      • 本大会における共著の発表論文がなく,聴講するだけの方
      • 本大会における発表論文の共著者ではあるが,上述した発表者ではない方で,なおかつ本大会に参加される方
    • 参加費について: 参加費は徴収しません.つまり,参加は無料です.
      • 情報処理学会全国大会は,聴講のみの場合参加は無料です.(発表,共著等については情報処理学会全国大会のサイトをご覧ください.)
    • 参加登録について: 参加登録が必要です. 可能な限り事前の参加登録(事前予約と呼びます)をお願いします.
      • 本大会と情報処理学会に共通の参加章,大会プログラムが無料で用意されます.
      • それ以外の資料,つまり,CD-ROM,印刷製本版予稿集,印刷製本版チュートリアル資料集などは参加登録の際にお手続きいただき,予約・購入していただきます.(ただし,以下の事情で用意できない場合もありますので,ご注意下さい.)
      • 大会当日でも参加登録は可能で,無料ではあります. ただし,当日分の資料等には数に限りがありますので,当日参加登録した場合,それらをお渡しできない可能性がありますので,ご容赦下さい. 重ねて,可能な限りの事前予約をお願いします.
      • 事前予約は 情報処理学会全国大会の事前予約受付ページで行われます.12月中旬に開始予定です.
      • 事前予約をした参加者に対する送付物
        • 引換証を郵送またはメールでお送りします.
        • CD-ROM,印刷製本版予稿集などをお申し込みいただいた場合,請求書を郵送します.
  • 発表者と参加者共通
    • 当日の受付は情報処理学会全国大会と★共通の受付★となります.
    • 参加章等は,引換証を当日受付までお持ちになり,お受け取りください.
    • 採択された発表の発表者,ならびに事前予約で資料を購入した参加者には請求書が送付されます. 期日までに払込の手続きをお済ませください.
  • 資料(論文集CD-ROM, 印刷製本版等)の購入やその他費用,郵送について
    • 情報処理学会・言語処理学会論文集共通CD-ROM:7000円(情報処理学会と言語処理学会の全発表論文を含む)
    • 言語処理学会論文集CD-ROM:1000円(言語処理学会の発表論文のみを含む)
    • 言語処理学会論文集印刷製本版:事前4000円,当日6000円
    • 印刷製本版チュートリアル資料集:無料(事前予約をおすすめします)
    • 言語処理学会懇親会参加費:一般5000円,学生4000円(事前予約をおすすめします)
    • 事前予約では資料の受け取りについて会場か郵送かを選択することができます.郵送は大会終了後です.
    • 事前予約受付は情報処理学会全国大会と共通であるため,情報処理学会が用意する資料も購入することが可能です. 内容や金額については情報処理学会全国大会の事前予約受付ページをご参照ください.
  • 委員一覧
    • 大会委員
      委員長村上 仁一 (鳥取大)
      委員黒橋 禎夫 (京大)
      鳥澤 健太郎 (NICT)
      宮尾 祐介 (東大)
      柏野 和佳子 (国語研)
    • 大会プログラム委員会
      委員長鳥澤 健太郎 (NICT)
      委員影浦 峡 (東大)
      風間 淳一 (NICT)
      木村 俊也 (ミクシィ)
      颯々野 学 (ヤフー)
      新里 圭司 (京大)
      竹内 孔一 (岡大)
      田中 久美子 (東大)
      鶴岡 慶雅 (JAIST)
      中川 哲治 (NICT)
      二宮 崇 (東大)
      橋本 力 (NICT)
      藤田 篤 (公立はこだて未来大)
      渡辺 日出雄 (日本IBM)
    • 大会実行委員会
      委員長宮尾 祐介 (東大)
      委員荒牧 英治 (東大)
      岡崎 直観 (東大)
      清水 伸幸 (東大)
      松崎 拓也 (東大)
      吉田 稔 (東大)
  • 問い合わせ先

    お問い合わせは次のメールアドレスにおねがいいたします.

    nlp10-inquiry(at)yans.anlp.jp


□第16回通常総会開催案内

第16回通常総会を下記の要領で開催いたします.2009年度優秀論文賞および第15回年次大会優秀発表賞の表彰式も行います.会員の皆様はぜひご参加下さい.

  • 日時: 2010年3月10日(水) 14:30〜15:20
  • 会場: 東京大学本郷キャンパス赤門総合研究棟6番教室
    http://www.u-tokyo.ac.jp/campusmap/map01_01_j.html
  • 総会次第
    1. 会長挨拶
    2. 年次大会優秀発表賞・論文賞の表彰
    3. 2009年度活動報告
    4. 2009年度決算報告、監査報告
    5. 2010年度活動計画
    6. 2010年度予算案
    7. 2010年度評議員構成、役員構成
  • 学会に関する問い合わせ先
  • 中西印刷株式会社 東京事務所内 言語処理学会事務局
    Tel. 03-3816-0738
    Fax. 03-3816-0766
    〒113-0033 東京都文京区本郷5-29-12-906
    e-mail nlp@nacos.com

  • ニュースレター担当(馬青)
  • 龍谷大学理工学部
    Tel. 077-543-7505
    Fax. 077-543-7524
    〒520-2194 滋賀県大津市瀬田大江町横谷1-5
    e-mail qma@math.ryukoku.ac.jp