Japanese | English

GeoNLPプロジェクト - 自然言語文のジオタギングのための地名情報処理システム

プロジェクトの目的

ニュースやブログ、ツイートなどの自然言語文を地図上にマッピングする処理には大きなニーズがある。この処理によって、文章を空間的な文脈で理解することが容易になるからである。特に緊急情報メディアにおいては、多数の情報源から流入する情報を自動的にマッピングする処理は、迅速な対応のキーとなる技術として価値が高い。

この処理は、場所に関する機械可読なメタデータが付与されていれば容易であるものの、人間可読を優先する多くの自然言語文ではメタデータの付与が一般的とはなっていない。また構造化された住所のマッピングに関する研究は進んでいるが、任意の自然言語文を対象としたマッピングは依然として困難である。

そこで本研究では、地理情報処理(GIS)と自然言語処理(NLP)を組み合わせることで、自然言語文に対して場所に関するメタデータを付与するジオタギングシステムを構築する。またシステムの持続的な成長を支えるエコシステムを確立するため、Linked Open Dataや参加型システム等と連携した地理的固有名辞書の整備や、ウェブフレームワークでも利用可能なライブラリ開発なども目指す。

受賞

新着情報

2016年3月21日
GeoNLPバージョン1.2.0をリリースしました。
2015年3月27日
GeoNLPバージョン1.1.0をリリースしました。
2014年3月7日
Linked Open Data チャレンジ Japan 2013で基盤技術部門 最優秀賞を受賞しました。
2013年11月16日
Geoアクティビティフェスタで奨励賞を受賞しました。
2013年11月14日〜16日
GeoアクティビティフェスタでGeoNLPプロジェクトを紹介しました( アブストラクト / 発表ポスター)。
2013年9月18日
GeoNLPGeoNLP地名ウェブサービスGeoLODの3つの主要サイトを公開しました。
2013年7月29日
Geoアクティビティフェスタの発表作品が公開されました。
2013年6月14日
NIIオープンハウスで、GeoNLPの新サイトの進行状況などを紹介しました(発表ポスター)。
2012年10月28日
東日本大震災ビッグデータワークショップで各種のデータにGeoNLPを適用した結果と、そのアプリケーションである311TVを紹介しました。
2012年07月27日
デジタル台風:ニュース・トピックスでGeoNLPを利用した地名検索が可能となりました。
2012年03月12日
東日本大震災ニュース分析でGeoNLPを利用した地名検索が可能となりました。
2011年11月11日
CSIS Days 2011にてGeoNLP:自然言語文を対象とした高度なジオタギングに向けてを発表し、優秀研究発表賞を受賞。

GeoNLPを利用しているウェブサイトの事例

ふってきったー
「雨」や「雪」など「空から降ってきたもの」の情報をツイッターから収集して分析し、自動的に地名を抽出して地図の上に可視化するサービス。
東日本大震災ニュース分析
東日本大震災に関するニュース記事から地名を抽出し、都道府県や市町村ごとに記事を集約したり、学校等の施設ごとにも記事を集約したりすることで、東日本大震災の記憶を残すためのサービス。
デジタル台風:ニュース・トピックス
台風に関するニュース記事を台風番号ごとにまとめることによって、台風によって何が起こったかを記録として残していくサービス。
311TV
東日本大震災に関するツイート、新聞記事、ニュースなどから地名を抽出して再編成することで、地域ごとの情報をテレビのように閲覧できるインタフェース(東日本大震災ビッグデータワークショップのためのデモシステム)。

GeoNLPを試用しているウェブサイトの事例

紫陽花革命 Hydrangea Revolution
デモ現場からの発信をキュレーションするサイトにおいて、GeoNLPを情報のフィルタリングに利用。

支援

API利用について

GeoNLP APIは現在鋭意開発中ですが、まだ一般公開には至っていません。ただ近い将来には、誰でも使えるオープンなシステムとして公開することを目標としています。それ以前に使ってみたいという方がいらっしゃいましたら、ご連絡ください。

他の地名情報サービス

CSVアドレスマッチングサービス - 東京大学空間情報科学研究センター
住所を緯度経度に変換するサービス

Copyright 2011-2016, 北本 朝展, National Institute of Informatics.