1. 概要

Semantic Webの枠組み使ってデータをつなげるための形式を発展させる(具体的にはRDFトリプルを基本とする)のがLinked Dataの考え方である。ただしSemantic Webが主に「コンセプト」を扱っていたのに比べると、Linked Dataではより実世界の事物に近い「インスタンス」が中心となって、データのネットワークが形成されることになる。またこれが、データを広く公開して社会のために役立てる「オープンデータ」の動きとつながれば、異種のデータを組合せることによる新たな発見や考え方、そして我々の行動も変化してくるかもしれない。オープンなデータをつなげて新たな価値を生み出していくこと。Linked Open Dataがその技術的基盤としての役割を果たすことへの期待が集まっている。

2. LODサイトの例

以下にはLODサイトの例として、RDFトリプルで表現された厳密な意味での「Linked Data」と、インスタンスを核として異種のデータを統合するという「Linked Data的な考え方で設計された情報集合体」の、2種類のサイトを示す。

歴史的行政区域データセットβ版

歴史的行政区域データセットβ版は、行政区域の歴史的変遷をたどることが可能なデータセットです。時代ごとの行政区域データをGeoJSON形式で提供することにより、ウェブ地図上に簡単に行政区域を表示できるようになります。また過去の行政区域の変化をアニメーション表示すれば、市区町村が歴史的にどのように変化してきたかを学ぶこともできるでしょう。現在、行政区域GeoJSONの数は約82,000件です。

歴史的行政区域データセットβ版の特徴は、行政区域を上記のポリゴンとして提供するだけでなく、ポリゴンを代表する点の情報も合わせて提供する点にあります。そのために、複数のオープンデータを統合して行政区域の代表点を推定するアルゴリズムも開発しました。

ただし、過去の行政区域については記録が不確かである部分も多く、正式な記録に基づくデータセットを構築するのは大変難しい課題です。そこで現在のところは「β版」として公開し、今後のデータの充実に向けた要望の調査やコラボレーションの可能性などを探りたいと考えています。

気象庁防災情報XML履歴データベース(気象、季節、火山、地震)

気象庁防災情報XMLという気象庁の公開データから派生したデータセットとして、気象、火山、地震、季節などに関連した履歴情報をストックするデータベースを構築しています。警報・注意報、土砂災害警戒情報、竜巻注意情報、記録的短時間大雨情報、台風情報などの防災気象情報だけでなく、生物季節観測や流氷などの季節情報も提供しています。また火山噴火や地震に関する他のオープンデータなども統合することで、気象(防災、季節)や地象(火山、地震)などの対象をまたがる統合を実現しました。

メモリーハンティング

メモハンは、実世界のいまを写真に記録し、過去の写真にリンクするアプリ。同一構図の写真をみんなで撮影すれば、災害復興等の時間変化を疑似的に定点観測できます。また「聖地巡礼」等の観光にも利用は広がります。

メモハンの基本的な機能は、カメラのファインダー上に過去の写真を半透明で重ね、現在の風景と構図を合わせてシャッターを押すというものです。スマートフォンの登場によって、カメラのファインダーに別の写真を重ねることが可能になりました。「こんな写真を撮ってみませんか」と提案する「アクティブ・ファインダー」の仕組みを、防災や観光など様々な分野に適用していきたいと考えています。

メモハンはまず、同一構図の写真を撮るという問題を解決します。これまでのカメラで定点観測をするには、写真と風景を心的回転により一致させるという難しい作業が必要でしたが、メモハンではファインダー上で写真と風景を直接比較できるため、古写真の歴史景観の分析や災害復興の記録などの定点観測が劇的に簡単になります。

さらにメモハンは、同一構図の写真を撮るという問題を楽しくします。同一構図で写真を撮るには、現地の風景を分析して構図を理解した上でシャッターを押す必要があり、これにはゲーム的な楽しさがあります。さらに自分にとっての「聖地」でこれを体験することで、身体性のレベルでコンテンツとの一体感を味わえる楽しさがあります。

このようなアプリは新しい写真文化、すなわち、過去の写真を引用した現在の写真や、過去の写真に新たな要素を加えた現在の写真など、創作的なリンクに基づく写真アルバムを生み出す可能性があります。また、みんなで同一構図の写真を撮影することは、単なる記念写真が定点観測という社会貢献になり、そこから新たな表現を生み出していく期待もあります。

なおメモハンは拡張現実(AR)とは似て非なるものです。写真を重ねるのは、風景の中ではなくカメラのファインダーの上です。たったこれだけの違いが、アプリの特徴を大きく変化させます。ARは風景中に表示された過去の写真の受動的な鑑賞を目的とする場合が多いのに対し、メモハンは現在の風景を能動的に記録して共有するためのツールとなります。

メモハンはAndroidアプリをGoogle Playで公開しています。利用は無料です。なお応募時点では利用者登録機能が完成していないため、共通パスワードでの利用となります。パスワードについてはウェブサイトをご確認ください。

GeoNLP

GeoNLPは、文章から地名を抽出し、地名の曖昧さも解消した上で地図化できる、オープンな地名情報処理システムです。ウェブサイトを中心に、様々な機能をすでに公開しています。

GeoNLPはGeo+NLPという名前が示すように,地理情報処理(Geographic Information Processing)と自然言語処理(Natural Language Processing)の境界領域に存在する「地名」を中心とした情報処理基盤の構築を目指しています。こうしたシステムの実現により、例えば災害のような緊急時における情報のマッピングが高速化できるといった効果が期待できます。

GeoNLPは以下の3つのコンポーネントから構成されるシステムです。

【1】GeoNLPデータ
地名の収集を担うコンポーネントで、地名辞書をみんなで作って共有するためのリポジトリとなります。地理的なオープンデータを地名語辞書形式に変換すれば、それをダウンロードしてGeoNLPソフトウェアの解析に利用することもできます。現在のところ提供する地名辞書は政府系オープンデータが中心で、地理情報という需要が大きいアプリケーションを通じてデータ活用を促進しています。さらに、地名辞書の公開が地名解析精度の向上に寄与することがモチベーションとなって、地名辞書構築に多くの人が参加してくれることを期待しています。
【2】GeoNLPソフトウェア
地名の解析を担うコンポーネントで、地名辞書を使って文章から地名を抽出するだけでなく、地名の曖昧さを解消するロジックも備えています。またDAMSライブラリをインストールすることで、地名だけでなく住所も解析することが可能です。GeoNLPの最大のメリットは「文章を丸ごと解析できる」という点にあり、テキスト処理に関連する面倒な前処理は必要ありません。またGeoNLPソフトウェア本体は修正BSDライセンスのオープンソースソフトウェアとして公開しており、ダウンロードすれば大規模データの内部処理も可能です。
【3】GeoNLPサービス
地名の活用を担うコンポーネントで、GeoNLPの解析機能を利用するいくつかのWebAPIと共に、GeoNLPをLODとして活用するための機能を提供しています。GeoNLPの基本的な解析機能を体験するAPIでは、ウェブサイトからAPIキーを取得することで誰でもお手軽に地名解析ができます。またGeoNLPデータにアップロードされた地名辞書に含まれる個々の地名には自動的にURIが付与され、D2RQを用いたSPARQLエンドポイントを経由して様々な情報にアクセス可能となっています。

このようにGeoNLPは、LOD時代の地名情報処理を支える基盤技術となりうるもので、例えば大規模な文書群から地理情報を抽出して自動的にLOD化するための基盤としても使えると考えています。また地名情報処理を中心としたオープンデータ、オープンソースのコミュニティを、これから成長させていきたいと考えています。

Linked Open Data Challenge 2013応募作品(受賞)。

エレクトリカル・ジャパン

エレクトリカル・ジャパンは、東日本大震災後の日本の電力事情を理解するための電力データ集約・可視化サイトです。電力の供給に関するデータとしては、日本全国約3300ヶ所の発電所の位置や出力を独自に調査してデータベース化するとともに、各電力会社が提供するリアルタイム電力供給データをアーカイブして利用しています。一方電力の需要に関するデータとしては、日本全国の電力消費を象徴するデータとして夜間照明光を観測した衛星観測データを可視化することで、電力供給を象徴する発電所の分布と比較できるようにしました。また電力需要に関係する気象データ(アメダス気温・日照時間)も電力データと関連付けて利用できるようにしています。さらに経済産業省資源エネルギー庁や財務省が公開する政府統計データを解析し、グラフなどの形で可視化しました。そしてデータを核としたストーリーを作るデータジャーナリズムの方法論を活用し、日本の電力事情を発電所が開設された歴史のアニメーションで表現したり、電力融通データが示す意味などを解釈したりするなどの試みを行いました。詳しくはデータジャーナリズムで日本の電力問題を可視化するをご覧ください。なおライセンスについては、将来的にはよりオープンなライセンスに移行したいとは考えていますが、現状では最終判断を下せないため「全ての権利を主張」に設定しています。

Linked Open Data Challenge 2012応募作品(受賞)。

デジタル台風

デジタル台風は、台風に関する現在から過去の多種多様なデータを検索可能なウェブサイトです。1978年以来の気象衛星画像、1951年以来の台風経路データ、1976年以来のアメダスデータなどの気象データを中心に、気象災害データ数値予報モデルデータオンラインニュースデータソーシャルメディアデータなどのデータが、それぞれ何らかのリソースを介してつながる形でアーカイブされています。またデータの一部はKMLRSS、Atom等の機械可読データとして提供しており、これを使って他のサービスを構築することもできます。実際に、我々が構築したブログパーツ「台風画報」だけではなく、他者が開発したiOSアプリやchumbyアプリなどでも、これらの機械可読データを用いて動作しているものが既にあります。現状ではRDF形式で提供するデータはありませんが、サイトの概念構造は台風番号など各種のリソースを核としたリンク構造として実装しているため、これをLODとして利用しやすい形式で出力することは、語彙さえ定めれば実施可能であると考えています。なおライセンスについては、将来的にはよりオープンなライセンスに移行したいとは考えていますが、現状では最終判断を下せないため「全ての権利を主張」に設定しています。

3. その他のSemantic Web / Linked Dataサービス