| ||||||||||||
| ||||||||||||
|
本資料はもともと外部への公開を目的としたものではなく、ブレーンストーミングの叩き台として作った資料ですが、「デジタル台風」プロジェクト10年のあゆみを振り返るために、ここに(恥をしのんで)ほぼ原型をとどめた形で公開することにしました。
前回には以下のような提案があった。衛星画像だけで可能なことは限られているため、画像以外の情報と組み合わせた検索はできないだろうか、というのが主な議論であった。
まず天気図というのが、最も有望な外部のデータであると言える。そこで天気図の情報源についていくつか調べてみた。まずFAX サービスとしては、気象業務支援センターの「天気図サービス」(*1) や、気象短波FAXサービス (*2)などがある。次にCD-ROMとしては、「気象データひまわり」(*3)や、気象業務支援センターのCD-ROM (*4)などがある。最後にWWWでも多くのサーバ(*5)が天気図を提供している。
ただしいずれのデータも、私が知る限りラスターデータとなっている。人間が見るにはその方が使いやすいが、これではその後の処理がしにくい。なんとかデジタル情報としてすぐに使える情報はないだろうか。
(*1) NTT のファクシミリ案内サービスを利用。地上天気図や台風予想図、雲解析情報図など多彩な内容がある。1年36,540 円、他通信料。
(*2) 無線通信を用いて直接通報している無線FAXであり、受信には短波受信機とファクシミリが必要。
(*3) 極東地域の地上気象観測資料・海上の船舶からの気象通報データ・気象衛星ひまわりの画像等、様々な資料を利用して作成された天気図に、主な地点の天気と風向・風力をあわせて表示したもの。
(*4) FAX サービスの一部の画像?
(*5) 例えば防災気象情報サービス http://tenki.or.jp/ 。実況天気図はいかにもコンピュータで描いてありそうなので、そのソースに関する情報を調べる必要がある。
そこで、以下のような代替案について考えていく。
気象庁はWMO (World Meteorological Organization) Distributed Data Base) (*6)を公開している。ここで入手できるのは GPV (Grid Point Value) products、つまりスーパコンピュータが計算した、毎日の気圧・風・温度等の予想値のデータである。その種類には以下のようなものがある。
またデータの内容を表1や表2に示す。両者を比較すると、表1の方が内容が豊富で、しかも大気の層を細かく分割して計算している。「天気図」という意味では気圧情報が使えそうだが、その他にも気温や風などの情報にもおもしろい用途が考えられそうである。
ただしここで問題になるのが解像度である。まず1 degとは、日本付近ではおよそ100kmに相当する値である。するとアジア地域の数値予報は125kmグリッド、北 / 南半球の数値予報は250kmグリッドに相当することになる。これに対して、NOAA衛星画像の地上解像度は1km程度であり、両者の間には解像度にして100倍以上の差がある。この差はかなり大きい (*7)。そこでこのデータを活用するためには以下のような問題点について考える必要がある。
また過去のデータがアーカイブされていない(?)のも困り物である。これだと現在以降の衛星画像に関してしか、対応できない。
いくつかのソフトウェアをダウンロードし、天気図描画に使えるソフトをインストールした。地図の上に数値予報データを重ね描きできる。しかしまだ図をうまく描けるには至っていない。
Elements | Forecast time (hour) | Level (hPa) |
---|---|---|
Pressure or Height | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | MSL, 1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100 |
u and v-component of Wind | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | Surface, 1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100 |
Temperature | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | Surface, 1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100 |
Dew-point depression | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | Surface, 1000, 925, 850, 700, 500, 400, 300 |
Total Precipitation | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | Ground |
Vertical Velocity | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | 925, 850, 700 |
Stream Function | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | 850, 200 |
Velocity Potential | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | 850, 200 |
Relative Vorticity | 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 | 500 |
Elements | Forecast time (hour) | Level (hPa) |
---|---|---|
Pressure or Height | 00, 24, 48, 72, 96, 120 | MSL, 850, 700, 500, 300, 250, 200, 100 |
u and v-component of Wind | 00, 24, 48, 72, 96, 120 | Surface, 850, 700, 500, 300, 250, 200, 100 |
Temperature | 00, 24, 48, 72, 96, 120 | Surface, 850, 700, 500, 300, 250, 200, 100 |
Dew-point depression | 00, 24, 48, 72, 96, 120 | 850, 700 |
Total Precipitation | 00, 24, 48, 72, 96, 120 | Ground |
(*6) http://ddb.kishou.go.jp/
(*7) 本当はもっと細かいグリッド(50km以下?)で数値予報をしているはずだが、なぜかこのようなグリッドスケールになっている。
気象庁が決定した台風の位置、中心気圧、最大風速などがまとめられているページがある(*8)。この情報ソースが何なのかはよくわからないので、そのうちページの管理者に聞いてみようかと思っているが、とにかくこのデータを使えば台風の中心位置のトラッキングが可能である。そこでその位置を中心として、適当な大きさの画像を切り出せば、それで台風画像データベースができる。データの例を表1に示す。
このように時刻ごとの中心位置がわかっているので、その付近の衛星画像を切り出すことによって、台風の形などが特に良く見えるような画像のコレクションを作成できるだろう。どのような大きさで切り出すかというのは、一つのテーマになりうるが、これについては雲の空間的分布などの特徴量を用いて切り出す方法が一つ考えられる。そうしてこのコレクションに対して、雲の形をキーにした画像検索をかければ、似たような形をもつ雲を検索するなどの実験が可能となる。それで何がわかるのか、まだ私自身も不明確ではあるが。
66666 9119 90 0027 9119 1 6 MIREILLE 19920508 91091300 002 2 130 1710 1010 000 91091306 002 2 125 1704 1010 000 91091312 002 2 125 1700 1010 000 91091318 002 2 126 1693 1010 000 91091400 002 2 129 1687 1008 000 91091406 002 2 131 1679 1006 000 91091412 002 2 131 1671 1006 000 91091418 002 2 134 1660 1006 000 91091500 002 2 135 1648 1004 000 91091506 002 2 136 1631 1004 000 91091512 002 2 140 1616 1004 000 91091518 002 2 145 1598 1004 000 91091600 002 3 148 1587 1000 035 00000 0000 90060 0060 91091606 002 4 151 1574 990 050 00000 0000 90060 0060 91091612 002 4 152 1566 985 055 90020 0020 90100 0100 91091618 002 5 154 1559 970 065 90050 0050 90120 0120 91091700 002 5 158 1551 965 070 90060 0060 90130 0130 91091706 002 5 160 1544 965 070 90060 0060 90130 0130 91091712 002 5 162 1537 965 070 90060 0060 90130 0130 91091718 002 5 162 1531 965 070 90060 0060 90130 0130 91091800 002 5 159 1525 960 075 90060 0060 90130 0130 91091806 002 5 157 1517 960 075 90060 0060 90150 0150 91091812 002 5 155 1510 955 080 90060 0060 90150 0150 91091818 002 5 154 1502 955 080 90060 0060 90150 0150 91091900 002 5 154 1489 955 080 90070 0070 90150 0150 91091906 002 5 155 1475 955 080 90070 0070 90150 0150 91091912 002 5 156 1460 955 080 90070 0070 90150 0150 91091918 002 5 156 1445 955 080 90070 0070 90150 0150 91092000 002 5 153 1433 955 080 90070 0070 90150 0150 91092006 002 5 151 1418 955 080 90070 0070 90150 0150 91092012 002 5 150 1406 955 080 90070 0070 90150 0150 91092018 002 5 146 1392 955 080 90070 0070 90150 0150 91092100 002 5 144 1384 955 080 90070 0070 90150 0150 91092106 002 5 144 1372 950 080 90080 0080 90170 0170 91092112 002 5 148 1361 945 085 90090 0090 90190 0190 91092118 002 5 151 1353 940 090 90100 0100 90200 0200 91092200 002 5 154 1345 940 090 90100 0100 90200 0200 91092206 002 5 158 1337 935 095 90100 0100 90200 0200 91092212 002 5 163 1332 935 095 90100 0100 90200 0200 91092218 002 5 168 1326 935 095 90100 0100 90230 0230 91092300 002 5 175 1321 930 095 90100 0100 90230 0230 91092306 002 5 182 1315 925 100 90110 0110 90230 0230 91092312 002 5 188 1307 925 100 90110 0110 90230 0230 91092318 002 5 191 1301 925 100 90110 0110 90230 0230 91092400 002 5 193 1297 925 100 90110 0110 90250 0250 91092406 002 5 199 1292 925 100 90110 0110 90250 0250 91092412 002 5 204 1288 930 095 90120 0120 90270 0270 91092415 002 5 206 1285 930 095 90120 0120 90270 0270 91092418 002 5 209 1282 930 095 90120 0120 90270 0270 91092421 002 5 212 1279 935 095 90120 0120 90270 0270 91092500 002 5 214 1276 935 095 90120 0120 90270 0270 91092503 002 5 218 1274 935 095 90120 0120 30350 0240 91092506 002 5 222 1272 940 090 90120 0120 30325 0270 91092509 002 5 226 1270 940 090 90120 0120 30325 0270 91092512 002 5 230 1268 940 090 90120 0120 30325 0270 91092515 002 5 234 1264 940 090 90120 0120 30325 0270 91092518 002 5 237 1261 940 090 90120 0120 30325 0270 91092521 002 5 240 1259 940 090 90120 0120 30325 0280 91092600 002 5 244 1258 940 090 90150 0150 30325 0280 91092603 002 5 249 1257 935 095 90150 0150 30350 0280 91092606 002 5 254 1257 935 095 90150 0150 30350 0280 91092609 002 5 259 1258 935 095 90150 0150 30350 0280 91092612 002 5 265 1260 935 095 20160 0140 20400 0260 91092615 002 5 273 1262 930 095 20160 0140 20400 0260 91092618 002 5 281 1264 930 095 20160 0140 20400 0260 91092621 002 5 290 1269 935 095 20160 0140 20400 0260 91092700 002 5 299 1276 935 095 20160 0140 20400 0260 91092703 002 5 312 1284 935 095 20160 0140 20400 0260 91092706 002 5 325 1293 935 095 30180 0140 30400 0260 91092707 002 5 328 1297 940 095 30180 0140 30400 0260 # 91092709 002 5 339 1306 945 090 30200 0140 30400 0260 91092712 002 5 355 1323 945 090 30240 0140 30400 0260 91092715 002 5 371 1339 950 085 30240 0140 30400 0260 91092718 002 5 390 1363 950 085 30240 0140 30450 0260 91092721 002 5 407 1383 955 080 30260 0140 30475 0260 91092722 002 5 412 1390 955 080 30260 0140 30475 0260 # 91092800 002 5 435 1417 970 065 30280 0140 30475 0260 91092803 002 4 455 1455 970 060 30280 0120 30550 0260 91092806 002 6 470 1480 966 000 91092812 002 6 480 1520 966 000 91092818 002 6 490 1550 962 000 91092900 002 6 520 1640 960 000 91092906 002 6 530 1690 952 000 91092912 002 6 530 1720 948 000 91092918 002 6 530 1740 952 000 91093000 002 6 530 1750 956 000 91093006 002 6 540 1770 960 000 91093012 002 6 540 1790 960 000 91093018 002 6 540 1800 968 000 91100100 002 6 550 1810 972 000
(*8) http://w3.ktarn.or.jp/kamahori/typhoon/TC-track.html
画像データベースの内容検索の基本的な機能とは、検索キーに対して重要そうな(似ている)画像データを検索するという機能である。それはそれで良いのだが、衛星画像データベースの場合、それだけでは話がおもしろく発展しないのかもしれない、という気がしてきた。ただ「検索できました」と言うだけでは、どうも結果がうまくないのだ。
画像データベースを使うことによって新しい知見が得られた、となれば、これは議論がわかりやすい。しかし残念ながら、リモートセンシングの研究者は、そのような機能はあまり期待していないように見える。彼らにとって、研究対象は普通は明確に決まっているものである。「アマゾンの熱帯雨林の変化を調べる」、「沖縄の珊瑚礁と海の汚れの関係を調べる」、「大都市近郊の土地利用の変化を調べる」、「黒潮の流れの変動を調べる」などなど。調べたい対象は、このように個別研究として既に決まっているので、後はそれをどのように調べ、どれくらいの精度で検証するか、などが問題になるのである。そういう彼らにとっては、画像データベースによってネットワーク経由で基礎データの入手が容易になれば、それはそれで確かにうれしいことだ。しかし、その後の本当の解析は自分達でやるため、あまり妙な前処理はやらないでくれ、というのが本音であろう。こんな状況では、画像データベースが提供すべき機能は非常に限定されてしまう。
となるとまず考えられるのは、データマイニング的な要素の導入である。画像データを検索した後にそこから何か興味深いパターンを見つけ出す、または興味深いパターンを見つけ出すことを支援できればおもしろい。このような研究はデータベースにおける知識発見 (Knowledge Discovery in Databases) と呼ばれ、「データから、以前には知られていない、そして潜在的には有用な知識を引き出す方法であって、自明ではない方法」と定義される。それゆえ、獲得された知識は新しいものでなければならず、自明なものであってはならず、使うことができるものでなければならない。
衛星画像を対象にしてこんなことが実現できれば大変うれしい。が、現実は厳しそうである。まず、個別研究を競争相手にしてしまうと苦しい。個別研究では人間自身が手間暇をかけてデータの処理を行なっているので、データマイニングのような大雑把な方法で勝てる見込みは非常に薄い。そうすると、「沖縄の珊瑚礁」などのように個別研究で取り上げられる地域以外に着目し、画像検索+データマイニング手法の組合せによって、何か興味深いパターンを発見できるだろうか、というところに関心が向く。果してこのように、自明でなく新しい知識が発見できるのかどうか。1年で結論が出る見込みは薄いように思える。
もう一つの方向性はPublic Use of Remote Sensing Dataである。一般の人々向けに、もっとリモートセンシングデータを使ってもらおうというのが趣旨で、これならば精度などあまりうるさいことは言われないし、もう少し「夢のある」ことができるかもしれない。これには2つの要素が考えられる。
まず第一に、衛星画像データの公開方法、つまり衛星画像の見せ方を問題とする。美しく可視化された衛星画像を見せることによって、地球環境問題に関する意識を高める、または意図的に色づけした画像によって注意を喚起する、などが目的となる。うまい用途が見付かれば、これはCGを使うことによってそれなりに実現可能だと考えられる。
第二に、画像の公開によってユーザからのフィードバックを収集するという目的が考えられる。いまどのような画像に関心があるのか、どのような画像が役立っているのか、などの問題点に関する情報を収集する。ただしこれは、いいデータをデータベースとして提供できて始めて実現する計画である。
アプリケーションを一つ考えてみると、やはり天気図や台風位置情報を用いた、台風や低気圧のトラッキングが考えられる。トラッキングといっても、必ずしも位置情報に関心があるわけではなく、むしろ位置情報と関連付けた画像情報に関心がある。大きめの温帯低気圧まで含めれば、かなりの数の画像が1年間でも切り出せるはずである。
今年の7月に、プロジェクトの中間発表をしなければいけないが、ほとんど時間がない。7月までに何ができるか、詰めていかないといけないのだが、相変わらず焦点がまだ定まらない。とりあえず何かできそうなことから始めていきたいと思っている。
|