1999年4月22日の打ち合わせ資料

本資料はもともと外部への公開を目的としたものではなく、ブレーンストーミングの叩き台として作った資料ですが、「デジタル台風」プロジェクト10年のあゆみを振り返るために、ここに(恥をしのんで)ほぼ原型をとどめた形で公開することにしました。

1. 前回のまとめ

前回には以下のような提案があった。衛星画像だけで可能なことは限られているため、画像以外の情報と組み合わせた検索はできないだろうか、というのが主な議論であった。

まず天気図というのが、最も有望な外部のデータであると言える。そこで天気図の情報源についていくつか調べてみた。まずFAX サービスとしては、気象業務支援センターの「天気図サービス」(*1) や、気象短波FAXサービス (*2)などがある。次にCD-ROMとしては、「気象データひまわり」(*3)や、気象業務支援センターのCD-ROM (*4)などがある。最後にWWWでも多くのサーバ(*5)が天気図を提供している。

ただしいずれのデータも、私が知る限りラスターデータとなっている。人間が見るにはその方が使いやすいが、これではその後の処理がしにくい。なんとかデジタル情報としてすぐに使える情報はないだろうか。

(*1) NTT のファクシミリ案内サービスを利用。地上天気図や台風予想図、雲解析情報図など多彩な内容がある。1年36,540 円、他通信料。

(*2) 無線通信を用いて直接通報している無線FAXであり、受信には短波受信機とファクシミリが必要。

(*3) 極東地域の地上気象観測資料・海上の船舶からの気象通報データ・気象衛星ひまわりの画像等、様々な資料を利用して作成された天気図に、主な地点の天気と風向・風力をあわせて表示したもの。

(*4) FAX サービスの一部の画像?

(*5) 例えば防災気象情報サービス http://tenki.or.jp/ 。実況天気図はいかにもコンピュータで描いてありそうなので、そのソースに関する情報を調べる必要がある。

2. デジタル情報として何があるか

そこで、以下のような代替案について考えていく。

  1. 数値予報データを入手し、これを天気図の代替データとして用いることで、衛星画像と天気図とを組み合わせた検索を実現する。
  2. 台風に関しては特別に位置情報が精細に記録されているので、このデータを用いることによって台風周辺の雲だけを切り出し、台風画像データベースを実現する。

2.1 数値予報

気象庁はWMO (World Meteorological Organization) Distributed Data Base) (*6)を公開している。ここで入手できるのは GPV (Grid Point Value) products、つまりスーパコンピュータが計算した、毎日の気圧・風・温度等の予想値のデータである。その種類には以下のようなものがある。

  1. アジア地域 (60N - 20S, 60E - 160W) (1.25 deg)
  2. 北半球 (2.5 deg)
  3. 南半球 (2.5 deg)

またデータの内容を表1や表2に示す。両者を比較すると、表1の方が内容が豊富で、しかも大気の層を細かく分割して計算している。「天気図」という意味では気圧情報が使えそうだが、その他にも気温や風などの情報にもおもしろい用途が考えられそうである。

ただしここで問題になるのが解像度である。まず1 degとは、日本付近ではおよそ100kmに相当する値である。するとアジア地域の数値予報は125kmグリッド、北 / 南半球の数値予報は250kmグリッドに相当することになる。これに対して、NOAA衛星画像の地上解像度は1km程度であり、両者の間には解像度にして100倍以上の差がある。この差はかなり大きい (*7)。そこでこのデータを活用するためには以下のような問題点について考える必要がある。

  1. 例えば地上気圧の情報を用いれば、地上天気図を描くことはできるが、その中心位置の誤差は衛星画像上では100画素程度と考えなければならなくなる。この程度の誤差が生じてもよいアプリケーションはどんなものか。
  2. 台風のスケールは100km〜1000km程度なので、サブグリッドスケールの小さな台風や低気圧がデータから漏れてしまう可能性がある。一般に温帯低気圧のスケールは台風よりも大きいが、やはり小さな低気圧や局地的な気象現象は埋もれてしまうだろう。しかし台風という気象現象は非常に重要なので、別のデータソースが見付かる可能性がある。次の章も参照。
  3. 数値予報データは純粋に気圧分布を示しているので、前線などに関する情報はない。また低気圧か台風かの判断は等圧線の形で別途判断するしかないが、これは簡単な場合もあれば難しい場合もある。

また過去のデータがアーカイブされていない(?)のも困り物である。これだと現在以降の衛星画像に関してしか、対応できない。

いくつかのソフトウェアをダウンロードし、天気図描画に使えるソフトをインストールした。地図の上に数値予報データを重ね描きできる。しかしまだ図をうまく描けるには至っていない。

表1: 1.25 x 1.25deg, 60N-20S, 60E-160W (00UTC, 12UTC)
Elements Forecast time (hour) Level (hPa)
Pressure or Height 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 MSL, 1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100
u and v-component of Wind 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 Surface, 1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100
Temperature 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 Surface, 1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100
Dew-point depression 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 Surface, 1000, 925, 850, 700, 500, 400, 300
Total Precipitation 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 Ground
Vertical Velocity 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 925, 850, 700
Stream Function 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 850, 200
Velocity Potential 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 850, 200
Relative Vorticity 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72 500
表2: 2.5 x 2.5deg, Northern & Southern hemisphere (12UTC)
Elements Forecast time (hour) Level (hPa)
Pressure or Height 00, 24, 48, 72, 96, 120 MSL, 850, 700, 500, 300, 250, 200, 100
u and v-component of Wind 00, 24, 48, 72, 96, 120 Surface, 850, 700, 500, 300, 250, 200, 100
Temperature 00, 24, 48, 72, 96, 120 Surface, 850, 700, 500, 300, 250, 200, 100
Dew-point depression 00, 24, 48, 72, 96, 120 850, 700
Total Precipitation 00, 24, 48, 72, 96, 120 Ground

(*6) http://ddb.kishou.go.jp/

(*7) 本当はもっと細かいグリッド(50km以下?)で数値予報をしているはずだが、なぜかこのようなグリッドスケールになっている。

2.2 台風の中心位置

気象庁が決定した台風の位置、中心気圧、最大風速などがまとめられているページがある(*8)。この情報ソースが何なのかはよくわからないので、そのうちページの管理者に聞いてみようかと思っているが、とにかくこのデータを使えば台風の中心位置のトラッキングが可能である。そこでその位置を中心として、適当な大きさの画像を切り出せば、それで台風画像データベースができる。データの例を表1に示す。

このように時刻ごとの中心位置がわかっているので、その付近の衛星画像を切り出すことによって、台風の形などが特に良く見えるような画像のコレクションを作成できるだろう。どのような大きさで切り出すかというのは、一つのテーマになりうるが、これについては雲の空間的分布などの特徴量を用いて切り出す方法が一つ考えられる。そうしてこのコレクションに対して、雲の形をキーにした画像検索をかければ、似たような形をもつ雲を検索するなどの実験が可能となる。それで何がわかるのか、まだ私自身も不明確ではあるが。

66666 9119   90 0027 9119 1 6 MIREILLE                     19920508
91091300 002 2 130 1710 1010     000
91091306 002 2 125 1704 1010     000
91091312 002 2 125 1700 1010     000
91091318 002 2 126 1693 1010     000
91091400 002 2 129 1687 1008     000
91091406 002 2 131 1679 1006     000
91091412 002 2 131 1671 1006     000
91091418 002 2 134 1660 1006     000
91091500 002 2 135 1648 1004     000
91091506 002 2 136 1631 1004     000
91091512 002 2 140 1616 1004     000
91091518 002 2 145 1598 1004     000
91091600 002 3 148 1587 1000     035     00000 0000 90060 0060
91091606 002 4 151 1574  990     050     00000 0000 90060 0060
91091612 002 4 152 1566  985     055     90020 0020 90100 0100
91091618 002 5 154 1559  970     065     90050 0050 90120 0120
91091700 002 5 158 1551  965     070     90060 0060 90130 0130
91091706 002 5 160 1544  965     070     90060 0060 90130 0130
91091712 002 5 162 1537  965     070     90060 0060 90130 0130
91091718 002 5 162 1531  965     070     90060 0060 90130 0130
91091800 002 5 159 1525  960     075     90060 0060 90130 0130
91091806 002 5 157 1517  960     075     90060 0060 90150 0150
91091812 002 5 155 1510  955     080     90060 0060 90150 0150
91091818 002 5 154 1502  955     080     90060 0060 90150 0150
91091900 002 5 154 1489  955     080     90070 0070 90150 0150
91091906 002 5 155 1475  955     080     90070 0070 90150 0150
91091912 002 5 156 1460  955     080     90070 0070 90150 0150
91091918 002 5 156 1445  955     080     90070 0070 90150 0150
91092000 002 5 153 1433  955     080     90070 0070 90150 0150
91092006 002 5 151 1418  955     080     90070 0070 90150 0150
91092012 002 5 150 1406  955     080     90070 0070 90150 0150
91092018 002 5 146 1392  955     080     90070 0070 90150 0150
91092100 002 5 144 1384  955     080     90070 0070 90150 0150
91092106 002 5 144 1372  950     080     90080 0080 90170 0170
91092112 002 5 148 1361  945     085     90090 0090 90190 0190
91092118 002 5 151 1353  940     090     90100 0100 90200 0200
91092200 002 5 154 1345  940     090     90100 0100 90200 0200
91092206 002 5 158 1337  935     095     90100 0100 90200 0200
91092212 002 5 163 1332  935     095     90100 0100 90200 0200
91092218 002 5 168 1326  935     095     90100 0100 90230 0230
91092300 002 5 175 1321  930     095     90100 0100 90230 0230
91092306 002 5 182 1315  925     100     90110 0110 90230 0230
91092312 002 5 188 1307  925     100     90110 0110 90230 0230
91092318 002 5 191 1301  925     100     90110 0110 90230 0230
91092400 002 5 193 1297  925     100     90110 0110 90250 0250
91092406 002 5 199 1292  925     100     90110 0110 90250 0250
91092412 002 5 204 1288  930     095     90120 0120 90270 0270
91092415 002 5 206 1285  930     095     90120 0120 90270 0270
91092418 002 5 209 1282  930     095     90120 0120 90270 0270
91092421 002 5 212 1279  935     095     90120 0120 90270 0270
91092500 002 5 214 1276  935     095     90120 0120 90270 0270
91092503 002 5 218 1274  935     095     90120 0120 30350 0240
91092506 002 5 222 1272  940     090     90120 0120 30325 0270
91092509 002 5 226 1270  940     090     90120 0120 30325 0270
91092512 002 5 230 1268  940     090     90120 0120 30325 0270
91092515 002 5 234 1264  940     090     90120 0120 30325 0270
91092518 002 5 237 1261  940     090     90120 0120 30325 0270
91092521 002 5 240 1259  940     090     90120 0120 30325 0280
91092600 002 5 244 1258  940     090     90150 0150 30325 0280
91092603 002 5 249 1257  935     095     90150 0150 30350 0280
91092606 002 5 254 1257  935     095     90150 0150 30350 0280
91092609 002 5 259 1258  935     095     90150 0150 30350 0280
91092612 002 5 265 1260  935     095     20160 0140 20400 0260
91092615 002 5 273 1262  930     095     20160 0140 20400 0260
91092618 002 5 281 1264  930     095     20160 0140 20400 0260
91092621 002 5 290 1269  935     095     20160 0140 20400 0260
91092700 002 5 299 1276  935     095     20160 0140 20400 0260
91092703 002 5 312 1284  935     095     20160 0140 20400 0260
91092706 002 5 325 1293  935     095     30180 0140 30400 0260
91092707 002 5 328 1297  940     095     30180 0140 30400 0260         #
91092709 002 5 339 1306  945     090     30200 0140 30400 0260
91092712 002 5 355 1323  945     090     30240 0140 30400 0260
91092715 002 5 371 1339  950     085     30240 0140 30400 0260
91092718 002 5 390 1363  950     085     30240 0140 30450 0260
91092721 002 5 407 1383  955     080     30260 0140 30475 0260
91092722 002 5 412 1390  955     080     30260 0140 30475 0260         #
91092800 002 5 435 1417  970     065     30280 0140 30475 0260
91092803 002 4 455 1455  970     060     30280 0120 30550 0260
91092806 002 6 470 1480  966     000
91092812 002 6 480 1520  966     000
91092818 002 6 490 1550  962     000
91092900 002 6 520 1640  960     000
91092906 002 6 530 1690  952     000
91092912 002 6 530 1720  948     000
91092918 002 6 530 1740  952     000
91093000 002 6 530 1750  956     000
91093006 002 6 540 1770  960     000
91093012 002 6 540 1790  960     000
91093018 002 6 540 1800  968     000
91100100 002 6 550 1810  972     000
図1 1991年台風19号の一生。

(*8) http://w3.ktarn.or.jp/kamahori/typhoon/TC-track.html

3. 今後の方針

3.1 どうすればおもしろい展開となるのか

画像データベースの内容検索の基本的な機能とは、検索キーに対して重要そうな(似ている)画像データを検索するという機能である。それはそれで良いのだが、衛星画像データベースの場合、それだけでは話がおもしろく発展しないのかもしれない、という気がしてきた。ただ「検索できました」と言うだけでは、どうも結果がうまくないのだ。

画像データベースを使うことによって新しい知見が得られた、となれば、これは議論がわかりやすい。しかし残念ながら、リモートセンシングの研究者は、そのような機能はあまり期待していないように見える。彼らにとって、研究対象は普通は明確に決まっているものである。「アマゾンの熱帯雨林の変化を調べる」、「沖縄の珊瑚礁と海の汚れの関係を調べる」、「大都市近郊の土地利用の変化を調べる」、「黒潮の流れの変動を調べる」などなど。調べたい対象は、このように個別研究として既に決まっているので、後はそれをどのように調べ、どれくらいの精度で検証するか、などが問題になるのである。そういう彼らにとっては、画像データベースによってネットワーク経由で基礎データの入手が容易になれば、それはそれで確かにうれしいことだ。しかし、その後の本当の解析は自分達でやるため、あまり妙な前処理はやらないでくれ、というのが本音であろう。こんな状況では、画像データベースが提供すべき機能は非常に限定されてしまう。

3.2 データベースにおける知識発見

となるとまず考えられるのは、データマイニング的な要素の導入である。画像データを検索した後にそこから何か興味深いパターンを見つけ出す、または興味深いパターンを見つけ出すことを支援できればおもしろい。このような研究はデータベースにおける知識発見 (Knowledge Discovery in Databases) と呼ばれ、「データから、以前には知られていない、そして潜在的には有用な知識を引き出す方法であって、自明ではない方法」と定義される。それゆえ、獲得された知識は新しいものでなければならず、自明なものであってはならず、使うことができるものでなければならない。

衛星画像を対象にしてこんなことが実現できれば大変うれしい。が、現実は厳しそうである。まず、個別研究を競争相手にしてしまうと苦しい。個別研究では人間自身が手間暇をかけてデータの処理を行なっているので、データマイニングのような大雑把な方法で勝てる見込みは非常に薄い。そうすると、「沖縄の珊瑚礁」などのように個別研究で取り上げられる地域以外に着目し、画像検索+データマイニング手法の組合せによって、何か興味深いパターンを発見できるだろうか、というところに関心が向く。果してこのように、自明でなく新しい知識が発見できるのかどうか。1年で結論が出る見込みは薄いように思える。

3.3 Public Use of Remote Sensing Data

もう一つの方向性はPublic Use of Remote Sensing Dataである。一般の人々向けに、もっとリモートセンシングデータを使ってもらおうというのが趣旨で、これならば精度などあまりうるさいことは言われないし、もう少し「夢のある」ことができるかもしれない。これには2つの要素が考えられる。

まず第一に、衛星画像データの公開方法、つまり衛星画像の見せ方を問題とする。美しく可視化された衛星画像を見せることによって、地球環境問題に関する意識を高める、または意図的に色づけした画像によって注意を喚起する、などが目的となる。うまい用途が見付かれば、これはCGを使うことによってそれなりに実現可能だと考えられる。

第二に、画像の公開によってユーザからのフィードバックを収集するという目的が考えられる。いまどのような画像に関心があるのか、どのような画像が役立っているのか、などの問題点に関する情報を収集する。ただしこれは、いいデータをデータベースとして提供できて始めて実現する計画である。

アプリケーションを一つ考えてみると、やはり天気図や台風位置情報を用いた、台風や低気圧のトラッキングが考えられる。トラッキングといっても、必ずしも位置情報に関心があるわけではなく、むしろ位置情報と関連付けた画像情報に関心がある。大きめの温帯低気圧まで含めれば、かなりの数の画像が1年間でも切り出せるはずである。

4. おわりに

今年の7月に、プロジェクトの中間発表をしなければいけないが、ほとんど時間がない。7月までに何ができるか、詰めていかないといけないのだが、相変わらず焦点がまだ定まらない。とりあえず何かできそうなことから始めていきたいと思っている。