1. データセット

本ページは、デジタル台風プロジェクトのデータセットやソフトウェアを公開します。データセットは機械学習に有用なだけでなく、気象学的な研究における定量的な分析にも有用です。

データセット

1時間ごとの気象衛星赤外チャネル画像から作成した台風中心画像のデータセットです。1978年以来の歴代の「ひまわり」気象衛星画像のデータを輝度温度に変換し、異なる衛星のセンサで観測した観測値を補正しているため、40年以上にわたる一様な時空間データセットとして活用できます。

バージョン 対象 公開日
バージョン1 北半球のみ 2023年11月3日
バージョン2 北半球・南半球 2024年11月26日

論文

  1. Version 2: Asanobu Kitamoto, Erwan Dzik, Gaspar Faure, "Machine Learning for the Digital Typhoon Dataset: Extensions to Multiple Basins and New Developments in Representations and Tasks", arXiv:2411.16421, 2024.
  2. Version 1: Asanobu Kitamoto, Jared Hwang, Bastien Vuillod, Lucas Gautier, Yingtao Tian, Tarin Clanuwat, "Digital Typhoon: Long-term Satellite Image Dataset for the Spatio-Temporal Modeling of Tropical Cyclones", NeurIPS 2023 Datasets and Benchmarks (Spotlight), 2023. (Digital Typhoon: Long-term Satellite Image Dataset for the Spatio-Temporal Modeling of Tropical Cyclones, arXiv:2311.02655.).

その他の関連資料については、発表文献リストにて「絞り込み='typhoon'または'台風'」を設定して探して下さい。

ソフトウェア

Pyphoonは、デジタル台風データセットを機械学習研究に活用するためのPythonライブラリです。

データリポジトリ

デジタル台風データセットは、DIAS (Data Integration and Analysis System)でも公開しています。DIASは地球環境データに関する分野データリポジトリであり、永続的識別子であるデータセットのDOI (doi:10.20783/DIAS.664) を付与できます。

  1. デジタル台風データセット

謝辞

気象衛星ひまわり画像については、大部分は気象業務支援センター経由で購入したデータを利用していますが、一部については東京大学生産技術研究所で受信したデータを利用しています。詳しくは各種データの出典をご覧下さい。

デジタル台風データセットの開発には、多くの人々が関わりました。特に、以下に示す北本研究室のインターンシップ学生が、データセットに対する機械学習アルゴリズムの研究や、ソフトウェアライブラリの開発を進めました。

  1. Danlan Chen
  2. Lucas Rodes Guirao
  3. Alexander Grishin
  4. Clément Playout
  5. Izabela Horvath
  6. Jean-Paul Lam
  7. Jared Hwang
  8. Bastien Vuillod
  9. Lucas Limos Gautier
  10. Gaspar Faure
  11. Erwan Dzik
  12. Tong Ngoc Anh
  13. Veleva, Anja