2023年11月03日

「デジタル台風データセット」の公開

デジタル台風データセットを公開しました。これまでのデジタル台風が主に人間による活用が目的だったのに対し、今回のデータセットは機械(AI)による活用を目的とするところが大きな特徴です。

AI(機械学習)の学習データとしてのデータセットの構築は長年にわたる課題でした。2016年頃から、我々はデジタル台風のデータを深層学習(ディープラーニング)に活用する研究を進めてきました。そのために機械学習用の学習データセットを内部的に作成し、研究に利用してきました。しかしこのデータセットは外部に公開できていなかったため、研究コミュニティにおける検証や追試、あるいはモデル比較などができない状態になっていました。今回のデータセット公開により、オープンデータを活用したモデル比較などが可能となり、この分野の研究が大きく進むことが期待できます。

また、これまでもデジタル台風のデータを機械学習に利用したいとの要望がありましたが、きちんとしたデータセットを構築していなかったため、要望に応えられないという状況がありました。そのため、ウェブサイトをスクレイピングして利用するなどの研究もありましたが、ウェブサイトの画像は圧縮がかかっており、画素値が物理量と対応しないなどの問題があり、データセットとして品質が低い状況となっていました。今回のデータセット公開では、複数の衛星センサをキャリブレーションするための新しいアルゴリズムを適用するなど、データセットの品質も向上しました。

これにより、デジタル台風を機械学習に活用し、台風モデルを構築するための足掛かりができました。今後はこのデータセットをより充実させ、複数センサや複数ソースを統合した台風モデルを構築していきたいと考えています。

デジタル台風データセットを見る