HDF5(Hierarchical Data Format version 5)は、大量の数値データを格納および整理するために設計された、多用途なオープンソースのファイル形式です。特に、データセットが複雑で異種混合であり、効率的なストレージと検索が要求される科学技術計算アプリケーションに非常に適しています。CSVやプレーンテキストのような単純な形式とは異なり、HDF5は単一のファイル内に複数のデータセットを格納することを可能にし、データの構造、単位、その他の関連情報を記述するメタデータも同時に保持します。この階層構造により、ユーザーはデータを論理的に整理でき、情報の特定のサブセットへのナビゲートとアクセスが容易になります。HDF5は、整数、浮動小数点数、文字列、配列を含む幅広いデータ型をサポートしており、利用可能なメモリよりもはるかに大きいデータセットを扱うことができます。その自己記述的な性質により、外部ドキュメントがなくてもデータを正しく解釈できることが保証されます。さらに、この形式は圧縮をサポートしており、ファイルサイズを大幅に削減でき、またチャンキング(chunking)をサポートしているため、ファイル全体をメモリにロードすることなく、データサブセットへの効率的なアクセスが可能です。その柔軟性とパフォーマンスから、HDF5は天文学、気候科学、医用画像処理、計算流体力学などの分野で広く利用されています。