تنسيق Apache Parquet هو تنسيق تخزين عمودي (columnar storage format) تم تحسينه للاستخدام مع أطر عمل معالجة البيانات الضخمة. على عكس التنسيقات الموجهة نحو الصفوف، يقوم Parquet بتخزين البيانات حسب الأعمدة، مما يسمح بضغط البيانات وترميزها بكفاءة عالية. يتيح هذا التخزين العمودي لمحركات الاستعلام استرداد الأعمدة الضرورية فقط لاستعلام معين، مما يقلل بشكل كبير من عمليات الإدخال والإخراج (I/O) ويحسن أداء الاستعلام. تم تصميم Parquet ليكون ذاتي الوصف، مما يعني أن المخطط (schema) مضمن داخل ملف البيانات نفسه، وهذا يلغي الحاجة إلى مخازن بيانات وصفية خارجية ويبسط إدارة البيانات. يدعم التنسيق مجموعة واسعة من أنواع البيانات والهياكل المتداخلة المعقدة. يُستخدم Parquet على نطاق واسع في مستودعات البيانات، وبحيرات البيانات، وتطبيقات البيانات الضخمة الأخرى حيث يكون التخزين والاسترجاع الفعال للبيانات أمراً بالغ الأهمية. إن تكامله مع أطر العمل الشهيرة مثل Apache Spark وHadoop وPresto يجعله خياراً مرناً لخطوط معالجة البيانات. تم تصميم التنسيق لعمليات القراءة والكتابة، على الرغم من أنه يُستخدم غالباً في السيناريوهات التي تُكتب فيها البيانات مرة واحدة وتُقرأ مرات عديدة (write-once, read-many).