Avro — это система сериализации данных, разработанная в рамках проекта Apache Hadoop. Она предоставляет богатую структуру данных, компактный и быстрый бинарный формат, контейнерный файл для хранения постоянных данных, удаленный вызов процедур (RPC) и простую интеграцию с динамическими языками. Avro использует JSON для определения типов данных и протоколов, а сериализует данные в компактном двоичном формате. Основное применение Avro находит в экосистеме Hadoop, где он используется для сериализации и обмена данными. Avro особенно хорошо подходит для приложений, требующих эволюции схем (schema evolution), так как схема хранится вместе с данными. Это позволяет считывающим устройствам обрабатывать данные, даже если схема изменилась с момента их записи. Возможности эволюции схем в сочетании с эффективным бинарным форматом делают Avro популярным выбором для хранения и обмена данными в средах больших данных (Big Data). Система поддерживает сложные типы данных и спроектирована для обеспечения высокой производительности как при чтении, так и при записи. Файлы Avro часто используются для распределенного хранения огромных наборов данных.