ARFF (Attribute-Relation File Format) — это текстовый формат файла, разработанный Группой машинного обучения (Machine Learning Group) Университета Уаикато (University of Waikato) для описания наборов данных, используемых в машинном обучении. Он в основном используется с программным обеспечением WEKA (Waikato Environment for Knowledge Analysis), но также поддерживается другими инструментами машинного обучения. Файл ARFF состоит из двух основных секций: секции заголовка (header section) и секции данных (data section). Секция заголовка определяет имя отношения (relation name, имя набора данных) и атрибуты (attributes, признаки или столбцы) данных. Каждый атрибут объявляется с указанием его имени и типа данных (например, числовой (numeric), номинальный (nominal), строковый (string) или дата (date)). Секция данных содержит фактические экземпляры данных (data instances), причем каждый экземпляр представлен в виде списка значений атрибутов, разделенных запятыми. Пропущенные значения обычно обозначаются знаком вопроса (?). Файлы ARFF разработаны таким образом, чтобы быть удобочитаемыми и легко анализируемыми (parsed) алгоритмами машинного обучения, что делает их популярным выбором для хранения и обмена наборами данных в сообществе. Этот формат поддерживает различные типы данных и позволяет представлять как числовые, так и категориальные данные, что делает его универсальным для широкого спектра задач анализа данных и машинного обучения.