ARFF(Attribute-Relation File Format,属性关系文件格式)是由怀卡托大学(University of Waikato)的机器学习小组开发的一种文本文件格式,专门用于描述机器学习中使用的数据集。它主要与WEKA(Waikato Environment for Knowledge Analysis,怀卡托知识分析环境)软件配合使用,但也受到其他主流机器学习工具的支持。一个ARFF文件由两个主要部分组成:头部(Header)和数据(Data)。头部部分定义了关系名称(即数据集名称)以及数据的属性(Attributes,特征或列)。每个属性都必须声明其名称和数据类型,支持的数据类型包括数值型(numeric)、标称型(nominal)、字符串型(string)和日期型(date)等。数据部分包含实际的数据实例,每个实例表示为逗号分隔的属性值列表。在数据中,缺失值通常用问号(?)来表示。ARFF文件设计为人类可读,并且易于被机器学习算法解析,使其成为机器学习社区中存储和交换数据集的流行选择。该格式的通用性使其适用于广泛的机器学习任务,能够有效地表示数值和分类数据。