В качестве определяющих характеристик для больших данных традиционно выделяют «три V»: объём (
англ. volume, в смысле величины физического объёма), скорость (
velocity в смыслах как скорости прироста, так и необходимости высокоскоростной обработки и получения результатов), многообразие (
variety, в смысле возможности одновременной обработки различных типов структурированных и полуструктурированных данных)
[5][6]; в дальнейшем возникли различные вариации и интерпретации этого признака
Набор признаков
VVV (
volume, velocity, variety) изначально выработан Meta Group в 2001 году вне контекста представлений о больших данных как об определённой серии информационно-технологических методов и инструментов, в нём, в связи с ростом популярности концепции центрального
хранилища данных для организаций, отмечалась равнозначимость проблематик управления данными по всем трём аспектам
[24]. В дальнейшем появились интерпретации с «четырьмя V» (добавлялась
veracity — достоверность, использовалась в рекламных материалах
IBM[25]), «пятью V» (в этом варианте прибавляли
viability — жизнеспособность, и
value — ценность
[26]), и даже «семью V» (кроме всего, добавляли также
variability — переменчивость, и
visualization[27]).
IDC интерпретирует «четвёртое V» как
value c точки зрения важности экономической целесообразности обработки соответствующих объёмов в соответствующих условиях, что отражено также и в определении больших данных от IDC
[28]. Во всех случаях в этих признаках подчёркивается, что определяющей характеристикой для больших данных является не только их физический объём, но другие категории, существенные для представления о сложности задачи обработки и анализа данных.