Перед выполнением глубокого анализа данных специалисты по обработке данных применяют методы исследования данных на больших наборах данных, чтобы обнаружить начальные закономерности, характеристики и различные точки интереса.
Исследование данных не стремится раскрыть каждый бит информации, скрытой в наборе данных; вместо этого он выполняется, чтобы получить широкое представление о различных закономерностях, тенденциях и ключевых особенностях.
При исследовании данных используются различные традиционные методы и современные автоматизированные методы, такие как визуализация и отчеты.
Исследование данных облегчает последующий анализ, поскольку дает ученым базовую основу, на которой может быть основан дальнейший анализ; это помогает исключить нерелевантные пути и точки данных. Достаточное изучение набора данных, наряду с использованием адекватных инструментов визуализации, может привести к получению полезной информации, касающейся корреляций, закономерностей и определения того, какие пути исследования заслуживают дальнейшего анализа.