pandas — популярный набор инструментов для анализа данных на основе Python, который можно импортировать с помощью:
import pandas as pd
В нем представлен широкий спектр утилит, от анализа нескольких форматов файлов до преобразования всей таблицы данных в матричный массив NumPy. Это свойство делает pandas надежным союзником в области науки о данных и машинного обучения.
pandas может помочь вам в создании нескольких типов графиков анализа данных. Одним из таких графиков является гистограмма.
Реализация гистограммы по умолчанию:
DataFrame.bar (
x
= Noney
= None,color
= None, ** kwargs)
Параметры
-
x
: метка или позиция — Позволяет отображать один столбец по сравнению с другим. Если не указан, используется индекс df. -
y
: label или position — Позволяет отображать один столбец по сравнению с другим. Если не указан, используются все числовые столбцы. -
color
: str, как в виде массива, dict — цвет каждого столбца. Возможные значения:
Одна строка, указанная в коде RGB или RGBA — используется для всех столбцов
Массив, на который имеется ссылка в коде RGB или RGBA — используется для столбцов рекурсивно
Dict — используется для всех указанных столбцов. Например, {‘Col1’: ‘red’} применит красный цвет к столбцу с именем Col1. -
** kwargs
: tuple (rows, columns) — все остальные ключевые аргументы построения графика, передаваемые в matplotlib.pyplot.boxplot ().
Код
Давайте посмотрим на пример. Импортируйте библиотеку и загрузите набор данных во фрейм данных. Здесь набор данных включает среднее значение для нескольких субъектов:
#import libraryimport pandas as pd # add csv file to dataframedf = pd.DataFrame ({'Subject': ['English', 'Maths', 'Science'], 'Mean': [90, 87, 67]}) # создать гистограммуbargraph = df.plot.bar (x = 'Subject', y = 'Mean', fontsize = '9')
Аналогичным образом можно построить полный фрейм данных:
#import libraryimport pandas as pd # add csv file to dataframedf = pd.read_csv ('dataset.csv') #create bar graphbargraph = df.plot.bar (x = 'Id')