Как сделать гистограммы с помощью панд

pandas — популярный набор инструментов для анализа данных на основе Python, который можно импортировать с помощью:

  import pandas as pd  

В нем представлен широкий спектр утилит, от анализа нескольких форматов файлов до преобразования всей таблицы данных в матричный массив NumPy. Это свойство делает pandas надежным союзником в области науки о данных и машинного обучения.

pandas может помочь вам в создании нескольких типов графиков анализа данных. Одним из таких графиков является гистограмма.

Реализация гистограммы по умолчанию:

DataFrame.bar ( x = None y = None, color = None, ** kwargs)

Параметры

  • x : метка или позиция — Позволяет отображать один столбец по сравнению с другим. Если не указан, используется индекс df.

  • y : label или position — Позволяет отображать один столбец по сравнению с другим. Если не указан, используются все числовые столбцы.

  • color : str, как в виде массива, dict — цвет каждого столбца. Возможные значения:
    Одна строка, указанная в коде RGB или RGBA — используется для всех столбцов
    Массив, на который имеется ссылка в коде RGB или RGBA — используется для столбцов рекурсивно
    Dict — используется для всех указанных столбцов. Например, {‘Col1’: ‘red’} применит красный цвет к столбцу с именем Col1.

  • ** kwargs : tuple (rows, columns) — все остальные ключевые аргументы построения графика, передаваемые в matplotlib.pyplot.boxplot ().

Код

Давайте посмотрим на пример. Импортируйте библиотеку и загрузите набор данных во фрейм данных. Здесь набор данных включает среднее значение для нескольких субъектов:

 #import libraryimport pandas as pd # add csv file to dataframedf = pd.DataFrame ({'Subject': ['English', 'Maths', 'Science'], 'Mean':  [90, 87, 67]}) # создать гистограммуbargraph = df.plot.bar (x = 'Subject', y = 'Mean', fontsize = '9') 

Аналогичным образом можно построить полный фрейм данных:

main.py
набор данных. csv
 #import libraryimport pandas as pd # add csv file to dataframedf = pd.read_csv ('dataset.csv')  #create bar graphbargraph = df.plot.bar (x = 'Id') 

Оцените статью
nanomode.ru
Добавить комментарий