Pandas DataFrame: функция groupby ()

DataFrame — функция groupby ()

Функция groupby () используется для группировки DataFrame или Series с помощью сопоставителя или серии столбцов.

Операция groupby включает в себя некоторую комбинацию разделения объекта, применения функции и объединения результатов. Это можно использовать для группировки больших объемов данных и вычисления операций в этих группах.

Синтаксис:

 DataFrame.groupby (  self, by = None, axis = 0, level = None, as_index = True, sort = True, group_keys = True, squeeze = False, замечено = False, ** kwargs) 

Параметры:

Имя Описание Тип/Значение по умолчанию Обязательно/Необязательно
by Используется для определения группы для groupby. Если by — функция, она вызывается для каждого значения индекса объекта. Если передан dict или Series, Series или dict VALUES будут использоваться для определения групп (сначала выравниваются значения Series; см. Метод .align ()). Если передается ndarray, значения используются как есть для определения групп. Метка или список меток могут быть переданы в группу по столбцам в self. Обратите внимание, что кортеж интерпретируется как (единственный) ключ. отображение, функция, метка или список меток Обязательно
ось Разделить по строкам (0) или столбцам (1). {0 или ‘index’, 1 или ‘columns’}
Значение по умолчанию: 0
Обязательный
level Если ось является MultiIndex (иерархической), сгруппируйте по определенному уровню или уровням. int, имя уровня или их последовательность,
Значение по умолчанию: Нет
Обязательно
as_index Для агрегированного вывода верните объект с метками группы в качестве индекса. Актуально только для ввода DataFrame. as_index = False фактически представляет собой сгруппированный вывод «в стиле SQL». bool
Значение по умолчанию: True
Обязательно
sort Сортировка групповых ключей. Получите лучшую производительность, отключив это. Обратите внимание, что это не влияет на порядок наблюдений в каждой группе. Groupby сохраняет порядок строк в каждой группе. bool
Значение по умолчанию: True
Обязательно
group_keys При вызове apply добавьте групповые ключи в индекс для идентификации частей. bool
Значение по умолчанию: True
Обязательно
squeeze Если возможно, уменьшить размерность возвращаемого типа, в противном случае вернуть согласованный тип. bool
Значение по умолчанию: False
Обязательно
наблюдается Это применимо, только если какой-либо из группировщиков является категориальным. Если True: показывать только наблюдаемые значения для категориальных групперов. Если False: показать все значения для категориальных группировщиков. bool
Значение по умолчанию: False
Обязательно
** kwargs Необязательно, принимает только аргумент ключевого слова ‘mutated’ и передается в groupby. Необязательно

Возвращает: DataFrameGroupBy или SeriesGroupBy
Зависит от вызывающего объекта и возвращает объект groupby, содержащий информацию о группах.

Пример:

Загрузите вышеуказанный блокнот с здесь .

Оцените статью
nanomode.ru
Добавить комментарий