DataFrame — функция groupby ()
Функция groupby () используется для группировки DataFrame или Series с помощью сопоставителя или серии столбцов.
Операция groupby включает в себя некоторую комбинацию разделения объекта, применения функции и объединения результатов. Это можно использовать для группировки больших объемов данных и вычисления операций в этих группах.
Синтаксис:
DataFrame.groupby ( self, by = None, axis = 0, level = None, as_index = True, sort = True, group_keys = True, squeeze = False, замечено = False, ** kwargs)
Параметры:
Имя | Описание | Тип/Значение по умолчанию | Обязательно/Необязательно |
---|---|---|---|
by | Используется для определения группы для groupby. Если by — функция, она вызывается для каждого значения индекса объекта. Если передан dict или Series, Series или dict VALUES будут использоваться для определения групп (сначала выравниваются значения Series; см. Метод .align ()). Если передается ndarray, значения используются как есть для определения групп. Метка или список меток могут быть переданы в группу по столбцам в self. Обратите внимание, что кортеж интерпретируется как (единственный) ключ. | отображение, функция, метка или список меток | Обязательно |
ось | Разделить по строкам (0) или столбцам (1). | {0 или ‘index’, 1 или ‘columns’} Значение по умолчанию: 0 |
Обязательный |
level | Если ось является MultiIndex (иерархической), сгруппируйте по определенному уровню или уровням. | int, имя уровня или их последовательность, Значение по умолчанию: Нет |
Обязательно |
as_index | Для агрегированного вывода верните объект с метками группы в качестве индекса. Актуально только для ввода DataFrame. as_index = False фактически представляет собой сгруппированный вывод «в стиле SQL». | bool Значение по умолчанию: True |
Обязательно |
sort | Сортировка групповых ключей. Получите лучшую производительность, отключив это. Обратите внимание, что это не влияет на порядок наблюдений в каждой группе. Groupby сохраняет порядок строк в каждой группе. | bool Значение по умолчанию: True |
Обязательно |
group_keys | При вызове apply добавьте групповые ключи в индекс для идентификации частей. | bool Значение по умолчанию: True |
Обязательно |
squeeze | Если возможно, уменьшить размерность возвращаемого типа, в противном случае вернуть согласованный тип. | bool Значение по умолчанию: False |
Обязательно |
наблюдается | Это применимо, только если какой-либо из группировщиков является категориальным. Если True: показывать только наблюдаемые значения для категориальных групперов. Если False: показать все значения для категориальных группировщиков. | bool Значение по умолчанию: False |
Обязательно |
** kwargs | Необязательно, принимает только аргумент ключевого слова ‘mutated’ и передается в groupby. | Необязательно |
Возвращает: DataFrameGroupBy или SeriesGroupBy
Зависит от вызывающего объекта и возвращает объект groupby, содержащий информацию о группах.
Пример:
Загрузите вышеуказанный блокнот с здесь .