Pandas DataFrame: функция merge ()

DataFrame — функция merge ()

Функция merge () используется для слияния DataFrame или именованных объектов Series с объединением в стиле базы данных.

Соединение выполняется по столбцам или индексам. При объединении столбцов в столбцы индексы DataFrame игнорируются. В противном случае при объединении индексов по индексам или индексам по столбцу или столбцам индекс будет передан.

Синтаксис:

  DataFrame.merge (self, right, how = 'inner', on = None, left_on = None, right_on = None, left_index = False, right_index = False, sort = False, суффиксы = ('_ x', '_y'),  copy = True, indicator = False, validate = None 

Параметры:

Имя Описание Тип/значение по умолчанию Обязательное/необязательное
right Объект для слияния. DataFrame или именованная серия Обязательно
как Тип выполняемого слияния.
  • left: используйте только ключи из левого фрейма аналогично левому внешнему соединению SQL; сохранить порядок ключей.
  • right: использовать только ключи из правого кадра, аналогично правому внешнему соединению SQL; сохранить порядок ключей.
  • outer: использовать объединение ключей из обоих фреймов, аналогично полному внешнему соединению SQL; ключи сортировки лексикографически.
  • inner: использовать пересечение ключей из обоих фреймов, аналогично внутреннему соединению SQL; сохранить порядок левых клавиш.
{‘left’, ‘right’, ‘external’, ‘inner’}
Значение по умолчанию: ‘inner’
Обязательно
на Имена столбцов или уровней индекса для присоединения. Они должны быть найдены в обоих DataFrames. Если on равно None и не выполняется слияние по индексам, то по умолчанию используется пересечение столбцов в обоих DataFrames. label или list Обязательно
left_on Имена столбцов или уровней индекса, которые нужно присоединить в левом фрейме данных. Также может быть массивом или списком массивов длины левого DataFrame. Эти массивы обрабатываются, как если бы они были столбцами. label или list, или как массив Обязательно
right_on Имена столбцов или уровней индекса, которые нужно присоединить в правом DataFrame. Также может быть массив или список массивов длины правого DataFrame. Эти массивы обрабатываются, как если бы они были столбцами. label или list, или как массив Обязательно
left_index Используйте индекс из левого фрейма данных в качестве ключа (ключей) соединения. Если это MultiIndex, количество ключей в другом DataFrame (индекс или количество столбцов) должно соответствовать количеству уровней. bool
Значение по умолчанию: False
Обязательно
right_index Используйте индекс из правого фрейма данных в качестве ключа соединения. Те же предостережения, что и left_index. bool
Значение по умолчанию: False
Обязательно
sort Сортировка ключей соединения лексикографически в результирующем фрейме данных. Если False, порядок ключей соединения зависит от типа соединения (как ключевое слово). bool
Значение по умолчанию: False
Обязательно
суффиксы Суффикс, применяемый к перекрывающимся именам столбцов слева и справа, соответственно. Чтобы вызвать исключение для перекрывающихся столбцов, используйте (False, False). кортеж из (str, str)
Значение по умолчанию: (‘_x’, ‘_y’)
Обязательно
copy Если False, по возможности избегайте копирования. bool
Значение по умолчанию: True
Обязательно
indicator Если True, добавляет столбец к выходному DataFrame под названием «_merge» с информацией об источнике каждой строки. Если строка, то в выходной DataFrame будет добавлен столбец с информацией об источнике каждой строки, а столбец будет назван значением строки. Информационный столбец имеет категориальный тип и принимает значение «left_only» для наблюдений, ключ слияния которых появляется только в «левом» фрейме данных, «right_only» для наблюдений, ключ слияния которых появляется только в «правом» фрейме данных, и «оба», если ключ слияния наблюдения находится в обоих. bool или str
Значение по умолчанию: False
Обязательно
validate Если указано, проверяет, относится ли слияние к указанному типу.
  • «one_to_one» или «1: 1»: проверьте, если Ключи слияния уникальны как в левом, так и в правом наборах данных.
  • «one_to_many» или «1: m»: проверьте, уникальны ли ключи слияния в левом наборе данных.
  • » many_to_one «или» m: 1 «: проверьте, уникальны ли ключи слияния в правильном наборе данных.
  • » many_to_many «или» m: m «: разрешены, но не приводят к проверкам.
str необязательно

Возвращает: DataFrame
DataFrame из двух объединенных объектов.

Пример:

Загрузить d вышеуказанный блокнот из здесь .

Оцените статью
nanomode.ru
Добавить комментарий