DataFrame — функция merge ()
Функция merge () используется для слияния DataFrame или именованных объектов Series с объединением в стиле базы данных.
Соединение выполняется по столбцам или индексам. При объединении столбцов в столбцы индексы DataFrame игнорируются. В противном случае при объединении индексов по индексам или индексам по столбцу или столбцам индекс будет передан.
Синтаксис:
DataFrame.merge (self, right, how = 'inner', on = None, left_on = None, right_on = None, left_index = False, right_index = False, sort = False, суффиксы = ('_ x', '_y'), copy = True, indicator = False, validate = None
Параметры:
Имя | Описание | Тип/значение по умолчанию | Обязательное/необязательное |
---|---|---|---|
right | Объект для слияния. | DataFrame или именованная серия | Обязательно |
как | Тип выполняемого слияния.
|
{‘left’, ‘right’, ‘external’, ‘inner’} Значение по умолчанию: ‘inner’ |
Обязательно |
на | Имена столбцов или уровней индекса для присоединения. Они должны быть найдены в обоих DataFrames. Если on равно None и не выполняется слияние по индексам, то по умолчанию используется пересечение столбцов в обоих DataFrames. | label или list | Обязательно |
left_on | Имена столбцов или уровней индекса, которые нужно присоединить в левом фрейме данных. Также может быть массивом или списком массивов длины левого DataFrame. Эти массивы обрабатываются, как если бы они были столбцами. | label или list, или как массив | Обязательно |
right_on | Имена столбцов или уровней индекса, которые нужно присоединить в правом DataFrame. Также может быть массив или список массивов длины правого DataFrame. Эти массивы обрабатываются, как если бы они были столбцами. | label или list, или как массив | Обязательно |
left_index | Используйте индекс из левого фрейма данных в качестве ключа (ключей) соединения. Если это MultiIndex, количество ключей в другом DataFrame (индекс или количество столбцов) должно соответствовать количеству уровней. | bool Значение по умолчанию: False |
Обязательно |
right_index | Используйте индекс из правого фрейма данных в качестве ключа соединения. Те же предостережения, что и left_index. | bool Значение по умолчанию: False |
Обязательно |
sort | Сортировка ключей соединения лексикографически в результирующем фрейме данных. Если False, порядок ключей соединения зависит от типа соединения (как ключевое слово). | bool Значение по умолчанию: False |
Обязательно |
суффиксы | Суффикс, применяемый к перекрывающимся именам столбцов слева и справа, соответственно. Чтобы вызвать исключение для перекрывающихся столбцов, используйте (False, False). | кортеж из (str, str) Значение по умолчанию: (‘_x’, ‘_y’) |
Обязательно |
copy | Если False, по возможности избегайте копирования. | bool Значение по умолчанию: True |
Обязательно |
indicator | Если True, добавляет столбец к выходному DataFrame под названием «_merge» с информацией об источнике каждой строки. Если строка, то в выходной DataFrame будет добавлен столбец с информацией об источнике каждой строки, а столбец будет назван значением строки. Информационный столбец имеет категориальный тип и принимает значение «left_only» для наблюдений, ключ слияния которых появляется только в «левом» фрейме данных, «right_only» для наблюдений, ключ слияния которых появляется только в «правом» фрейме данных, и «оба», если ключ слияния наблюдения находится в обоих. | bool или str Значение по умолчанию: False |
Обязательно |
validate | Если указано, проверяет, относится ли слияние к указанному типу.
|
str | необязательно |
Возвращает: DataFrame
DataFrame из двух объединенных объектов.
Пример:
Загрузить d вышеуказанный блокнот из здесь .