Pandas DataFrame: полное подробное руководство

Pandas DataFrame — одна из этих структур, которая помогает нам очень легко выполнять математические вычисления. Фрейм данных — это двухмерная структура данных, например, данные выровнены в табличной форме по строкам и столбцам.

Библиотека Pandas — это популярный пакет Python для науки о данных и машинного обучения, и не без оснований: он предлагает доминирующие, выразительные и гибкие структуры данных, которые, среди многих других, упрощают манипулирование и анализ данных вещи.

Пример Pandas DataFrame

DataFrame — это двумерная изменяемая по размеру, потенциально составная структура табличных данных с помеченными осями (строки и столбцы).

Во-первых, DataFrame может содержать данные следующего типа.

  1. Серия Pandas: одномерный помеченный массив, способный хранить любой тип данных с метками оси или индексом. Примером объекта Series является один столбец из DataFrame.
  2. NumPy ndarray , который может быть записью или структурой.
  3. Двумерный ndarray с использованием NumPy
  4. Словари одно- размерные массивы, списки, словари или серии.

Как создать фрейм данных Pandas

Фрейм данных Pandas может можно создать с помощью следующего конструктора.

 pandas.DataFrame (data, index, columns, dtype, copy) 

data параметр принимает такие формы, как ndarray, series, map, lists, dict, constants, а также другой DataFrame.

Для строки метки, параметр index , который будет использоваться для результирующего кадра, является необязательным по умолчанию np.arrange (n), если в функцию не передается индекс.

Для столбцы , необязательный синтаксис по умолчанию: np.arrange (n). Это верно только в том случае, если индекс не передан.

dtype — это тип данных каждого столбца.

Параметр copy предназначен для копирования данных, если по умолчанию установлено значение False.

Создание пустого фрейма данных в Python

Пустой фрейм данных — это базовый фрейм данных

Рассмотрим следующий пример.

 # app.pyimport pandas как pddf1 = pd.DataFrame () print (df1) 

См. вывод ниже.

Давайте создадим DataFrame из NumPy ndarrays .

 # app.pyimport pandas as pdimport numpy as npdata = np.array ([18, 19, 21]) df1 = pd.DataFrame (data, index = [1, 2, 3]  ) print (df1) 

В приведенном выше примере мы создали данные из numpy ndarray и затем передали их в функцию Dataframe для создания DataFrame.

См. вывод.

Давайте добавим столбцы для построения полной таблицы в DataFrame. См. Пример ниже.

 # app.pyimport pandas as pdimport numpy as npdata = np.array ([['Игра престолов', 'HBO'], ['Очень странные дела', 'Netflix'], ['  Casual ',' Hulu ']]) df1 = pd.DataFrame (data, index = [1, 2, 3], columns = [' Show Name ',' Streaming Service ']) print (df1) 

Хорошо, поэтому мы добавили два столбца: Show Name и Streaming Service.

См. результат.

Создать DataFrame из словаря

Давайте создадим DataFrame, используя словарь.

 # app.pyimport pandas  as pdimport numpy as npdata = {'Показать имя': ['GameOfThrones', 'StrangerThings', 'Casual'], 'Streaming Service': ['HBO', 'Netflix', 'Hulu']} df1 = pd.DataFrame  (data) print (df1) 

См. вывод ниже.

Создание фрейма данных из серии

Давайте создадим фрейм данных из серии.

 #  app.pyimport pandas as pdimport numpy as npdata = {'name': 'krunal', 'website': 'appdividend.com', 'role': 'author'} series = pd.Series (data) df1 = pd.DataFrame  (series) print (df1) 

См. вывод ниже.

Добавление столбца в фрейм данных

Давайте рассмотрим пример, в котором мы можем добавить столбец t o фрейм данных.

 # app.pyimport pandas as pdimport numpy as npdata = {'age': [18, 19, 21], 'name': ['krunal', 'ankit',  'tejash']} df1 = pd.DataFrame (data, index = [1, 2, 3]) print ('Перед добавлением столбца') print (df1) df1 ['education'] = ['BE', 'MCA'  , 'MBA'] print ('После добавления столбца') print (df1) 

В приведенном выше примере мы добавили еще один столбец под названием education .

См. вывод ниже.

Удаление столбца из фрейма данных

См. следующий пример, в котором мы удалили один столбец из фрейма данных.

  # app.pyimport pandas as pdimport numpy as npdata = {'age': [18, 19, 21], 'name': ['krunal', 'ankit', 'tejash'], 'education': ['BE'  , 'MCA', 'MBA']} df1 = pd.DataFrame (data, index = [1, 2, 3]) print ('После удаления столбца') del df1 ['education'] print (df1) 

В приведенном выше примере мы удалили столбец education с помощью функции del .

См. вывод ниже.

Добавление строки в фрейм данных

Мы можем добавлять новые строки в фрейм данных с помощью функции append .

Функция append () добавит строки в конец. Давайте посмотрим на следующий пример.

 # app.pyimport pandas as pdimport numpy as npdata = {'age': [18, 19, 21], 'name': ['krunal', 'ankit  ',' tejash '],' education ': [' BE ',' MCA ',' MBA ']} df1 = pd.DataFrame (data, index = [1, 2, 3]) print (' Перед добавлением строки '  ) print (df1) data2 = {'age': 22, 'name': 'rushabh', 'education': 'CA'} df2 = pd.DataFrame (data2, index = [4]) print ('После добавления строки  ') dfAdd = df1.append (df2) print (dfAdd) 

В приведенном выше примере мы определили df1 DataFrame , а затем определили df2 DataFrame .

Наша цель — добавить строку в первый DataFrame.

Для добавленного контекста каждый фрейм данных здесь работает как строка. Таким образом, мы можем добавить DataFrame в другой DataFrame, который считается одной дополнительной строкой к другой строке.

Итак, чтобы добавить строку, нам нужно добавить DataFrame в другой DataFrame.

Полученный DataFrame является добавлением обоих DataFrames. В приведенном выше примере dfAdd — это последний DataFrame, который является добавлением обоих предыдущих DataFrame.

См. вывод ниже.

Удаление строки в фрейме данных

Мы можем удалить строку, используя метку индекса, чтобы удалить или отбросить строки из фрейма данных. Если метка дублируется, то несколько строк будут отброшены.

Давайте посмотрим, как мы удаляем строку с помощью индекса.

 # app.pyimport pandas as  pdimport numpy as npdata = {'age': [18, 19, 21], 'name': ['krunal', 'ankit', 'tejash'], 'education': ['BE', 'MCA', '  MBA ']} df1 = pd.DataFrame (data, index = [1, 2, 3]) print (' До удаления строки ') print (df1) print (' После удаления строки ') df2 = df1.drop (2)  print (df2) 

В приведенном выше примере мы удаляем строку с индексом 2.

См. результат ниже.

Наконец, пример фрейма данных Pandas завершен.

Оцените статью
nanomode.ru
Добавить комментарий