воскресенье, 23 января 2022 г.

Series в Pandas. Основные методы и атрибуты

Series в Pandas является один из двух основных типов данных. В этом уроке мы рассмотрим основные методы и атрибуты, которые мы можем применять к Series.

Series в Pandas. Основные методы и атрибуты

Для нашего примера давайте создадим Series с марками автомобилей и их максимальной скоростью.

import pandas as pd
cars = pd.Series({'BMW':230, 'Mercedes':250,'Ferarri':350, 'Lamborghini':380,'Bugatti':460},
                index=['BMW','Mercedes','Ferarri','Lamborghini','Bugatti','Lada'])

Series в Pandas. Основные методы и атрибуты

Размер Series

Первым делом давайте узнаем размер нашей Series, т.е. сколько элементов содержится в ней. Для этого можно использовать несколько различных способов:

1. Атрибут size

Возвращает размер Series в виде одного числа.
cars.size

Series в Pandas. Основные методы и атрибуты

2. Метод len()

Этот метод также вернет размер серии, в качестве параметра указываем наименование нашей Series
len(cars)
Series в Pandas. Основные методы и атрибуты

3. Атрибут shape

Возвращает кортеж из двух элементов, в первом будет указана длина Series, второй будет пустой.
cars.shape
Series в Pandas. Основные методы и атрибуты

4. Метод count()

Возвращает количество непустых элементов в серии. В отличии от предыдущих примеров результат будет меньше на единицу, так как в нашей серии для автомобиля Lada мы не указали значение и, следовательно, этот элемент с пустым значением.
cars.count()
Series в Pandas. Основные методы и атрибуты

Копирование Series

Если вам необходимо скопировать Series, то используйте метод copy(). Он создает копию, независимую от дальнейших изменений в серии, откуда вы копировали данные. Это важно, так как при простом приравнивании новой серии к старой (к примеру cars3 = cars), вы создаете ссылку на ту же область в памяти и при изменении в серии cars, изменятся данные и в cars3. Давайте рассмотрим работу copy() на примере: создадим копию cars2, в серии cars для автомобиля Lada укажем скорость и посмотрим на результат:
cars2 = cars.copy()
cars2
cars['Lada'] = 160
cars
cars2
Series в Pandas. Основные методы и атрибуты

Получение и изменение данных в Series

1. Методы at и loc

Методы at и loc позволяют обратиться к элементу Series по ассоциативной метке. К примеру, давайте получим скорость автомобиля Ferrari:
cars.at['Ferarri']
cars.loc['Ferarri']
Series в Pandas. Основные методы и атрибуты
Если нам нужно изменить значение в элементе Series, то мы можем применить эти методы, указав через равно новое значение.
cars.loc['Ferarri'] = 370
Посмотреть результат можно как при помощи описанных выше методов, так и при помощи вот такой записи:
cars['Ferarri']
Series в Pandas. Основные методы и атрибуты

2. Методы iat и iloc

Методы iat и iloc позволяют обратиться к элементу серии по ее номеру, обратите внимание что по умолчанию нумерация в Series начинается с 0. Давайте получим снова скорость Ferrari по ее порядковому номеру в серии, который равен 2:
cars.iat[2]
cars.iloc[2]
Series в Pandas. Основные методы и атрибуты
Что бы изменить значение элемента Series по его порядковому номеру, то используйте эти методы через равно указав новое значение:
cars.iat[2] = 360
Получить обновленное значение можно при помощи методов, описанных выше, так и при помощи такой записи:
cars[2]
Series в Pandas. Основные методы и атрибуты

Минимальное значение в Series

Минимальное значение в серии можно получить при помощи методов agg() либо min(). В качестве параметра для метода agg мы должны передать параметр min, для метода min() параметры не нужны:
cars.agg('min')
cars.min()
Series в Pandas. Основные методы и атрибуты

Максимальное значение в Series

Максимальное значение в серии можно получить при помощи методов agg() либо max(). В качестве параметра для метода agg мы должны передать параметр max, для метода max() параметры не нужны:
cars.agg('max')
cars.max()
Series в Pandas. Основные методы и атрибуты

Среднее значение в Series

Среднее значение в серии можно получить при помощи методов agg() либо mean(). В качестве параметра для метода agg мы должны передать параметр mean, для метода mean() параметры не нужны:
cars.agg('mean')
cars.mean()
Series в Pandas. Основные методы и атрибуты

Сумма значений в Series

Сумму значении в серии можно получить при помощи методов agg() либо sum(). В качестве параметра для метода agg мы должны передать параметр sum, для метода mean() параметры не нужны:
cars.agg('sum')
cars.sum()
Series в Pandas. Основные методы и атрибуты

Кстати, если хотите более подробно изучить Python и получить популярную профессию Data Scientist, то рекомендую вам курс "Data Scientist с нуля до Junior" от Skillbox.

Спасибо за внимание. Мы рассмотрели основные методы и атрибуты Series в Pandas. Прикладываю ноутбук текущего урока для самостоятельного изучения.

Комментариев нет:

Отправить комментарий

Спасибо за комментарий.