Series в Pandas является один из двух основных типов данных. В этом уроке мы рассмотрим основные методы и атрибуты, которые мы можем применять к Series.
Для нашего примера давайте создадим Series с марками автомобилей и их максимальной скоростью.
import pandas as pd
cars = pd.Series({'BMW':230, 'Mercedes':250,'Ferarri':350, 'Lamborghini':380,'Bugatti':460},
index=['BMW','Mercedes','Ferarri','Lamborghini','Bugatti','Lada'])
Размер Series
Первым делом давайте узнаем размер нашей Series, т.е. сколько элементов содержится в ней. Для этого можно использовать несколько различных способов:1. Атрибут size
Возвращает размер Series в виде одного числа.cars.size
2. Метод len()
Этот метод также вернет размер серии, в качестве параметра указываем наименование нашей Serieslen(cars)
3. Атрибут shape
Возвращает кортеж из двух элементов, в первом будет указана длина Series, второй будет пустой.cars.shape
4. Метод count()
Возвращает количество непустых элементов в серии. В отличии от предыдущих примеров результат будет меньше на единицу, так как в нашей серии для автомобиля Lada мы не указали значение и, следовательно, этот элемент с пустым значением.cars.count()
Копирование Series
Если вам необходимо скопировать Series, то используйте метод copy(). Он создает копию, независимую от дальнейших изменений в серии, откуда вы копировали данные. Это важно, так как при простом приравнивании новой серии к старой (к примеру cars3 = cars), вы создаете ссылку на ту же область в памяти и при изменении в серии cars, изменятся данные и в cars3. Давайте рассмотрим работу copy() на примере: создадим копию cars2, в серии cars для автомобиля Lada укажем скорость и посмотрим на результат:cars2 = cars.copy()
cars2
cars['Lada'] = 160
cars
cars2
Получение и изменение данных в Series
1. Методы at и loc
Методы at и loc позволяют обратиться к элементу Series по ассоциативной метке. К примеру, давайте получим скорость автомобиля Ferrari:cars.at['Ferarri']Если нам нужно изменить значение в элементе Series, то мы можем применить эти методы, указав через равно новое значение.
cars.loc['Ferarri']
cars.loc['Ferarri'] = 370Посмотреть результат можно как при помощи описанных выше методов, так и при помощи вот такой записи:
cars['Ferarri']
2. Методы iat и iloc
Методы iat и iloc позволяют обратиться к элементу серии по ее номеру, обратите внимание что по умолчанию нумерация в Series начинается с 0. Давайте получим снова скорость Ferrari по ее порядковому номеру в серии, который равен 2:cars.iat[2]Что бы изменить значение элемента Series по его порядковому номеру, то используйте эти методы через равно указав новое значение:
cars.iloc[2]
cars.iat[2] = 360Получить обновленное значение можно при помощи методов, описанных выше, так и при помощи такой записи:
cars[2]
Минимальное значение в Series
Минимальное значение в серии можно получить при помощи методов agg() либо min(). В качестве параметра для метода agg мы должны передать параметр min, для метода min() параметры не нужны:cars.agg('min')
cars.min()
Максимальное значение в Series
Максимальное значение в серии можно получить при помощи методов agg() либо max(). В качестве параметра для метода agg мы должны передать параметр max, для метода max() параметры не нужны:cars.agg('max')
cars.max()
Среднее значение в Series
Среднее значение в серии можно получить при помощи методов agg() либо mean(). В качестве параметра для метода agg мы должны передать параметр mean, для метода mean() параметры не нужны:cars.agg('mean')
cars.mean()
Сумма значений в Series
Сумму значении в серии можно получить при помощи методов agg() либо sum(). В качестве параметра для метода agg мы должны передать параметр sum, для метода mean() параметры не нужны:cars.agg('sum')
cars.sum()
Кстати, если хотите более подробно изучить Python и получить популярную профессию Data Scientist, то рекомендую вам курс "Data Scientist с нуля до Junior" от Skillbox.
Спасибо за внимание. Мы рассмотрели основные методы и атрибуты Series в Pandas. Прикладываю ноутбук текущего урока для самостоятельного изучения.
Комментариев нет:
Отправить комментарий
Спасибо за комментарий.