Pandas: как подсчитать вхождения определенного значения в столбце
Вы можете использовать следующий синтаксис для подсчета вхождений определенного значения в столбце кадра данных pandas:
df['column_name']. value_counts ()[ value ]
Обратите внимание, что значение может быть как числом, так и символом.
В следующих примерах показано, как использовать этот синтаксис на практике.
Пример 1. Подсчет вхождений строки в столбце
В следующем коде показано, как подсчитать количество вхождений определенной строки в столбце кадра данных pandas:
import pandas as pd #create DataFrame df = pd.DataFrame() #count occurrences of the value 'B' in the 'team' column df['team']. value_counts ()['B'] 4
Из вывода мы видим, что строка «B» встречается 4 раза в столбце «команда».
Обратите внимание, что мы также можем использовать следующий синтаксис, чтобы узнать, как часто каждое уникальное значение встречается в столбце «команда»:
#count occurrences of every unique value in the 'team' column df['team']. value_counts () B 4 A 2 C 2 Name: team, dtype: int64
Пример 2. Подсчет вхождений числового значения в столбце
В следующем коде показано, как подсчитать количество вхождений числового значения в столбце кадра данных pandas:
import pandas as pd #create DataFrame df = pd.DataFrame() #count occurrences of the value 9 in the 'assists' column df['assists']. value_counts ()[ 9 ] 3
Из вывода мы видим, что значение 9 встречается 3 раза в столбце «ассисты».
Мы также можем использовать следующий синтаксис, чтобы узнать, как часто каждое уникальное значение встречается в столбце «помощь»:
#count occurrences of every unique value in the 'assists' column df['assists']. value_counts () 9 3 7 2 5 1 12 1 4 1 Name: assists, dtype: int64
Из вывода мы видим:
- Значение 9 встречается 3 раза.
- Значение 7 встречается 2 раза.
- Значение 5 встречается 1 раз.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Как подсчитать уникальные значения в Pandas (с примерами)
Вы можете использовать функцию nunique() для подсчета количества уникальных значений в кадре данных pandas.
Эта функция использует следующий базовый синтаксис:
#count unique values in each column df.nunique () #count unique values in each row df.nunique (axis= 1 )
В следующих примерах показано, как использовать эту функцию на практике со следующими пандами DataFrame:
import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame df team points assists rebounds 0 A 8 5 11 1 A 8 8 8 2 A 13 7 11 3 A 13 9 6 4 B 22 12 6 5 B 22 9 5 6 B 25 9 9 7 B 29 4 12
Пример 1. Подсчет уникальных значений в каждом столбце
Следующий код показывает, как подсчитать количество уникальных значений в каждом столбце DataFrame:
#count unique values in each column df.nunique () team 2 points 5 assists 5 rebounds 6 dtype: int64
Из вывода мы видим:
- Столбец «команда» имеет 2 уникальных значения.
- Столбец «баллы» имеет 5 уникальных значений.
- Столбец «Помощь» имеет 5 уникальных значений.
- Столбец «Подборы» имеет 6 уникальных значений.
Пример 2. Подсчет уникальных значений в каждой строке
В следующем коде показано, как подсчитать количество уникальных значений в каждой строке DataFrame:
#count unique values in each row df.nunique (axis= 1 ) 0 4 1 2 2 4 3 4 4 4 5 4 6 3 7 4 dtype: int64
Из вывода мы видим:
- Первая строка имеет 4 уникальных значения
- Вторая строка имеет 2 уникальных значения
- Третья строка имеет 4 уникальных значения
Пример 3. Подсчет уникальных значений по группам
В следующем коде показано, как подсчитать количество уникальных значений по группам в DataFrame:
#count unique 'points' values, grouped by team df.groupby('team')['points']. nunique () team A 2 B 3 Name: points, dtype: int64
Из вывода мы видим:
- Команда «А» имеет 2 уникальных значения «очков».
- Команда «Б» имеет 3 уникальных значения «очков».
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Pandas: как подсчитать значения в столбце с условием
Вы можете использовать следующие методы для подсчета количества значений в столбце pandas DataFrame с определенным условием:
Метод 1: подсчет значений в одном столбце с условием
len(df[df['col1']=='value1'])
Способ 2: подсчет значений в нескольких столбцах с условиями
len(df[(df['col1']=='value1') &(df['col2']=='value2')])
В следующих примерах показано, как использовать каждый метод на практике со следующими пандами DataFrame:
import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame print(df) team pos points 0 A Gu 18 1 A Fo 22 2 A Fo 19 3 A Fo 14 4 B Gu 14 5 B Gu 11 6 B Fo 20 7 B Fo 28
Пример 1. Подсчет значений в одном столбце с условием
В следующем коде показано, как подсчитать количество значений в столбце команды , где значение равно ‘A’:
#count number of values in team column where value is equal to 'A' len(df[df['team']=='A']) 4
Мы видим, что в столбце команды есть 4 значения, где значение равно «А».
Пример 2. Подсчет значений в нескольких столбцах с условиями
В следующем коде показано, как подсчитать количество строк в DataFrame, где столбец team равен «B», а столбец pos равен «Gu»:
#count rows where team is 'B' and pos is 'Gu' len(df[(df['team']=='B') &(df['pos']=='Gu')]) 2
Мы видим, что в DataFrame есть 2 строки, которые удовлетворяют обоим этим условиям.
Мы можем использовать аналогичный синтаксис для подсчета количества строк, удовлетворяющих любому количеству условий, которые нам нужны.
Например, следующий код показывает, как подсчитать количество строк, удовлетворяющих трем условиям:
#count rows where team is 'B' and pos is 'Gu' and points > 15 len(df[(df['team']=='B') &(df['pos']=='Gu') &(df['points']> 12 )]) 1
Мы видим, что только 1 строка в DataFrame соответствует всем трем этим условиям.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как посчитать количество значений в столбце в pandas
Как посчитать количество значений в столбце в pandas
Добро пожаловать в эту подробную статью о том, как посчитать количество значений в столбце с использованием библиотеки pandas. В этом объяснении я расскажу вам о двух основных методах, которые помогут вам выполнить это задание.
Метод value_counts()
В pandas есть метод value_counts(), который позволяет подсчитать количество уникальных значений в столбце. Он возвращает объект Series, в котором каждому уникальному значению соответствует количество его появлений в столбце. Вот пример, как использовать этот метод:
import pandas as pd # Создаем DataFrame с данными data = df = pd.DataFrame(data) # Используем метод value_counts() для подсчета количество значений в столбце 'Страна' counts = df['Страна'].value_counts() # Выводим результат print(counts)
Россия 3 Китай 2 Германия 1 США 1 Name: Страна, dtype: int64
Как видно из результата, метод value_counts() подсчитал количество уникальных значений в столбце ‘Страна’.
Метод len()
Второй метод, который может быть использован для подсчета количества значений в столбце, — это использование функции len() в сочетании с методом unique(). Метод unique() возвращает массив уникальных значений в столбце, а функция len() подсчитывает количество элементов в массиве. Вот пример, как использовать этот метод:
import pandas as pd # Создаем DataFrame с данными data = df = pd.DataFrame(data) # Используем метод unique() для получения уникальных значений в столбце 'Цвет', и функцию len() для подсчета их количества count = len(df['Цвет'].unique()) # Выводим результат print(count)
Как видно из результата, функция len() подсчитала количество уникальных значений в столбце ‘Цвет’.
Заключение
В этой статье мы рассмотрели два основных метода, которые помогут вам посчитать количество значений в столбце с использованием библиотеки pandas. Метод value_counts() нужно использовать, когда вас интересует количество каждого уникального значения, а функция len() в сочетании с методом unique() поможет вам получить количество уникальных значений в столбце. Удачи в изучении pandas и успешного программирования!