.nunique() / .value_counts()

DataFrame.nunique(axis=0dropna=True)

Count distinct observations over requested axis.

>>> df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 1, 1]})
>>> df.nunique()
A    3
B    1

各index(A,B)中,有多少個不同的值

>>> df.nunique(axis=1)
0    1
1    2
2    2

[1, 2, 3]
[1, 1, 1]
各column中
column[0]有1個不同的值
column[1]、[2]有2個不同的值


 

Series.value_counts(normalize=False, sort=Trueascending=Falsebins=Nonedropna=True)

Return a Series containing counts of unique values.

>>> s = pd.Series([3, 1, 2, 3, 4, np.nan])
>>> s.value_counts()
3    2
4    1
2    1
1    1

預設為由大到小排列
因此若只想要取前N名
可以使用.head(N)

pandas.DataFrame.nunique

pandas.Series.value_counts

 

 

 

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s