포스팅 목적
간단하게 cumcount의 사용법과 용례를 알아본다
정의
그룹 내 각 아이템들의 갯수를 센다.
0부터 세기 시작한다.
예제코드
데이터셋
df = pd.DataFrame([['a'], ['a'], ['a'], ['b'], ['b'], ['a']], columns=['A'])
print(df)
a가 4개, b가 2개 있는 간단한 데이터프레임이다.
사용법/용례
df_cc = df.groupby('A').cumcount()
print(df_cc)
cumcount는 계산 대상이 되는 칼럼에 groupby로 묶은 후 적용한다.
df_cc라는 이름의 변수를 만들어 칼럼 A에 대해 groupby와 cumcount를 적용했다.
0부터 시작하여 숫자를 센다.
아래와 같이 내림차순을 적용할 수도 있다.
'CS > Python' 카테고리의 다른 글
pandas value_counts() 사용법 (0) | 2022.12.09 |
---|---|
데이터셋 분리: Validation (검증) 데이터셋은 무엇인가? (0) | 2022.12.08 |
[코드 스터디] UCI-HAR 데이터셋2: 중복칼럼 리네이밍 (0) | 2022.11.23 |
데이터프레임의 인덱스 중복과 loc 프로퍼티 (0) | 2022.11.02 |
pandas Dataframe, Series 차이점 정리 (데이터프레임, 시리즈) (0) | 2022.10.31 |
댓글