PL/Python

데이터분석: 카디널리티 (Cardinality)

PIYA 2022. 10. 18.

포스팅 목적

데이터분석에서 심심찮게 등장하는 카디널리티가 무엇인지 간단하게 개념 정리.

 

본문에서 설명하는 카디널리티와 무관

 

Cardinality?

사전적 정의

카디널리티 자체의 의미는 쉽지만, 잊어버리기 쉬우므로

cardinal이라는 단어의 뜻부터 알아보자

cardinal number 기수. 우리가 일반적으로 쓰는 1, 2, 3, ... 의 숫자를 의미한다.

반댓말은 서수, ordinal number. 5th, 22nd 등을 뜻한다.

 

데이터분석에서 cardinality

카디널리티는 데이터집합의 유니크한 원소 개수를 뜻한다.

예를들어, 성별은 원소의 종류가 '남', '여' 두 가지이므로 cardinality가 2이다.

반면에, 주민번호의 경우 모든 원소가 유니크하므로 high-cardinality라 말할 수 있다.

 

맺음말

간단하쥬?

 

 

댓글