포스팅 목적
데이터분석에서 심심찮게 등장하는 카디널리티가 무엇인지 간단하게 개념 정리.
Cardinality?
사전적 정의
카디널리티 자체의 의미는 쉽지만, 잊어버리기 쉬우므로
cardinal이라는 단어의 뜻부터 알아보자
cardinal number 기수. 우리가 일반적으로 쓰는 1, 2, 3, ... 의 숫자를 의미한다.
반댓말은 서수, ordinal number. 5th, 22nd 등을 뜻한다.
데이터분석에서 cardinality
카디널리티는 데이터집합의 유니크한 원소 개수를 뜻한다.
예를들어, 성별은 원소의 종류가 '남', '여' 두 가지이므로 cardinality가 2이다.
반면에, 주민번호의 경우 모든 원소가 유니크하므로 high-cardinality라 말할 수 있다.
맺음말
간단하쥬?
'PL > Python' 카테고리의 다른 글
피쳐 중요도 feature_importances_ (0) | 2022.10.18 |
---|---|
[seaborn] barplot 기초 (0) | 2022.10.18 |
graphviz 설치 및 기본 사용법 개요 (1) | 2022.10.18 |
[matplotlib] 기본 그래프그리기: plot() 함수 (0) | 2022.10.13 |
[numpy] meshgrid 함수 알아보기 (0) | 2022.10.07 |
댓글