7가지 범주형 데이터 인코딩 기술
범주형 변수를 인코딩하는 방법은 One-hot encoding, Dummy encoding, Effect encoding, Label encoding, Ordinal encoding, Count encoding, Binary encoding 등 크게 7가지가 있습니다. 보다 자세한 설명은 범주형 데이터 인코딩하기 포스팅 글을 …
나와 세상의 지혜가 공유되는 그곳
범주형 변수를 인코딩하는 방법은 One-hot encoding, Dummy encoding, Effect encoding, Label encoding, Ordinal encoding, Count encoding, Binary encoding 등 크게 7가지가 있습니다. 보다 자세한 설명은 범주형 데이터 인코딩하기 포스팅 글을 …
이번 포스팅에서는 SHAP Value 에 대해서 알아보겠습니다. “공정한 게임에서는 모든 사람이 승리에 기여한 공로를 인정받아야 한다”는 말을 들어보셨을 겁니다. SHAP Value 는 바로 그 생각에 기반을 두고 있습니다. 게임 이론에서 …
이번 포스팅에서는 범주형 데이터 인코딩 방법에 대해 알아보겠습니다. 우선, 범주형 데이터에 대해 간단히 설명하고, 인코딩이 필요한 이유에 대해 예제 데이터와 함께 설명하겠습니다. 범주형 데이터 정의 및 범주형 데이터에 인코딩이 필요한 …
이번 포스팅에서는 합성 데이터가 필요한 이유에 대해서 알아보겠습니다. 머신러닝 모델을 훈련하려면 데이터가 필요합니다. 데이터 과학 작업은 일반적으로 미리 라벨이 붙은 잘 정제된 데이터 세트가 있는 Kaggle 대회가 아닙니다. 때로는 자신의 …
신용카드 거래에서 사기를 탐지하는 것은 머신러닝의 중요한 응용 분야 중 하나 입니다. 이번 포스팅에서는 Kaggle의 신용카드 사기 거래 탐지 데이터 세트를 활용하여 신용카드 사기 거래 탐지 예측 모델 개발에 접근하는 …