판다스 데이터프레임과 다른 유형의 데이터구조 간의 데이터 변환
이번 포스팅에서는 파이썬의 판다스 데이터프레임과 다른 유형의 데이터구조 간의 데이터 변환 방법에 대해서 알아보겠습니다. 판다스를 사용하면 Excel, CSV, 데이터베이스와 같은 다양한 소스에서 데이터를 읽어 데이터프레임을 구성할 수 있습니다. 때로는 데이터가 …
나와 세상의 지혜가 공유되는 그곳
이번 포스팅에서는 파이썬의 판다스 데이터프레임과 다른 유형의 데이터구조 간의 데이터 변환 방법에 대해서 알아보겠습니다. 판다스를 사용하면 Excel, CSV, 데이터베이스와 같은 다양한 소스에서 데이터를 읽어 데이터프레임을 구성할 수 있습니다. 때로는 데이터가 …
이번 포스팅에서는 SHAP Value 에 대해서 알아보겠습니다. “공정한 게임에서는 모든 사람이 승리에 기여한 공로를 인정받아야 한다”는 말을 들어보셨을 겁니다. SHAP Value 는 바로 그 생각에 기반을 두고 있습니다. 게임 이론에서 …
이번 포스팅에서는 내년도 금융당국에서 추진하고 있는 신용카드사의 차량 구매 한도 축소 검토에 대해 알아보겠습니다. 이러한 조치를 왜 검토중이며, 금융시장에 어떠한 영향을 미치는 지에 대해서도 알아보겠습니다. 신용카드사의 차량구매 대금 제공 방법 …
모델 구축 후 성능을 파악하는데 있어 자주 사용하는 모델 성능 지표 에 대해서 알아보겠습니다. 모델 구축의 핵심은 일반화와 강건함을 유지하는 것입니다. 이를 달성하기 위해서는 모델이 충분히 좋은지 또는 성능을 개선하기 …
이번 포스팅에서는 효율적인 데이터 정제 를 위한 10가지 방법에 대해서 알아보겠습니다. 데이터 정제는 데이터 분석의 기본이지만, 정확한 통찰력과 의사 결정의 기초를 마련하기 위해 필요한 단계입니다. 효율적인 데이터 정제의 기본 사항에 …
이번 포스팅에서는 확률분포함수 에 대해서 알아보겠습니다. 확률분포함수 (Probability Distribution Function, PDF)는 발생 가능한 모든 결과값, 표본 공간, 그리고 주어진 범위 내에서 확률 변수가 취할 수 있는 확률값을 설명하는 함수로 최소값과 …
이번 포스팅에서는 판다스에서 데이터프레임을 리스트로 변환 하는 방법에 대해서 알아보겠습니다. 판다스는 데이터 분석을 위한 강력한 파이썬 라이브러리로, 많은 편리한 데이터 구조와 연산을 제공하는데, 데이터프레임을 가장 일반적으로 사용합니다. 데이터프레임은 다양한 유형의 …
이번 포스팅에서는 통계학의 기초 개념인 확률변수 평균 분산 표준편차 에 대해서 알아보겠습니다. 영국의 수학자 칼 피어슨이 말했듯이, 통계는 과학의 문법이며 이는 특히 컴퓨터 및 정보 과학, 물리 과학, 생물 과학에 …
이번 포스팅에서는 머신러닝 변수 선택 방법에 대해서 알아보겠습니다. 변수 선택은 예측 모델을 개발할 때 입력 변수의 수를 줄이는 데 사용되는 기술입니다. 특히 데이터 세트의 차원이 높은 상황일수록 더 중요합니다. 변수의 …