ML에서 EDA를 사용하는 8가지 중요한 이유
데이터 사이언티스트 이거나 머신 러닝을 학습하고자 하는 사람들이라면 EDA 가 탐색적 데이터 분석(Exploratory Data Analysis)을 의미한다는 것을 알고 있을 것입니다. 이번 포스팅에서는 EDA가 단순한 준비 단계가 아니라 머신러닝 프로젝트의 성패를 …
나와 세상의 지혜가 공유되는 그곳
데이터 사이언티스트 이거나 머신 러닝을 학습하고자 하는 사람들이라면 EDA 가 탐색적 데이터 분석(Exploratory Data Analysis)을 의미한다는 것을 알고 있을 것입니다. 이번 포스팅에서는 EDA가 단순한 준비 단계가 아니라 머신러닝 프로젝트의 성패를 …
이번 포스팅은 마케팅 분석 시리즈의 첫 번째 포스팅입니다(Python을 활용한 마케팅 분석 시리즈 전체에 대한 개요를 확인하려면 여기를 클릭하시면 됩니다). Python을 사용하여 데이터 분석을 수행하는 방법을 배울 때 배우고자 하는 이가 …
이번 포스팅은 데이터 과학자에게 인기 있고 역동적인 선택인 Python을 사용한 마케팅 분석 기초에 대해 설명하기 위한 소개입니다. 총 9개의 포스팅으로 구성하였고, 각 포스팅 내용에 대한 간략한 설명은 아래에 나와 있습니다. …
이번 포스팅에서는 Python Pandas를 활용한 데이터 전처리에 대해서 알아 보겠습니다. 전처리 과정과, 임의의 데이터 세트에 Pandas 라이브러리를 어떻게 적용하는 지 간단한 코드를 통해 확인해 보겠습니다. 데이터 전처리가 필요한 이유 데이터 …
신용카드 거래에서 사기를 탐지하는 것은 머신러닝의 중요한 응용 분야 중 하나 입니다. 이번 포스팅에서는 Kaggle의 신용카드 사기 거래 탐지 데이터 세트를 활용하여 신용카드 사기 거래 탐지 예측 모델 개발에 접근하는 …
이번 포스팅에서는 데이터 시각화를 활용한 탐색적 자료 분석 방법에 대해서 알아 보겠습니다. 뉴욕시 Airbnb 데이터를 활용한 탐색적 자료 분석의 세번째 포스팅입니다. 포스팅 글을 읽기 전에 뉴욕시 Airbnb 데이터를 활용한 탐색적 …
이번 포스팅에서는 데이터 시각화를 활용한 탐색적 자료 분석 방법에 대해서 알아 보겠습니다. 뉴욕시 Airbnb 데이터를 활용한 탐색적 자료 분석의 두번째 포스팅입니다. 포스팅 글을 읽기 전에 zzinnam.com/뉴욕시-airbnb-데이터를-활용한-탐색적-자료-분석-1-with-python/ 을 먼저 학습하여 파이썬 …
이번 포스팅에서는 Python Pandas 라이브러리에서 제공하는 pivot_table (피봇 테이블) 에 대해서 알아 보겠습니다. pivot_table은 엑셀의 피봇 기능과 매우 유사한 결과물을 제공해 주는 함수입니다. 기본적인 구문에 대한 이해와 사용 예시를 살펴 …
이번 포스팅에서는 Python 연산자 에 대해서 알아 보겠습니다. Python의 연산자는 하나 이상의 피연산자에 대해 특정 연산을 수행하는 데 사용되는 특수 기호입니다. 피연산자는 변수, 값 또는 표현식일 수 있습니다. Python의 여러 …
이번 포스팅에서는 select_dtype 함수에 대해서 알아 보겠습니다. select_dtype 는 데이터프레임 열의 데이터 유형을 기반으로 데이터프레임의 하위집합을 생성하는 함수입니다. 데이터 분석 시 매우 유용한 함수로 알아두면 매우 효율적인 데이터 분석이 가능할 …