데이터 수집
이번 포스팅에서는 데이터 분석 프로세스의 두 번째 단계인 데이터 수집 에 대해서 알아 보겠습니다. 데이터 수집에 가장 많이 활용되는 플랫폼은 Kaggle 입니다. Kaggle은 데이터 과학 및 기계 학습 경연 및 …
나와 세상의 지혜가 공유되는 그곳
Blog Contents는 블러그의 모든 컨텐츠를 나타냅니다. 총 10개의 주제로 이루어져 있습니다.
이번 포스팅에서는 데이터 분석 프로세스의 두 번째 단계인 데이터 수집 에 대해서 알아 보겠습니다. 데이터 수집에 가장 많이 활용되는 플랫폼은 Kaggle 입니다. Kaggle은 데이터 과학 및 기계 학습 경연 및 …
이번 포스팅에서는 데이터 분석 프로세스의 첫 번째 단계인 데이터분석 을 위한 목표 정의 에 대해서 알아 보겠습니다. 통계학에서 매우 유명한 Iris Flower(붓꽃) 데이터세트를 활용하여 단계별로 접근하겠습니다. 프로젝트 목표 식별 첫 …
이번 포스팅에서는 데이터 분석 프로세스 와 관련된 일반적인 단계를 처음부터 끝까지 개괄적으로 안내합니다. 그런 다음 후속 포스팅에서는 각 단계를 차례로 수행하고 데이터 세트에서 이를 수행합니다. 실제 프로세스를 확인하고, 자신의 프로젝트에 …
이번 포스팅에서는 데이터 시각화 라이브러리 Matplotlib 테마 를 꾸미는 방법에 대해서 알아 보겠습니다. 데이터 과학자라면, 많은 데이터를 보유하고, 분석 하더라도 결과에 대한 최종 판단 및 정리는 시각화를 기반으로 한다는 것을 …
이번 포스팅에서는 한국은행에서 제공하는 기준금리 변동 추이 에 대해서 알아 보겠습니다. 한국은행에서 발표하는 기준금리는 한국의 통화정책을 조절하는 주요 지표 중 하나입니다. 이 기준금리는 한국경제의 안정과 물가안정을 유지하기 위해 조절되며, 주로 …
24년 2월부터 정부와 금융권에서는 높은 대출금리로 생활에 어려움을 겪는 소상공인 자영업자들을 위한 2가지 정책을 추진합니다. 이자부담을 완화하기 위해 대출 이자의 일부를 현금으로 돌려주는 정책(이자 환급)과 저금리로 대출을 옮길 수 있는 …
데이터 사이언티스트 이거나 머신 러닝을 학습하고자 하는 사람들이라면 EDA 가 탐색적 데이터 분석(Exploratory Data Analysis)을 의미한다는 것을 알고 있을 것입니다. 이번 포스팅에서는 EDA가 단순한 준비 단계가 아니라 머신러닝 프로젝트의 성패를 …
이번 포스팅은 마케팅 분석 시리즈의 첫 번째 포스팅입니다(Python을 활용한 마케팅 분석 시리즈 전체에 대한 개요를 확인하려면 여기를 클릭하시면 됩니다). Python을 사용하여 데이터 분석을 수행하는 방법을 배울 때 배우고자 하는 이가 …
이번 포스팅은 데이터 과학자에게 인기 있고 역동적인 선택인 Python을 사용한 마케팅 분석 기초에 대해 설명하기 위한 소개입니다. 총 9개의 포스팅으로 구성하였고, 각 포스팅 내용에 대한 간략한 설명은 아래에 나와 있습니다. …
이번 포스팅에서는 Python Pandas를 활용한 데이터 전처리에 대해서 알아 보겠습니다. 전처리 과정과, 임의의 데이터 세트에 Pandas 라이브러리를 어떻게 적용하는 지 간단한 코드를 통해 확인해 보겠습니다. 데이터 전처리가 필요한 이유 데이터 …