아나콘다-프로그램-다운로드-하기

아나콘다 설치 방법 알아보기

이번 포스팅에서는 아나콘다 설치 방법 에 대해서 알아보겠습니다. 아나콘다(Anaconda)는 파이썬의 한 종류인 배포판(distribution)으로 볼 수 있습니다. 즉, 아나콘다는 파이썬 프로그램 자체를 포함하면서, 데이터 과학에 필요한 다양한 라이브러리와 도구들을 묶어서 제공합니다. …

데이터프레임

판다스(Pandas) 데이터프레임(DataFrame) 이해하기

파이썬을 활용하여 금융 데이터를 분석하려면, 판다스(Pandas) 라이브러리와 데이터프레임(DataFrame)은 기본적으로 알고 있어야 합니다. 판다스는 데이터 분석을 위해 가장 많이 사용하는 대표적인 데이터 분석을 위한 라이브러리입니다. 데이터프레임은 2차원(행,열)으로 이루어진 이질적인 데이터 형식을 …

read_csv

Pandas read_csv() 함수 이해하기

Pandas 패키지의 read_csv() 함수는 데이터 분석을 하기 위해 CSV(Comma-Separated Values) 파일을 데이터프레임으로 변환하는 함수입니다. 또한 파일을 청크(Chunk)로 반복하거나 분할하는 것도 지원합니다. 이번 포스팅에서는 read_csv() 함수의 사용법과 인수(parameter)에 대해서 알아 보겠습니다. …

Pandas를 활용한 데이터 분석 실습2

Pandas실습 – Part2

Pandas는 데이터 분석 시 매우 자주 사용하는 라이브러리 중 하나로 Pandas실습 형태로 2차에 걸쳐 포스팅을 작성하였습니다. 이번 포스팅을 보시기 전에 이전 학습이 선행되어야 합니다. Pandas실습1 을 학습하지 않으셨다면, 아래 링크를 …

Pandas를 활용한 데이터 분석 실습1

Pandas실습 – Part1

Pandas는 데이터 분석 시 매우 자주 사용하는 라이브러리 중 하나로 Pandas실습 형태로 포스팅을 작성하였습니다. Pandas는 의심할 여지 없이 테이블 형식의 데이터 처리, 조작 및 처리를 위해 매우 유용한 도구입니다. 이번 …

결측치 처리 이유와 방법

결측치 처리를 해야 하는 이유와 처리 방법

결측치(Missing Data)는 모든 실제 데이터에서 거의 불가피하게 존재하며 일반적인 데이터 수집 과정에서 피할 수 없습니다. 이는 데이터 입력 중 오류, 데이터 수집 프로세스의 기술적 문제, 손실/손상된 파일 및 기타 다양한 …

데이터 분석을 위한 pandas groupby 활용

데이터 분석을 위한 Pandas GroupBy 사용 방법

데이터 분석을 위한 GroupBy 메서드는 Pandas 라이브러리의 매우 강력한 도구로 거의 모든 분석에서 필수적으로 사용됩니다. 특정 기준에 따라 대규모 데이터 세트를 더 작은 그룹으로 분할 및 요약할 수 있습니다. 이러한 …

Python Skill 활용 생산성 및 코드품질향상

코드품질향상을 위한 Python Skill 활용

어떤 일을 더 빠르고 효율적으로 또는 단순히 더 우아하게 끝내기 위한 빠른 스킬을 좋아하지 않는 사람이 어디 있겠습니까? 이번 포스팅에서는 생산성과 코드품질향상을 위한 Python Skill 5가지에 대해서 알아 보겠습니다. 모든 열의 이름 …

Pandaralllel 라이브러리 소개

Pandarallel 라이브러리 소개

Pandaralllel 라이브러리는 Pandas가 가지는 데이터 처리 방식의 한계를 일정 부분 해결해 주는 라이브러리입니다. 매우 직관적이고 우아하며 초보자에게 친숙한 API를 갖춘 Pandas 라이브러리는 Python에서 최고의 테이블 형식 데이터 랭글링 라이브러리 중 …

IceCream 라이브러리 소개

IceCream 라이브러리 소개

프로그래밍하는 동안 오류는 거의 불가피합니다. 사실, 프로그래머는 오류 없는 코드를 만들기 위해 디버깅에 상당한 시간을 소비합니다.디버깅하는 동안 print() 문을 사용하여 파이프라인의 흐름을 이해하고 예기치 않은 동작을 발견하는 방법은 가장 널리 …