아나콘다 설치 방법 알아보기
이번 포스팅에서는 아나콘다 설치 방법 에 대해서 알아보겠습니다. 아나콘다(Anaconda)는 파이썬의 한 종류인 배포판(distribution)으로 볼 수 있습니다. 즉, 아나콘다는 파이썬 프로그램 자체를 포함하면서, 데이터 과학에 필요한 다양한 라이브러리와 도구들을 묶어서 제공합니다. …
나와 세상의 지혜가 공유되는 그곳
이번 포스팅에서는 아나콘다 설치 방법 에 대해서 알아보겠습니다. 아나콘다(Anaconda)는 파이썬의 한 종류인 배포판(distribution)으로 볼 수 있습니다. 즉, 아나콘다는 파이썬 프로그램 자체를 포함하면서, 데이터 과학에 필요한 다양한 라이브러리와 도구들을 묶어서 제공합니다. …
파이썬을 활용하여 금융 데이터를 분석하려면, 판다스(Pandas) 라이브러리와 데이터프레임(DataFrame)은 기본적으로 알고 있어야 합니다. 판다스는 데이터 분석을 위해 가장 많이 사용하는 대표적인 데이터 분석을 위한 라이브러리입니다. 데이터프레임은 2차원(행,열)으로 이루어진 이질적인 데이터 형식을 …
Pandas 패키지의 read_csv() 함수는 데이터 분석을 하기 위해 CSV(Comma-Separated Values) 파일을 데이터프레임으로 변환하는 함수입니다. 또한 파일을 청크(Chunk)로 반복하거나 분할하는 것도 지원합니다. 이번 포스팅에서는 read_csv() 함수의 사용법과 인수(parameter)에 대해서 알아 보겠습니다. …
Pandas는 데이터 분석 시 매우 자주 사용하는 라이브러리 중 하나로 Pandas실습 형태로 2차에 걸쳐 포스팅을 작성하였습니다. 이번 포스팅을 보시기 전에 이전 학습이 선행되어야 합니다. Pandas실습1 을 학습하지 않으셨다면, 아래 링크를 …
Pandas는 데이터 분석 시 매우 자주 사용하는 라이브러리 중 하나로 Pandas실습 형태로 포스팅을 작성하였습니다. Pandas는 의심할 여지 없이 테이블 형식의 데이터 처리, 조작 및 처리를 위해 매우 유용한 도구입니다. 이번 …
결측치(Missing Data)는 모든 실제 데이터에서 거의 불가피하게 존재하며 일반적인 데이터 수집 과정에서 피할 수 없습니다. 이는 데이터 입력 중 오류, 데이터 수집 프로세스의 기술적 문제, 손실/손상된 파일 및 기타 다양한 …
데이터 분석을 위한 GroupBy 메서드는 Pandas 라이브러리의 매우 강력한 도구로 거의 모든 분석에서 필수적으로 사용됩니다. 특정 기준에 따라 대규모 데이터 세트를 더 작은 그룹으로 분할 및 요약할 수 있습니다. 이러한 …
어떤 일을 더 빠르고 효율적으로 또는 단순히 더 우아하게 끝내기 위한 빠른 스킬을 좋아하지 않는 사람이 어디 있겠습니까? 이번 포스팅에서는 생산성과 코드품질향상을 위한 Python Skill 5가지에 대해서 알아 보겠습니다. 모든 열의 이름 …
Pandaralllel 라이브러리는 Pandas가 가지는 데이터 처리 방식의 한계를 일정 부분 해결해 주는 라이브러리입니다. 매우 직관적이고 우아하며 초보자에게 친숙한 API를 갖춘 Pandas 라이브러리는 Python에서 최고의 테이블 형식 데이터 랭글링 라이브러리 중 …
프로그래밍하는 동안 오류는 거의 불가피합니다. 사실, 프로그래머는 오류 없는 코드를 만들기 위해 디버깅에 상당한 시간을 소비합니다.디버깅하는 동안 print() 문을 사용하여 파이프라인의 흐름을 이해하고 예기치 않은 동작을 발견하는 방법은 가장 널리 …