Python Pandas 마스터하기 1 ~ 10
Python pandas는 데이터 과학과 분석 분야에서 널리 사용되는 강력한 데이터 조작 및 분석 라이브러리입니다. 이 라이브러리는 데이터를 효율적으로 처리하고 변환하기 위한 다양한 기능을 제공합니다. 이번 포스팅에서는 Python pandas를 학습하기 위해 …
나와 세상의 지혜가 공유되는 그곳
Python pandas는 데이터 과학과 분석 분야에서 널리 사용되는 강력한 데이터 조작 및 분석 라이브러리입니다. 이 라이브러리는 데이터를 효율적으로 처리하고 변환하기 위한 다양한 기능을 제공합니다. 이번 포스팅에서는 Python pandas를 학습하기 위해 …
이번 포스팅에서는 지난 번 포스팅(파이썬을 활용한 스크랩핑 실습1) 내용에 이어서 파이썬을 활용한 스크랩핑 방법에 대해서 알아 보겠습니다. 네이버 증권 메뉴에서 국내 증시에 상장된 모든 종목의 주식 관련 기본 정보를 시가총액 …
이번 포스팅에서는 파이썬 스크래핑 실습 첫 포스팅으로 파이썬을 활용해서 네이버 증권 메뉴에 있는 국내증시 거래량 기준 top 100 종목과 종목에 대한 기본 정보를 스크랩핑해서 엑셀 파일로 저장하는 방법에 대해서 알아 …
K-S통계량은 본래 두 집단의 분포가 동일한 지 검증하는 통계량 입니다. 이진분류예측 모형에 대한 성능을 검증하기 위한 지표로 자주 사용됩니다. K-S통계량 및 해당 내용에 대한 자세한 설명은 K-S-통계량-산출하기 글을 참고하시기 바랍니다. …
이번 포스팅에서는 pandas 모듈에서 제공하는 crosstab() 함수 에 대해서 알아 보겠습니다. crosstab 함수는 두 가지 (또는 그 이상) factor에 대한 간단한 교차표를 계산합니다. 기본적으로 factor들의 빈도표를 계산하지만, 옵션을 통하여 값을 …
이번 포스팅에서는 데이터를 구성하는 변수 중에서 결측치를 포함하는 변수를 확인하고, 변수에서 결측치가 얼마나 많은 비율을 차지하고 있는 지 확인하는 파이썬 함수를 작성해 보겠습니다. 인사이트 도출, 통계적 모델링 등을 수행하는 데 …
이번 포스팅에서는 컴퓨터에 있는 기존 파일을 새로운 파일명으로 변경할 때, 유용한 파이썬 함수를 만들어 보겠습니다. ( 파일명을 변경하는 파이썬 함수 )파일을 백업할 때, 일괄적으로 작업하는 경우가 많이 있기 때문에 매우 …
이번 포스팅에서는 컴퓨터에 빈 폴더를 찾아 이를 제거해 주는 빈 폴더 제거용 파이썬 함수를 생성해 보겠습니다. 아무 의미 없이 비어 있는 폴더를 일일이 찾아 지우는 번거로운 작업을 매우 효율적으로 처리할 …
장기간에 걸친 오랜 시간 동안 컴퓨터로 작업을 하면, 폴더가 지저분해 집니다. 폴더 속 폴더와 파일들이 복잡하고 지저분하게 생성되어 있는 경우가 매우 많습니다. 특정 폴더 안에 있는 파일들을 파일 확장자 기준으로 …
시리즈(Series)는 판다스(Pandas) 라이브러리의 데이터 구조 중 하나입니다. 시리즈(Series)는 축 라벨(시계열 포함)이 있는 1차원 ndarray입니다. 라벨은 유니크할 필요는 없지만 해시 가능한 유형이어야 합니다. 객체는 정수 및 레이블 기반 인덱싱을 모두 지원하고 …