Polars 기본 연산 이해하기

이전 포스팅에서는 Polars 라이브러리를 시작하는 방법에 대해서 알아보았습니다. 이번 포스팅에서는 표현식과 함께 Polars 기본 연산 (예: 더하기, 빼기 등)을 사용하는 방법에 대해서 알아보겠습니다. 다음 데이터프레임의 맥락에서 다양한 테마와 여러 예제를 사용하여 설명하겠습니다. <출처: https://docs.pola.rs/user-guide/expressions/column-selections/>

예제를 위한 데이터프레임 생성

먼저, 예제를 위한 임시 데이터프레임을 생성하겠습니다.

import polars as pl
import numpy as np

tempData = pl.DataFrame(
    {
        "nrs": [1, 2, 3, None, 5],
        "names": ["foo", "ham", "spam", "egg", None],
        "random": np.random.rand(5),
        "groups": ["A", "A", "B", "C", "B"],
    }
)
print(tempData )
예제 결과값 1


Polars 기본 연산 – 수치

tempDataNumerical = tempData.select(
    (pl.col("nrs") + 5).alias("nrs + 5"),
    (pl.col("nrs") - 5).alias("nrs - 5"),
    (pl.col("nrs") * pl.col("random")).alias("nrs * random"),
    (pl.col("nrs") / pl.col("random")).alias("nrs / random"),
)

print(tempDataNumerical)
예제 결과값 2


Polars 기본 연산 – 논리

tempDatalogical = tempData.select(
    (pl.col("nrs") > 1).alias("nrs > 1"),
    (pl.col("random") <= 0.5).alias("random <= .5"),
    (pl.col("nrs") != 1).alias("nrs != 1"),
    (pl.col("nrs") == 1).alias("nrs == 1"),
    ((pl.col("random") <= 0.5) & (pl.col("nrs") > 1)).alias("and_expr"),  # and
    ((pl.col("random") <= 0.5) | (pl.col("nrs") > 1)).alias("or_expr"),  # or
)
print(tempDatalogical)
예제 결과값 3


다음 포스팅에서는 Polars 라이브러리의 열 선택 방법에 대해서 알아보겠습니다.
감사합니다!!


답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다