이전 포스팅에서는 Polars 라이브러리를 시작하는 방법에 대해서 알아보았습니다. 이번 포스팅에서는 표현식과 함께 Polars 기본 연산 (예: 더하기, 빼기 등)을 사용하는 방법에 대해서 알아보겠습니다. 다음 데이터프레임의 맥락에서 다양한 테마와 여러 예제를 사용하여 설명하겠습니다. <출처: https://docs.pola.rs/user-guide/expressions/column-selections/>
예제를 위한 데이터프레임 생성
먼저, 예제를 위한 임시 데이터프레임을 생성하겠습니다.
import polars as pl
import numpy as np
tempData = pl.DataFrame(
{
"nrs": [1, 2, 3, None, 5],
"names": ["foo", "ham", "spam", "egg", None],
"random": np.random.rand(5),
"groups": ["A", "A", "B", "C", "B"],
}
)
print(tempData )
Polars 기본 연산 – 수치
tempDataNumerical = tempData.select(
(pl.col("nrs") + 5).alias("nrs + 5"),
(pl.col("nrs") - 5).alias("nrs - 5"),
(pl.col("nrs") * pl.col("random")).alias("nrs * random"),
(pl.col("nrs") / pl.col("random")).alias("nrs / random"),
)
print(tempDataNumerical)
Polars 기본 연산 – 논리
tempDatalogical = tempData.select(
(pl.col("nrs") > 1).alias("nrs > 1"),
(pl.col("random") <= 0.5).alias("random <= .5"),
(pl.col("nrs") != 1).alias("nrs != 1"),
(pl.col("nrs") == 1).alias("nrs == 1"),
((pl.col("random") <= 0.5) & (pl.col("nrs") > 1)).alias("and_expr"), # and
((pl.col("random") <= 0.5) | (pl.col("nrs") > 1)).alias("or_expr"), # or
)
print(tempDatalogical)
다음 포스팅에서는 Polars 라이브러리의 열 선택 방법에 대해서 알아보겠습니다.
감사합니다!!