astype() 을 이용한 타입 변환
- 특정 열의 데이터를 다른 데이터 타입으로 변환
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4],
'B': [10, 20, 30, 40]
})
# 'A' 열의 데이터 타입을 float으로 변환
df['A'] = df['A'].astype(float)
print(df.dtypes)
# 출력
A float64
B int64
dtype: object
pd.to_numeric() 을 사용한 타입 변환
- 문자열을 숫자로 변환
- 오류가 발생하는 경우 errors='coerce' 옵션을 사용해 결측치로 변환
df['A'] = pd.to_numeric(df['A'], errors='coerce')
print(df)
pd.to_datetime() 을 사용한 날짜 형식 변환
- 문자열 또는 다른 형식의 날짜 데이터를 날짜형 데이터로 변환
df['date'] = pd.to_datetime(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04'])
print(df['date'])
# 출력
0 2024-01-01
1 2024-01-02
2 2024-01-03
3 2024-01-04
Name: date, dtype: datetime64[ns]
pd.to_category() 을 사용한 범주형 데이터로 변환
- 메모리 절약 및 연산 효율성을 높이기 위해 사용
- pd.Categorical() 로 범주형 데이터로 변환 가능
df['Category'] = pd.Categorical(['A', 'B', 'A', 'B'])
print(df['Category'])
# 출력
0 A
1 B
2 A
3 B
Name: Category, dtype: category
Categories (2, object): ['A', 'B']