2024/12/15 3

[Pandas] 데이터 미리보기 및 기본정보 확인

데이터 미리보기(1)  head() df.head(n)상위 n개의 행을 출력n은 생략가능하며 기본값은 5(2)  tail() df.tail(n)하위 n 개의 행을 출력n은 생략가능하며 기본값은 5(3)  sample() df.sample()기본적으로 1개의 행을 무작위로 반환데이터 구조 및 기본 정보 확인(1)  info() df.info()데이터프레임의 구조적 정보를 요약해서 출력합니다.행/열 개수각 열의 데이터 타입결측값 개수메모리 사용량 등 출력예시RangeIndex: 3 entries, 0 to 2Data columns (total 2 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 A ..

Python/Pandas 2024.12.15

[Pandas] inplace 옵션

inplace 란? Pandas 의 DataFrame 나 Series 객체를 조작할때, 원본 데이터를 바로 수정할지 여부를 결정하는 옵션이다 기본적으로 판다스의 함수들은 원본 데이터를 변경하지 않고 새로운 객체를 반환 한다.  inplace=True 를 설정하면 원본 데이터가 직접 변경된다.사용예시 (1)  inplace=False (기본값)원본 데이터는 변경되지 않으며, 새로운 데이터프레임이 반환된다.# 데이터프레임 복사df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})# drop으로 열 삭제 (inplace=False, 기본값)new_df = df.drop('A', axis=1) # A 열을 삭제한 새로운 데이터프레임 반환print(new_df) # A 열..

Python/Pandas 2024.12.15

[Pandas] 시리즈, 데이터프레임 ( Series, DataFrame )

Pandas 의 Series 와 DataFarme 은 판다스 라이브러리의 핵심 데이터 구조입니다.이 두가지는 데이터를 효율적으로 저장하고 처리하기 위해 설계되었습니다.Series ( 시리즈 )Series 는 1차원 데이터 구조로, 배열(array)처럼 동작하지만, 인덱스(index)를 가질 수 있는것이 특징데이터와 인덱스로 구성되어 있으며, Numpy 배열과 Python 딕셔너리의 장점을 결합한 구조엑셀의 한 열( column )인덱스(index) 와 데이터값(value) 이 쌍으로 구성 구조index value0 101 202 30 생성import pandas as pd# 리스트로 시리즈 생성s = pd.Series([10, 20, 30])# 딕셔너리로 시리즈..

Python/Pandas 2024.12.15