전체 글 90

[Pandas] 데이터 정렬 - sort_values(), sort_index(), rank()

sort_values()  를 사용한 데이터 정렬값을 기준으로 정렬할 때 사용import pandas as pd# 예시 데이터프레임df = pd.DataFrame({ 'A': [3, 1, 4, 2], 'B': [30, 10, 40, 20]})# 'A' 열을 기준으로 오름차순 정렬sorted_df = df.sort_values(by='A', ascending=True)print(sorted_df)# 출력 A B1 1 103 2 200 3 302 4 40 ascending=True  는 생략가능하며 기본값이 True 내림차순은  False  sort_index()  를 사용한 인덱스 정렬인덱스 기준으로 데이터프레임을 정렬할 때 사용# 인덱스를 기준으로 오름차순 정렬df_sor..

Python/Pandas 2024.12.16

[Pandas] 타입 변환 - astype()

astype()  을 이용한 타입 변환특정 열의 데이터를 다른 데이터 타입으로 변환import pandas as pddf = pd.DataFrame({ 'A': [1, 2, 3, 4], 'B': [10, 20, 30, 40]})# 'A' 열의 데이터 타입을 float으로 변환df['A'] = df['A'].astype(float)print(df.dtypes)# 출력A float64B int64dtype: object pd.to_numeric()  을 사용한 타입 변환문자열을 숫자로 변환오류가 발생하는 경우  errors='coerce'  옵션을 사용해 결측치로 변환df['A'] = pd.to_numeric(df['A'], errors='coerce')print(df) pd.to_d..

Python/Pandas 2024.12.16

[Pandas] 필터링

조건을 사용한 필터링조건을 걸어 특정 열의 값이 일정 조건을 만족하는 행을 선택할 수 있음import pandas as pddf = pd.DataFrame({ 'A': [1, 2, 3, 4], 'B': [10, 20, 30, 40]})# 'A' 열 값이 2보다 큰 행 선택filtered_df = df[df['A'] > 2]print(filtered_df)# 출력 A B2 3 303 4 40여러 조건을 결합하여 필터링 & (AND)또는 | (OR) 연산자를 사용하여 여러 조건을 결합 가능# 'A' 열 값이 2보다 크고, 'B' 열 값이 30보다 작은 행 선택filtered_df = df[(df['A'] > 2) & (df['B'] # 출력 A B2 3 30 ~  연산자 ..

Python/Pandas 2024.12.16

[Pandas] 데이터 접근 (at, loc)

1.  at  사용 (레이블 기반 접근)특정 행과 열을 지정하여 개별 값을 빠르게 접근단일 값만 조회 가능DataFrame.at[row_label, column_label]import pandas as pddf = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})print(df.at[1, 'B']) # 1행 'B' 열의 값 반환# 출력# 52.  iat  사용 (정수 기반 위치 접근)정수 기반 위치를 사용해 빠르게 값에 접근단일 값만 조회 가능DataFrame.iat[row_index, column_index]print(df.iat[1,1]) # 1번째 행, 1번째 열 의 값 반환# 출력# 5 3.   loc  사용 (레이블 기반 접근)행과 열의 레이블(labe..

Python/Pandas 2024.12.16

[Pandas] 데이터 미리보기 및 기본정보 확인

데이터 미리보기(1)  head() df.head(n)상위 n개의 행을 출력n은 생략가능하며 기본값은 5(2)  tail() df.tail(n)하위 n 개의 행을 출력n은 생략가능하며 기본값은 5(3)  sample() df.sample()기본적으로 1개의 행을 무작위로 반환데이터 구조 및 기본 정보 확인(1)  info() df.info()데이터프레임의 구조적 정보를 요약해서 출력합니다.행/열 개수각 열의 데이터 타입결측값 개수메모리 사용량 등 출력예시RangeIndex: 3 entries, 0 to 2Data columns (total 2 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 A ..

Python/Pandas 2024.12.15

[Pandas] inplace 옵션

inplace 란? Pandas 의 DataFrame 나 Series 객체를 조작할때, 원본 데이터를 바로 수정할지 여부를 결정하는 옵션이다 기본적으로 판다스의 함수들은 원본 데이터를 변경하지 않고 새로운 객체를 반환 한다.  inplace=True 를 설정하면 원본 데이터가 직접 변경된다.사용예시 (1)  inplace=False (기본값)원본 데이터는 변경되지 않으며, 새로운 데이터프레임이 반환된다.# 데이터프레임 복사df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})# drop으로 열 삭제 (inplace=False, 기본값)new_df = df.drop('A', axis=1) # A 열을 삭제한 새로운 데이터프레임 반환print(new_df) # A 열..

Python/Pandas 2024.12.15

[Pandas] 시리즈, 데이터프레임 ( Series, DataFrame )

Pandas 의 Series 와 DataFarme 은 판다스 라이브러리의 핵심 데이터 구조입니다.이 두가지는 데이터를 효율적으로 저장하고 처리하기 위해 설계되었습니다.Series ( 시리즈 )Series 는 1차원 데이터 구조로, 배열(array)처럼 동작하지만, 인덱스(index)를 가질 수 있는것이 특징데이터와 인덱스로 구성되어 있으며, Numpy 배열과 Python 딕셔너리의 장점을 결합한 구조엑셀의 한 열( column )인덱스(index) 와 데이터값(value) 이 쌍으로 구성 구조index value0 101 202 30 생성import pandas as pd# 리스트로 시리즈 생성s = pd.Series([10, 20, 30])# 딕셔너리로 시리즈..

Python/Pandas 2024.12.15

[WIL] 본캠프 3주차

이번주의 주요 학습은통계학강의깃강의수준별 학습반머신러닝 공부판다스 공부레디스 공부였다. 솔직히 이번주 너무 시간을 날린것같아서 후회가 된다 ㅜ.ㅜ먼저 통계학 강의와 깃 강의가 있었는데 깃은 어느정도 실습도 하며 따라가고 할만했다.  하지만 통계학은 수학적 지식이 필요하면서 이해하기가 너무 어려웠다. 대학교에서 공부좀 할걸,,, 하는 후회를 하였다 하지만 원론적으로 파고들어서 모든 수식과 정리를 다 알고 쓰는게 아닌  활용하기위해 개념을 알자! 라는 식으로 접근을 하니 한결 편해졌다.그리고 머신러닝 공부를 하였는데 다른조에서 다음주가 개인과제 발제이니 그전에 1회독을 강제하는 발표회 장치를 마련했다. 혼자서 자율적으로 잘 하지 못하는 내게 너무나 알맞는 장치였다. 내가 맡은부분은 앙상블 학습 이었는데  배..

TIL 2024.12.13

[Python] 함수 심화 - 고차함수

함수는 크게보면 4가지로 구분할 수 있다.매개변수 있고, 없고리턴값 있고, 없고이경우인데 예시를 보며 살펴보자1. 매개변수와 반환값이 없는 함수이 함수는 매개변수를 받지 않으며, 값을 반환하지도 않습니다.def 안녕(): print("안녕하세요!")안녕() # 출력: 안녕하세요!2. 매개변수는 있지만 반환값이 없는 함수이 함수는 외부로 값을 반환하지 않지만, 입력된 매개변수로 어떤 작업을 수행합니다.def 더하기(a, b): print(a + b)더하기(3, 5) # 출력: 83. 매개변수가 없고 반환값이 있는 함수이 함수는 매개변수는 받지 않지만, 계산이나 작업 후 결과값을 반환합니다.def 랜덤_수(): import random return random.randint(1, 1..

[WIL] 본캠프 2주차

본캠프가 시작한지 2주차가 끝이났다. 이번주의 주된 일정은 파이썬, 넘파이, 판다스 학습개인과제머신러닝, 딥러닝 강의 제공이었다. 파이썬은 어느정도 개념을 잡아가는것 같지만  넘파이와 판다스는 아직도 잘 모르겠다.  원래 주말에 복습하면서 정리해보려고 했는데  연말에 뭐이리 술약속이 많은지 참,,, 공부를 하면 이런 유혹들을 다 떨쳐내야 하지만 나는 이겨내지 못했다. 언젠가 업보를 돌려받을 미래의 나한테 사과해야지,,, 그래도 파이썬 기초는 탄탄히 잡은것에 만족하자.개인과제 부분은 3가지였는데 크게보자면 아래와 같다. 반복문과 조건문에 대해 이해하였는가?클래스와 함수에 대해 이해하였는가?넘파이, 판다스 를 이용하여 데이터 분석을 할 수 있는가?주요 학습목표로 삼았던 부분들에대해 과제로 돌아보는 시간을 갖..

TIL 2024.12.09