본문 바로가기
[Python]

[Python] pd.DataFrame

by 국경수프 2025. 10. 27.

바로 직전에 Series에 대해 했지? 

시리즈는 1차원데이터+인덱스로 이루어진 벡터데이터야.

 

이 시리즈를 엮어만든 DataFrame이라는 데이터 단위가 있어. 

df는

" 행 , 열, 값 "으로 이루어져있는 행렬데이터야.

===================================================

 

pd.Series(    )와 마찬가지로 

pd.DataFrame(    )으로 데이터프레임을 만들 수 있어.

 

데이터프레임 역시 Series와 마찬가지로 리스트(롱스톤아님)로 짜는 방법, 딕셔너리(보리국어사전아님)로 짜는방법이 있어. 리스트로 짜는 방법 먼저 살펴보자

또 만났네요
이런 리스트를 짰어
pd.DataFrame(밸류에대한리스트 , columns = 열이름에대한리스트)
보다시피 여기에 index를 통해 행이름까지 얹어줄 수 있다네~

실제 서열 순위를 나타낸 것은 아닙니다.

.

.

.

.

이번엔 딕셔너리로 df를 짜보자

또만났네요
물론 나는 pet이 아니라네~

딕셔너리로 짜도 물론 이렇게 index=어쩌구를 통해 행이름을 정해줄 수 있어

 

.

.

.

===============================

.

.

.

내가 간단한 데이터 프레임을 만들었어

 

 

자 이제 df라고 정의한 DataFrame으로 pandas의 df에 대해 사용할 수 있는 각종 코드들을 알아보자.

 

1. describe( )

첫 번째로 .describe(    )야.

count, mean, std, Q1, Q3, max값 등을 알려줘

 

지금 max값이 50000이잖아. 이 5만인 녀석에 대한 데이터를 보고싶으면

"결제금액"이 "5만"과 같은 값에 대한 인덱싱을 해줘. 라고 하던가

"결제금액"이 "결제금액값 중 최댓값"과 같은 값을 갖는 녀석에 대해 인덱싱을 해줘. 라고 하던가

.

.

.

범주형자료에 대한 describe도 가능해.

 

count / unique / top / freq

 

count는 몇개의 데이터가 존재하는지(단비 솔비 단비 단비니까 4)

unique는 데이터가 몇개의 카데고리로 나뉘는지. 단비랑 솔비만 있으니까 2

top는 최빈값이 누구인지

freq는 최빈값을 먹은 녀석이 몇번으로 먹었는지.

 

df ["이름"] .unique(    )

df ["이름"] .count(    ) 이렇게도 확인이 가능하지만... 한번에 count unique top freq 전부 나오는 df.describe를 쓰는게 낫겠지

 

오늘은 여기까지라네~ 다음포스팅은 또 df에 대해 쓸거니까 그걸로 찾아오겠다네~

 

 

'[Python]' 카테고리의 다른 글

[python] 노래가사 thread code 만들기  (0) 2026.01.07
[Python] 냉장고를 부탁해  (0) 2025.10.27
[Python] pd.DataFrame 2편  (0) 2025.10.27
[Python] pd.Series  (0) 2025.10.27
[Python] 기초(변수,연산자,조건문,반복문)  (0) 2025.10.27