바로 직전에 Series에 대해 했지?
시리즈는 1차원데이터+인덱스로 이루어진 벡터데이터야.
이 시리즈를 엮어만든 DataFrame이라는 데이터 단위가 있어.
df는
" 행 , 열, 값 "으로 이루어져있는 행렬데이터야.
===================================================
pd.Series( )와 마찬가지로
pd.DataFrame( )으로 데이터프레임을 만들 수 있어.
데이터프레임 역시 Series와 마찬가지로 리스트(롱스톤아님)로 짜는 방법, 딕셔너리(보리국어사전아님)로 짜는방법이 있어. 리스트로 짜는 방법 먼저 살펴보자




실제 서열 순위를 나타낸 것은 아닙니다.
.
.
.
.
이번엔 딕셔너리로 df를 짜보자



딕셔너리로 짜도 물론 이렇게 index=어쩌구를 통해 행이름을 정해줄 수 있어
.
.
.
===============================
.
.
.

자 이제 df라고 정의한 DataFrame으로 pandas의 df에 대해 사용할 수 있는 각종 코드들을 알아보자.

첫 번째로 .describe( )야.
count, mean, std, Q1, Q3, max값 등을 알려줘
지금 max값이 50000이잖아. 이 5만인 녀석에 대한 데이터를 보고싶으면

"결제금액"이 "5만"과 같은 값에 대한 인덱싱을 해줘. 라고 하던가
"결제금액"이 "결제금액값 중 최댓값"과 같은 값을 갖는 녀석에 대해 인덱싱을 해줘. 라고 하던가
.
.
.
범주형자료에 대한 describe도 가능해.

count는 몇개의 데이터가 존재하는지(단비 솔비 단비 단비니까 4)
unique는 데이터가 몇개의 카데고리로 나뉘는지. 단비랑 솔비만 있으니까 2
top는 최빈값이 누구인지
freq는 최빈값을 먹은 녀석이 몇번으로 먹었는지.
df ["이름"] .unique( )
df ["이름"] .count( ) 이렇게도 확인이 가능하지만... 한번에 count unique top freq 전부 나오는 df.describe를 쓰는게 낫겠지?
오늘은 여기까지라네~ 다음포스팅은 또 df에 대해 쓸거니까 그걸로 찾아오겠다네~
'[Python]' 카테고리의 다른 글
| [python] 노래가사 thread code 만들기 (0) | 2026.01.07 |
|---|---|
| [Python] 냉장고를 부탁해 (0) | 2025.10.27 |
| [Python] pd.DataFrame 2편 (0) | 2025.10.27 |
| [Python] pd.Series (0) | 2025.10.27 |
| [Python] 기초(변수,연산자,조건문,반복문) (0) | 2025.10.27 |