경기도미래기술학교 AI개발자 부트캠프 15일차 TIL - 판다스 문제들을 풀어본 날.

2023. 5. 26. 18:32python

반응형

 

오늘은 어제 얼기설기 배운 판다스를 예제와 함께 풀어본 날이었다.

 

isnull().sum()을 했는데 isnull()로 하면 결측된 애들과 아닌 애들을 각 요소에 boolean 타입으로 리턴해서 보여준다.

 

sum()을 하면 isnull()이 True인 애들만 더해서 보여준다.

 

문법적으로 생소하긴 하다.

첫번 째는 row, 두번 째는 column이다. 그런데 그 각각을 리스트 타입으로 묶은 뒤 다시 리스트로 감싸야 한다.

 

리스트 타입으로 묶어서 그 행과 열에 해당하는 데이터 프레임을 반환하는 것이다. 대신 마지막을 또 묶어줘야 하나의 큰 데이터 프레임으로 인식하는 것이다.

 

 

얘도 마찬가지. 여기서 이해가 좀 잘됐던게 [] 이게 판다스에서는 인덱싱 연산자 라고 말한다는 것이다.

 

df['country'] == 'Italy' 라고 하면 Italy의 이름을 기준으로 True, False를 가진 애들의 데이터프레임이 넘어오게 된다. 근데 그거를 tf[]로 감싸면 기존에 파이썬처럼 리스트형으로 반환해서 True,False가 반환되는게 아니라 인덱싱 연산을 해서 True인 애들의 원래 값을 반환한다는 뜻이다.

 

 

 

괄호를 안하고 진행했더니 invalid decimal literal 오류가 나왔다. Aggregation 함수는 dataframe.함수명() 이런식으로 진행되어야 한다.

안헷갈리게 차라리 첫번 째 조건절을 변수 선언을 한뒤 더하기를 진행하자.

 

unique()와 value_counts().

 

이 두 개가 조금 헷갈렸다. unique()는 유니크한 애들을 가져온다. value_counts()는 유니크하게 애들을 분류해서 그것의 카운트를 세어 반환한다. len(testers)는 결과적으로 동일한 값이다.

 

 

불금이라 다음날 이어서 쓰자.

728x90