본문 바로가기
Python

파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc)

by 무적물리 2020. 8. 10.

최근 머신러닝 공부를 수행하면서 파이썬에서 데이터프레임을 다룰 일이 많이 생겼습니다. 해서, 자주 사용하는 것이 Pandas DataFrame입니다. 주로 판다스를 사용해서 특정 행이나 특정 열을 추출하는 방법이 많이 사용되는데, 이번 포스팅에서는 Pandas loc 함수를 사용한 특정 열, 행 추출 방법에 대해 여러분과 공유하고자 합니다.

 

Contents

     

     

     

    Pandas DataFrame 선언

    가장 먼저 예제를 풀기 위한 데이터프레임을 선언하도록 하겠습니다. 많은 방법이 있지만, 개인적으로는 아래와 같은 방법이 가장 편하고 가독성이 좋다고 생각합니다. 데이터와 인덱스, 컬럼은 알아보기 쉽도록 표기했습니다.

     

    df = pd.DataFrame([[1,2,3], [4,5,6], [7,8,9]],
    		  index=['index1','index2','index3'],
    		  columns=['columns1','columns2','columns3'])

     

     

    특정 열 or 행 추출 방법

    여러가지 방법을 통해 데이터프레임의 행과 열을 추출할 수 있습니다.

     

    특정 행, 열 단일 추출

    데이터 프레임의 특정 행, 열을 추출한 결과로 데이터프레임으로 추출되는 것을 원하는 분이 많으리라 생각합니다. 해당 방법으로는 아래와 같이 loc 함수를 쓰고 해당 행, 열 이름을 대괄호로 묶어주면 데이터프레임 형태로 특정 행, 열의 추출이 가능합니다.

     

    loc_ex = df.loc[ ['index2'], ['columns3'] ]

     

     

    파이썬 폴더 내 파일 리스트 읽기 예제 (Python File List in Folder)

    오랜만에 파이썬 관련 포스팅입니다. 최근 업무를 수행하면서 굉장히 많은 파일에 대해 반복문을 통해 작업해줘야하는 일이 있었습니다. 이때 원하는 폴더 내 파일명을 리스트형태로 입력해줘

    muzukphysics.tistory.com

     

    특정 행, 열 복수 추출

    위와 같은 방법으로 복수 행, 열을 추출해보겠습니다. 매우 직관적인 방법으로써 콤마(,)로 구분해서 해당 행, 열의 이름을 써주시면 됩니다.

     

    loc_ex = df.loc[ ['index1','index3'], ['columns1','columns3'] ]

     

     

    특정 행, 열 범위 추출

    범위 추출 역시 위와 같은 형태로 추출할 수 있다면 좋겠지만 세상이 그렇게 호락호락하지 않습니다. 대괄호를 없앤 상태로 원하는 행, 열의 범위를 입력해서 해당 범위의 행, 열을 추출할 수 있습니다.

     

    loc_ex = df.loc['index1':'index3', 'columns2':'columns3']

     

    추출 행, 열 Numpy Array 변환

    이렇게 추출된 데이터프레임을 머신러닝에 사용하기 위해서는 보통 넘파이 Array 형태로 변환해줘야합니다. 세상 간단한 코드로 데이터프레임을 Numpy Array로 변환할 수 있습니다.

     

    loc_ex = df.loc['index1':'index3', 'columns2':'columns3'].values

     

     

    파이썬 엑셀 데이터 추출 및 불러오기 예제 (Python Excel Data Read Example)

    최근 파이썬을 사용해서 데이터를 불러오기를 해서 추출할 일이 있었습니다. 해당 코드는 매우 간단하며, 몇가지 코드만 알고 있으면 사용가능합니다. 해당 방법을 유용하게 사용하셨으면 좋겠

    muzukphysics.tistory.com

     

     

    마치며

    썸네일-이미지
    썸네일

     

    이번 포스팅에서는 파이썬 판다스 패키지를 사용한 특정 행, 열 추출 방법에 대해 알아보았습니다. 많은 분들이 알고 계시겠지만 저는 위와 같은 포맷이 가장 편하다고 생각하고 사용 중에 있습니다. 위 코드 참고하시고 발전이 있으셨으면 좋겠습니다.

     

     

    파이썬 데이터프레임 행 열 바꾸기 (Python Pandas Transpose)

    최근 파이썬의 라이브러리 중 하나인, Keras를 사용해서 머신러닝 알고리즘을 스터디하고 있습니다. 여기에서 데이터를 전처리할 때, 파이썬 데이터프레임 패키지인 Pandas를 사용한 데이터 처리

    muzukphysics.tistory.com

    댓글