반응형

판다스 37

[Pandas] 파이썬 데이터프레임 행/열 복사(복제) 방법

파이썬 판다스 row/column 복사하기 파이썬 판다스 모듈에서 데이터프레임의 특정 행, 열을 복제하는 방법에 대해서 정리해보도록 하겠습니다. 예시로, 아래의 데이터프레임이 df라는 변수에 저장된 상황을 가정하고 결과를 살펴보겠습니다. import pandas as pd a = {'A' : [111, 222, 333, 444, 555, 666], 'B' : ['aaa', 'bbb', 'ccc', 'ddd', 'eee', 'fff']} df = pd.DataFrame(a) df 행 1개 복제 행 1개를 복사하여 맨 아래의 위치에 붙이는 방법은 df.loc[인덱스]를 이용하여 행 1개를 가져온 뒤, df.append를 사용하여 맨 뒤의 위치에 복제된 행을 이어 붙이면 됩니다. 2번 인덱스에 해당하는 행을 ..

Python/Pandas 2022.05.20

[Pandas] 파이썬 데이터프레임 값 변경/대체 방법 정리

파이썬 판다스 값 바꾸기, 수정 방법 예제 Pandas 라이브러리의 데이터프레임에서 원하는 부분의 값을 변경, 대체하는 여러 가지 방법들을 정리해보도록 하겠습니다. 이해를 돕기 위하여, 아래의 데이터프레임을 예시로 값이 대체된 결과를 보여드리겠습니다. (앞의 코드 수행 결과에 누적된 변경 결과를 첨부할 예정이니 참고해주세요.) import pandas as pd a = {'A' : [1, 2, 3, 4, 5, 6], 'B' : [10, 20, 30, 40, 50, 60], 'C' : [100, 200, 300, 400, 500, 600]} df = pd.DataFrame(a) df 값 1개만 변경 가장 간단한 경우로 원하는 값 1개를 수정하는 예시를 먼저 살펴보겠습니다. df.loc[행의 인덱스, 열 이..

Python/Pandas 2022.05.18

[Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개)

파이썬 판다스 원하는 열/행 가져오기 방법 간단 정리 파이썬 pandas 모듈을 이용하여 데이터프레임에서 원하는 1개의 열/행을 가져오는 방법과 여러 개의 column/row들을 동시에 추출하는 법에 대해서 간략하게 정리해보겠습니다. 이해를 돕기 위하여, 아래의 데이터프레임이 df라는 변수에 저장된 상황을 가정하겠습니다. import pandas as pd a = {'A' : [1, 2, 3, 4, 5], 'B' : [10, 20, 30, 40, 50], 'C' : [100, 200, 300, 400, 500]} df = pd.DataFrame(a, index = ['가', '나', '다', '라', '마']) df 열 1개 추출하기 대괄호 [] 1개로 해당 column의 이름을 지정해주시면 Series..

Python/Pandas 2022.04.26

[Pandas] 파이썬 피벗테이블 필터링, 정렬 및 데이터프레임 변환

판다스 pivot table 값 추출, 정렬, to dataframe 이번 글에서는 지난 시간에 다루었던 피벗테이블 생성법에 이어서 생성된 테이블 내에서 필터링, 정렬 및 데이터프레임 변환을 진행하는 방법에 대해서 다루어보도록 하겠습니다. pd.pivot_table 함수로 테이블을 생성하는 상세한 방법은 아래 링크의 이전 글을 참고하세요. [Pandas] 파이썬 피벗테이블 생성 : pd.pivot_table 함수 사용법 정리 파이썬 판다스 피벗테이블 조회 예제 파이썬 pandas 모듈의 pd.pivot_table 함수로 피벗테이블을 원하는대로 생성하는 방법을 values, index, columns, fill_value 및 aggfunc 인자의 기능을 위주로 정리해보겠습. jimmy-ai.tistory...

Python/Pandas 2022.04.21

[Pandas] 파이썬 피벗테이블 생성 : pd.pivot_table 함수 사용법 정리

파이썬 판다스 pivot_table 함수 사용 예제 파이썬 pandas 모듈의 pd.pivot_table 함수로 피벗테이블을 원하는대로 생성하는 방법을 values, index, columns, fill_value 및 aggfunc 인자의 기능을 위주로 정리해보겠습니다. 이 글은 판다스의 pd.pivot_table 함수 공식 설명 글의 내용에 기반하여 작성되었습니다. 먼저, 이해를 돕기 위하여 아래와 같이 학생들의 정보와 점수가 적혀있는 데이터프레임 df가 있다고 가정해보도록 하겠습니다. import pandas as pd import numpy as np a = {'반' : [1, 1, 1, 1, 2, 2, 2, 2], '성별' : ['남', '남', '여', '여', '남', '남', '여', '여'..

Python/Pandas 2022.04.21

[Pandas] 파이썬 데이터프레임 열 이름 바꾸기 방법 정리 : columns, rename

파이썬 판다스 DataFrame column name 변경법 파이썬의 판다스 모듈에서 데이터프레임의 칼럼 이름을 바꾸는 방법을 columns 속성을 변경하는 경우과 rename 함수를 이용하는 경우로 나누어 간략하게 설명해보도록 하겠습니다. 이해를 돕기 위하여, 아래와 같은 간단한 데이터프레임이 df라는 변수에 담겨있는 상황에서 열 이름을 바꾸는 경우를 가정해보도록 하겠습니다. import pandas as pd a = {'A' : [1, 2, 3, 4], 'B' : [5, 6, 7, 8], 'C' : [9, 10, 11, 12]} df = pd.DataFrame(a) df df.columns 속성 이용 1 : 열 이름 목록 직접 지정 DataFrame의 열 이름 목록은 df.columns 속성에 저장되..

Python/Pandas 2022.04.09

[Pandas] json 파일 <-> 데이터프레임 변환 : to_json, read_json

파이썬 판다스 json to DataFrame 및 DataFrame to json 파이썬에서 pandas 라이브러리의 to_json 및 read_json 함수를 이용하여 각각 데이터프레임을 json 파일로 바꾸고, json 파일을 데이터프레임으로 변환하는 예제에 대하여 다루어보도록 하겠습니다. 데이터프레임을 json 파일로 변환 : to_json() 예시로, 아래와 같은 간단한 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd a = {'A' : [1, 2, 3, 4], 'B' : ['a', 'b', 'c', 'd'], 'C' : ['A', 'B', 'C', 'D']} df = pd.DataFrame(a) df to_json 함수에서는 여러가지 양식의 json 파일 변환을 제공하..

Python/Pandas 2022.04.01

[Pandas] 파이썬 결측치 포함 행, 열 제거 dropna 함수 사용법

판다스 데이터프레임 NaN 값 포함 위치 제거 방법(pd.dropna) 안녕하세요. 지난 글에서 다루었던 데이터프레임 내 결측값의 위치를 찾는 방법에 이어, 이번 글에서는 결측치를 포함하고 있는 행이나 열을 제거하는 방법을 dropna 함수의 사용법을 기반으로 하여 다루어보도록 하겠습니다. 결측값의 위치와 개수를 확인하는 방법에 관한 내용은 아래 링크의 지난 글을 참고해주세요. [Pandas] 파이썬 결측치 확인 방법 : isnull, notnull 판다스 데이터프레임 NaN 값 위치, 개수 확인 안녕하세요. 이번 시간에는 파이썬 판다스 라이브러리에서 데이터프레임 내의 결측값 행을 확인하고, 각 열 별로 결측치의 개수를 세는 방법을 isnull jimmy-ai.tistory.com 참고로 이 글은 pan..

Python/Pandas 2022.03.07

[Pandas] 파이썬 결측치 확인 방법 : isnull, notnull

판다스 데이터프레임 NaN 값 위치, 개수 확인 안녕하세요. 이번 시간에는 파이썬 판다스 라이브러리에서 데이터프레임 내의 결측값 행을 확인하고, 각 열 별로 결측치의 개수를 세는 방법을 isnull, notnull 함수의 사용법을 기준으로 간략하게 설명해보도록 하겠습니다. 결측치 행 확인 : isnull 이해를 돕기 위하여, 아래와 같은 결측값을 일부 포함하는 간단한 데이터프레임이 있다고 가정해보도록 하겠습니다. import pandas as pd import numpy as np a = {'A' : [np.nan, 2, 3, 4, 5, np.nan], 'B' : ['a', 'a', np.nan, 'b', 'b', 'b'], 'C' : [np.nan, 1.5, -0.3, np.nan, 4.2, np.na..

Python/Pandas 2022.03.06

[Pandas] to_datetime 사용법, 날짜 format 지정 방법

파이썬 판다스 datetime 자료형 변환 및 시간 형식 포맷팅 파이썬에서 데이터프레임을 열게되면 시간 정보를 담은 열은 기본적으로 아래와 같이 object 문자열 형태로 자료형이 지정되어 다루는 과정에서 어려움을 겪기도 합니다. 따라서, 이번 시간에는 해당 column의 자료형을 datetime 자료형으로 바꿔보고, 시간 정보 추출 및 날짜 형식 포맷팅을 진행하는 방법에 대해서 다루어보도록 하겠습니다. 참고로, 이 글은 캐글의 자전거 대여 예측 데이터셋의 datetime 열을 기준으로 작성되었습니다. string에서 datetime 자료형으로 전환 : pd.to_datetime() pd.to_datetime() 함수를 사용하여 시간 형식의 object 자료형 column을 datetime 형식으로 손쉽..

Python/Pandas 2022.03.02
반응형