반응형

Python/Pandas 47

[Pandas] 파이썬 데이터프레임 문자열 필터링 방법 정리(str.contains)

Python의 판다스 모듈에서 str.contains 기능을 통하여데이터프레임에서 문자열 기준 필터링을 진행하는 방법을간략하게 정리해보도록 하겠습니다. 이해를 돕기 위하여 다음과 같은 간단한 데이터프레임을 하나 가정해보도록 하겠습니다.import pandas as pddata = { 'name': ['AAA', 'BBB', 'CCC', 'DDD', 'EEE'], 'email': ['aaa@example.com', 'bbb@gmail.com', 'ccc@example.com', 'ddd@example.net', 'eee@gmail.com']}df = pd.DataFrame(data)df  str.contains 기본 예제판다스에서 문자열 필터링은 str.contains 메소드를 통하여 진행이 가..

Python/Pandas 2024.06.17

[Pandas] 파이썬 데이터프레임 랜덤 샘플링 방법 : df.sample

Python의 판다스 모듈로 데이터프레임의 행들을 랜덤 추출할 수 있는 df.sample 기능에 대하여 사용 예제를 정리해보도록 하겠습니다. 이해를 돕기 위하여 아래의 데이터프레임 df에 대하여 행 샘플링을 진행해 보겠습니다. import pandas as pd df = pd.DataFrame({"이름" : ["AAA", "BBB", "CCC", "DDD", "EEE", "FFF", "GGG", "HHH", "III", "JJJ"], "반" : [1, 1, 1, 1, 1, 2, 2, 2, 2, 2], "점수" : [67, 100, 12, 85, 13, 92, 27, 5, 100, 98]}) df 특정 개수 샘플링 df.sample(n) 형태로 간단하게 n개의 행들을 임의 추출하는 것이 가능합니다. 여기서..

Python/Pandas 2022.09.27

[Pandas] 파이썬 판다스 isin 함수 및 not isin 조건 사용 방법

Python pandas isin / not isin 파이썬의 판다스 라이브러리에서 특정 목록 중에 있는 값들을 조회하고 싶은 경우 유용하게 사용할 수 있는 함수인 isin과 isin 함수의 반대 조건에 대한 사용 방법을 정리해보도록 하겠습니다. 이해를 돕기 위해서 다음과 같은 간단한 데이터프레임 df를 예시로 들어 설명하겠습니다. import pandas as pd a = {"반" : [1, 1, 2, 2, 3, 3], "이름" : ["가", "나", "다", "라", "마", "바"], "학점" : ["A", "B", "B", "C", "A", "D"]} df = pd.DataFrame(a) df isin 함수 사용법 isin 함수는 df[열 이름].isin(목록 리스트) 형태로 사용해주시면 됩니다...

Python/Pandas 2022.09.18

[Pandas] 파이썬 판다스 요일 추출 방법 정리(weekday, day_name(), 한글 요일 이름)

Python pandas 데이터프레임 요일 구하기 파이썬의 판다스 모듈로 데이터프레임 내의 날짜 정보를 다룰 때, 요일 정보를 추출하는 여러 가지 방법들에 대하여 정리해보도록 하겠습니다. 이해를 돕기 위하여 아래와 같은 데이터프레임 df를 예시로 가정해보도록 하겠습니다. 참고로, 먼저 아래 코드로 시간 정보가 있는 열을 datetime 자료형으로 변환해주어야 합니다. df['시간'] = pd.to_datetime(df['시간']) 1. dt.weekday : 요일 정보를 숫자로 추출 datetime 자료형에서 dt.weekday 속성을 통하여 요일 정보를 숫자로 가져올 수 있습니다. 0은 월요일, 1은 화요일, ..., 6은 일요일을 의미합니다. df['weekday'] = df['시간'].dt.week..

Python/Pandas 2022.08.23

[Pandas] 판다스 설치 / 버전 확인 / 버전 변경(업데이트, 다운그레이드) 방법 정리

판다스 모듈 설치, 버전 체크 및 변경 pandas 라이브러리를 install하는 명령어를 알아보고 설치된 판다스 모듈의 version을 확인하는 방법과 해당 모듈을 업그레이드 및 다운그레이드 하는 방법에 대하여 정리해보도록 하겠습니다. 판다스 설치 방법 pip을 이용하여 쉽게 pandas 모듈의 설치가 가능합니다. 설치 명령어의 예시는 아래와 같습니다.(기본 / 버전 지정 예시) # 설치 기본 명령어 !pip install pandas # 버전 지정 설치 명령어(1.3.5 버전 지정 예시) !pip install pandas==1.3.5 판다스 버전 체크 방법 설치된 pandas 모듈의 version을 확인하는 방법은 라이브러리 import 후 __version__ 속성을 통해서 확인해주시면 됩니다. ..

Python/Pandas 2022.08.15

[Pandas] 파이썬 데이터프레임 행/열 순서(위치) 변경 방법 정리

Python 판다스 행, 열 순서 바꾸기 예제 파이썬 판다스 모듈에서 데이터프레임 내 행 및 열의 위치를 원하는대로 변경하는 방법들을 정리해보도록 하겠습니다. 용이한 이해를 위하여 아래와 같은 데이터프레임 df를 예시로 들어 설명드려 보겠습니다. import pandas as pd a = {'A' : ['0', '1', '2', '3', '4'], 'B' : ['00', '11', '22', '33', '44'], 'C' : ['000', '111', '222', '333', '444'], 'D' : ['0000', '1111', '2222', '3333', '4444']} df = pd.DataFrame(a) df 데이터프레임 행 위치 바꾸기 1. reindex 함수를 사용하는 방법 df.reindex..

Python/Pandas 2022.07.10

[Pandas] 파이썬 데이터프레임 행/열 밀기(옮기기) 방법 정리 : df.shift()

Python 판다스 행, 열의 값 밀어내기 : shift 함수 사용법 파이썬의 판다스 모듈에서 데이터프레임 내의 값들을 행 혹은 열을 기준으로 원하는 칸 만큼 밀어내는 shift 함수에 대하여 다루어보도록 하겠습니다. 여기서는 아래와 같은 데이터프레임 df를 예시로 설명을 진행하여 이해를 돕도록 하겠습니다. import pandas as pd a = {'A' : [1111, 2222, 3333, 4444, 5555], 'B' : ['AAAA', 'BBBB', 'CCCC','DDDD', 'EEEE']} df = pd.DataFrame(a) df 전체 n칸씩 아래(혹은 위)방향으로 밀기 : df.shift(n) 기본적인 shift 메소드의 사용법으로, df.shift(n) 형태로 실행 시에 모든 열의 행들이..

Python/Pandas 2022.06.21

[Pandas] 파이썬 데이터프레임에서 SQL 쿼리로 데이터 가져오기(feat. pandasql 모듈의 sqldf 함수)

Python 판다스 SQL 활용 데이터 추출 예제 파이썬의 데이터프레임에서 판다스의 확장 모듈인 pandasql의 sqldf 함수 기능을 통하여 SQL 쿼리로 원하는 데이터를 가져오는 예제를 다루어보겠습니다. 용이한 이해를 위하여 아래와 같은 간단한 데이터프레임 df를 가정해보겠습니다. import pandas as pd a = {'A' : [111, 222, 333, 444, 555, 666], 'B' : ['aaa', 'aaa', 'aaa', 'bbb', 'bbb', 'bbb']} df = pd.DataFrame(a) df 만일, pandasql 모듈이 설치되어 있지 않다면 아래 명령어로 설치를 진행해줍니다. !pip install pandasql 모듈 설치가 완료되었다면 SQL 명령어를 통한 데이터..

Python/Pandas 2022.06.19

[Pandas] 파이썬 데이터프레임 최대/최소값 위치 인덱스, 행 탐색 : idxmax(), idxmin()

파이썬 판다스 max/min 위치 index, row 찾기 파이썬의 데이터프레임 내에서 최대 혹은 최소값을 가지는 행의 위치에 대한 인덱스나 행 전체를 가져오는 방법에 대하여 idxmax, idxmin 함수의 사용법을 토대로 간단하게 정리해보겠습니다. 용이한 설명을 위하여, 아래와 같은 간단한 데이터프레임 df를 예시로 들어보겠습니다. import pandas as pd a = {"이름" : ['AAA', 'BBB', 'CCC', 'DDD'], "국어" : [80, 100, 90, 70], "수학" : [100, 90, 100, 80]} df = pd.DataFrame(a) df = df.set_index("이름") df 여기서는 참고로 "이름" 열이 인덱스로 지정되어 있습니다. 데이터프레임 전체 각 컬..

Python/Pandas 2022.06.12

[Pandas] 파이썬 데이터프레임 고유값 목록, 개수 확인 : unique, nunique 함수(열 1개, 여러 개)

Python 판다스 distinct : unique, nunique 사용법 예제 파이썬의 데이터프레임에서 각 컬럼에 등장하는 유일한 값들의 목록과 개수를 추출하는 방법을 판다스의 unique와 nunique 함수의 사용법을 중심으로 살펴보도록 하겠습니다. 여기서는 열 1개와 여러 개에 대한 예제를 모두 다루어보겠습니다. 이해를 돕기 위하여 아래와 같이 매우 간단한 데이터프레임 df를 가정해보도록 하겠습니다. import pandas as pd a = {'A' : [1, 1, 1, 2, 2, 2], 'B' : ['가', '가', '나', '나', '다', '다']} df = pd.DataFrame(a) df unique 함수 예제 1 : column 1개 내에서 고유값 목록 추출 열 1개 내에서 등장한 값..

Python/Pandas 2022.06.07
반응형