Python/Pandas

[Pandas] to_datetime 사용법, 날짜 format 지정 방법

jimmy_AI 2022. 3. 2. 01:04
반응형

파이썬 판다스 datetime 자료형 변환 및 시간 형식 포맷팅

파이썬에서 데이터프레임을 열게되면 시간 정보를 담은 열은 기본적으로

아래와 같이 object 문자열 형태로 자료형이 지정되어 다루는 과정에서 어려움을 겪기도 합니다.

따라서, 이번 시간에는 해당 column의 자료형을 datetime 자료형으로 바꿔보고,

시간 정보 추출 및 날짜 형식 포맷팅을 진행하는 방법에 대해서 다루어보도록 하겠습니다.

 

참고로, 이 글은 캐글의 자전거 대여 예측 데이터셋의 datetime 열을 기준으로 작성되었습니다.

 

 

string에서 datetime 자료형으로 전환 : pd.to_datetime()

pd.to_datetime() 함수를 사용하여 시간 형식의 object 자료형 column을

datetime 형식으로 손쉽게 바꿀 수 있습니다.

df['datetime'] = pd.to_datetime(df['datetime'])

 

 

datetime 자료형을 string으로 전환 : astype(str)

반대로, datetime 형태의 column을 다시 문자열(object) 형태로 바꾸고 싶은 경우에는

astype 함수를 사용해주시면 역변환도 편리하게 이루어집니다.

df['datetime'] = df['datetime'].astype(str)
반응형

datetime 자료형에서 시간 정보 추출 : dt 속성

datetime 타입으로 변환된 column에서 연, 월, 일, 시간 등 정보를 추출하고 싶은 경우에는

dt 속성으로 아래와 같이 접근해주시면 됩니다.

df['datetime'].dt.year # 연도 정보
df['datetime'].dt.month # 월 정보
df['datetime'].dt.day # 일 정보
df['datetime'].dt.hour # 시간 정보
df['datetime'].dt.minute # 분 정보
df['datetime'].dt.second # 초 정보

연도 정보를 추출한 예시는 아래와 같습니다.

각 행들에 저장된 시각에 대한 year 정보만을 가져오게 됩니다.

 

 

datetime 날짜/시간 형식 포맷팅 : dt.strftime

datetime 자료형으로 지정된 column의 날짜 형식을 다른 포맷팅 방법으로 변경하고 싶다면,

dt 속성 내의 strftime 함수를 사용하시면 됩니다.

 

%y, %m, %d 등을 활용하는 파이썬에서 지원하는 strftime 형태의 포맷을 가지고

dt.strftime 함수 내에 원하는 형식을 지정해주시면 됩니다.

 

날짜/시간 형식 포맷팅을 진행한 대표 예시는 아래와 같습니다.