Python/Pandas

[Pandas] json 파일 <-> 데이터프레임 변환 : to_json, read_json

jimmy_AI 2022. 4. 1. 17:40
반응형

파이썬 판다스 json to DataFrame 및 DataFrame to json

파이썬에서 pandas 라이브러리의 to_json 및 read_json 함수를 이용하여

각각 데이터프레임을 json 파일로 바꾸고, json 파일을 데이터프레임으로 변환하는

예제에 대하여 다루어보도록 하겠습니다.

 

 

데이터프레임을 json 파일로 변환 : to_json()

예시로, 아래와 같은 간단한 데이터프레임이 있다고 가정해보겠습니다.

import pandas as pd

a = {'A' : [1, 2, 3, 4], 'B' : ['a', 'b', 'c', 'd'], 'C' : ['A', 'B', 'C', 'D']}
df = pd.DataFrame(a)
df

 

to_json 함수에서는 여러가지 양식의 json 파일 변환을 제공하고 있습니다.

orient 인자에 원하는 json 포맷의 종류를 적어주시면 되며,

대표적으로 index, columns, records, split, values 등 종류의 변환 양식을 지원합니다.

 

indent 인자에 원하는 들여쓰기 칸 수를 적어 json 파일의 가독성도 높일 수 있습니다.

 

to_json 함수의 사용은 아래 코드처럼 (디렉토리, orient, 기타 인자) 형태로 작성해주시면 되며,

각 포맷 양식으로 변환된 json 파일의 예시는 다음 그림과 같습니다.

반응형
# to_json 함수의 사용법 예시
df.to_json('df_index.json', orient = 'index', indent = 4)
df.to_json('df_columns.json', orient = 'columns', indent = 4)
df.to_json('df_records.json', orient = 'records', indent = 4)
df.to_json('df_split.json', orient = 'split', indent = 4)
df.to_json('df_values.json', orient = 'values', indent = 4)

 

 

json 파일을 데이터프레임으로 열기 : read_json()

반대로, json 파일을 데이터프레임으로 열고 싶은 경우에는

pd.read_json() 함수를 사용해주시면 됩니다.

 

해당 함수의 input으로는 json 파일이 저장된 디렉토리와

지정하고 싶은 행, 열에 알맞은 양식의 orient(위 사진 참조)를 지정해주시면 됩니다.

# index orient 양식으로 지정된 json 파일을 데이터프레임으로 여는 예시
df_2 = pd.read_json('df_index.json', orient = 'index')