Python/NLP Code

nltk 다운로드 방법, LookupError 해결

jimmy_AI 2022. 3. 9. 21:38
반응형

nltk package download manual

이번 글에서는 nltk 라이브러리에서 원하는 corpora, model을 골라서 설치하거나

collection 전체를 다운로드하는 방법을 설명하고, LookupError 오류가 등장할 경우

이를 콘솔 창을 통해 해결할 수 있는 법을 간략하게 다루어보도록 하겠습니다.

 

먼저, nltk 라이브러리가 설치되지 않은 경우 !pip install nltk 명령어를 통해

라이브러리를 설치해주시면 됩니다.

 

 

nltk package collection 전체 다운로드 : all, popular 등

nltk에서 지원하는 모든 패키지를 다운로드 받고 싶다면 all 옵션을,

많이 사용되는 주요 패키지들의 목록들을 설치하고 싶다면 popular 옵션으로

아래 예시 코드처럼 지정해주시면 됩니다.

 

collection 전체를 다운로드 받을 경우 설치 시간이 어느정도 소요될 수 있습니다.

import nltk

nltk.download('all') # 모든 패키지 다운로드 경우
nltk.download('popular') # 주요 패키지만 다운로드 경우

 

 

nltk 원하는 패키지 골라서 다운로드

만일 특정 corpora나 model을 골라서 다운로드 받고 싶다면

해당 패키지의 이름을 input으로 설정해주시면 됩니다.

 

예를 들어, stopwords corpora나 punkt model을 설치하려는 경우는

마찬가지로 아래 예시처럼 작성해주시면 됩니다.

import nltk

nltk.download('stopwords')
nltk.download('punkt')
반응형

nltk LookupError 해결 방법(console 창에서 다운로드)

위 방법으로 패키지를 설치하는 과정에서 때로는 아래와 같은 오류가 등장할 수 있습니다.

LookupError:
**********************************************************************
  Resource stopwords not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()

이처럼 LookupError가 발생되는 경우, download() 함수 내에 input 없이 실행하여

콘솔 창을 통한 직접적인 패키지 다운로드를 진행해주시면 됩니다.

import nltk

# 패키지 다운로드 콘솔창 호출
nltk.download()

위와 같은 콘솔 창 내에서 All packages 항목 중

abc 순으로 정렬된 이름을 통하여 원하는 패키지 이름을 찾아주시고,

아래의 Download 버튼을 클릭해주시면 설치가 완료됩니다.