'Python/NLP Code' 카테고리의 글 목록

파이썬 generativeai에서 safety level 세팅 방법(Gemini API 콘텐츠 필터 해제)

안녕하세요.이번 글에서는 Python으로 구글 generativeai의 API를 호출할 때,safety 필터링 level을 조정하는 방법을 살펴보겠습니다.이는 Gemini를 API로 활용할 때, 콘텐츠 필터를 해제하는 등의 상황에서 유용할 것입니다. 참고로, generativeai가 아닌 genai의 API에 대해서는 아래의 문서를 참고하면쉽게 safety level를 조정할 수 있습니다. 안전 설정 | Gemini API | Google AI for DevelopersGoogle의 최첨단 모델인 Gemini 2.5 Pro Experimental을 사용할 수 있습니다. 자세히 알아보기 이 페이지는 Cloud Translation API를 통해 번역되었습니다. 의견 보내기 안전 설정 Gemini A..

Python/NLP Code 2025.04.09

파이썬 Gemini 모델 API 사용 방법 정리(텍스트, 이미지 Input)

안녕하세요.이번 시간에는 Python에서 Gemini 모델을 API를 통해 호출하는 방법에 대하여쉽게 정리해보도록 하겠습니다. API 키 발급먼저, 구글에서 제공하는 Gemini 모델을 사용하기 위한 API 키를 발급해야 합니다. 발급은 아래의 링크에서 가능하며,https://aistudio.google.com/app/apikey?hl=ko결제 수단 등록 없이 무료 계정으로도 일정량 사용이 가능하나,절대로 키 유출이 되지 않도록 반드시 유의해주세요. 모듈 설치 및 사용 가능 모델 확인Gemini 기능 사용을 위한 google-generativeai 모듈 설치가 필요합니다.설치 명령어는 다음과 같습니다.!pip install -q -U google-generativeai 이후, 위에서 발급 받았던 AP..

Python/NLP Code 2025.04.03

파이썬 고성능 언어 감지 모듈 Lingua 소개 및 예제

안녕하세요.이번 글에서는 Python에서 제공되는 언어 감지 모듈인Lingua에 대해서 간략하게 소개를 해보고 코드 예제를 다루어보도록 하겠습니다. 해당 모듈에 대한 공식 github 페이지는 다음과 같으며,이 포스팅도 해당 글의 내용을 토대로 작성하였습니다. GitHub - pemistahl/lingua-py: The most accurate natural language detection library for Python, suitable for short text and mixedThe most accurate natural language detection library for Python, suitable for short text and mixed-language text - pemistahl..

Python/NLP Code 2025.02.06

LangChain 활용 ReAct 알고리즘 구현 예제

안녕하세요.오늘은 LangChain으로 LLM에서 원하는 종류의 output을 얻기 위하여추론 및 적절한 도구를 호출하는 과정을 반복하는 ReAct 알고리즘을 구현하는간략한 예제를 다루어보도록 하겠습니다. Step 1. LangChain 세팅LangChain 모듈 활용을 위한 설치가 필요합니다.설치가 되어있지 않은 경우 다음 명령어를 통해 설치를 진행해주시면 됩니다.$pip install langchain$pip install langchain-openai 이 예제에서는 openai 모델을 활용할 예정이므로, API 키 값이 필요합니다.OPENAI_API_KEY 환경 변수에 해당 값을 매칭시키기 위하여.env 파일 정의를 권장합니다.OPENAI_API_KEY="openai에서 발급받은 API Key" ..

Python/NLP Code 2025.01.14

LangChain으로 RAG를 구현하는 방법 기본 예제

안녕하세요.이번 글에서는 LangChain에서 챗봇의 기본이 되는 RAG 시스템을 구현하는기초적인 예제를 다루어보면서 방법을 이해해보도록 하겠습니다. Step 1. LangChain 및 Pinecone 벡터 DB 세팅먼저, LangChain 모듈 활용을 위한 준비가 되어있어야 합니다.모듈 설치가 되어있지 않다면 다음과 같은 명령어로 설치를 진행해줍니다.$pip install langchain$pip install langchain-openai$pip install langchain-community$pip install langchain-pinecone 참고로, 이 글의 예제에서는 LLM은 openai의 GPT 모델을,벡터 DB로는 Pinecone을 사용할 예정인데다른 조합 사용을 원하신다면 이에 맞는..

Python/NLP Code 2025.01.09

LangChain이란? / 설치 방법 및 기본 코드 예제

안녕하세요.이번 글에서는 LLM 활용을 간편하게 도와주는 LangChain 모듈에 대한 소개를 해보고설치 과정과 함께 시작해볼 수 있는 간단한 예시 코드 스니펫을 정리해보도록 하겠습니다. LangChain이란? / 장점LangChain은 LLM과의 상호작용을 보다 쉽게 만들어주는 파이썬 라이브러리인데요.예를 들어, GPT-4o, LLAMA, Claude, Gemini와 같은 다양한 종류의 LLM을 활용해자연어 처리 혹은 대화형 애플리케이션을 개발할 때, 모델에 대한 프롬프트를효율적으로 구성하고 그 결과값을 다루는 과정을 간편화해 줍니다. LLM들을 수동으로 연결하고, 프롬프트도 수동으로 관리하고 기록 로깅도 수동으로모두 구현을 하려면 할 수는 있겠지만 이 과정들을 애플리케이션마다 일일이설정하고 관리하는..

Python/NLP Code 2025.01.05

파이썬 챗봇 개발 라이브러리 Llama Index 예제 및 장점 정리

안녕하세요.Python에서 chatbot을 만들 때 매우 유용하게 활용 가능한라마 인덱스 라이브러리에 대하여 기본적인 사용 예제와대략적인 장점에 대하여 정리해보도록 하겠습니다. 라이브러리 설치 및 API Key 세팅우선, Llama Index를 설치해주어야 하는데요. 다음 명령어로 쉽게 설치가 가능합니다.!pip install llama-index 라마 인덱스 사용을 위해서는 OpenAI에서 발급받은 API 키가 필요합니다.다음과 같이 OPENAI_API_KEY 환경 변수로 지정해줍니다.import osos.environ["OPENAI_API_KEY"] = "sk-xxx" 문서 가져오기다음은 문서를 가져오는 단계인데요.라마 인덱스에서는 txt, pdf, csv, docx, hwp 등 매우 다양한 종류..

Python/NLP Code 2024.12.17

ChatGPT 모델 fine-tuning 진행하는 방법 파이썬 코드 예제

안녕하세요.OpenAI에서 제공하는 GPT 모델에 원하는 데이터를 직접 학습시키는 과정이 가능한데요.Python으로 간단하게 파인튜닝을 진행하는 예제 코드를 살펴보도록 하겠습니다. 참고로, 해당 과정에 대한 상세한 내용은 아래의 OpenAI 공식 document를 참고하세요.https://platform.openai.com/docs/guides/fine-tuning 이 글에서는 전반적인 감만 잡을 수 있는 매우 간단한 코드 스니펫 예시를 다룰 예정입니다. 데이터 준비우선, 데이터는 각 줄마다 하나의 대화로 구성된 jsonl 파일로 준비되어야 합니다.예시 파일의 포맷은 다음과 같습니다.{"messages": [{"role": "system", "content": "당신은 나라 이름을 대면 수도를 알려주는..

Python/NLP Code 2024.11.10

OpenAI GPT API에서 structured output 구조로 대답을 받도록 설정하는 방법 정리(pydantic 기능 활용)

안녕하세요.때로는 ChatGPT API를 사용하는 과정에서 원하는 response를포맷이 고정된 json 구조(structured output)로 받고 싶은 경우가 있습니다. 이런 경우를 위하여 pydantic의 type 지정 기능을 활용하여응답의 포맷을 고정하도록 주문하는 방법들이 있는데요. 이를 활용하는 예시 코드들을 간략하게 살펴보면서기능 사용법에 대한 이해를 해보도록 하겠습니다. 코드 예시방법 1먼저, OpenAI Client를 선언합니다.from openai import OpenAIOPENAI_API_KEY = "sk-xxxx" # 사용할 OpenAI API Keyclient = OpenAI(api_key=OPENAI_API_KEY) 이후, 원하는 포맷의 json 양식을 pydantic 모델로..

Python/NLP Code 2024.11.05

파이썬 OPENAI 텍스트 임베딩 모델 사용 및 유사도 구하기 예제

Python으로 OPENAI에서 제공하는 text embedding 모델을 활용하여 텍스트의 임베딩 벡터를 구해보고, 문서 간 코사인 유사도를 구하는 예제를 간략하게 다루어보도록 하겠습니다. OPENAI 텍스트 임베딩 모델 사용 코드 예시 현재 비교적 최신 모델인 text-embedding-3-small, text-embedding-3-large와 기존 모델인 text-embedding-ada-002에 대한 임베딩 API를 OPENAI에서 제공 중입니다. (모델 상세 정보는 해당 링크의 openai 공식 document 페이지를 참고해주세요.) 우선, 문자열 1개에 대한 텍스트 임베딩 벡터를 구하는 파이썬 코드 예시는 다음과 같습니다. from openai import OpenAI # !pip insta..

Python/NLP Code 2024.02.14

지미뉴트론 개발일기

Python/NLP Code 25

티스토리툴바