반응형

Python/Utils 56

파이썬에서 yaml 파일을 읽고 쓰는 방법

Python yaml 불러오기, 내보내기 자주 사용되는 데이터 저장 포맷 양식 중 하나인 yaml 파일을 파이썬에서 읽고 쓰는 방법을 간단히 요약해보도록 하겠습니다. yaml 파일 읽기 아래와 같은 내용의 example.yaml 파일이 저장되어 있다고 가정하여 해당 파일을 불러오는 예제를 다루어 보겠습니다. name, age, skills, hobby의 4가지 카테고리에 대한 정보가 담겨있으며, skills는 딕셔너리, hobby는 리스트와 유사한 형태로 정보를 포함한 예시입니다. 위의 yaml 파일을 파싱하기 위한 과정은 다음과 같습니다. 1. 파일을 파싱하기 위하여 먼저 yaml 모듈을 임포트해줍니다. # 미설치 시 !pip install pyyaml 명령어로 설치 import yaml 2. open..

Python/Utils 2022.11.27

파이썬에서 상수(const) 기능을 사용하는 방법

C++, JAVA 등 다른 언어에서 const로 사용되는 기능인 상수 선언을 Python에서도 사용이 가능할까요? 아쉽게도 파이썬에서는 직접적으로 상수를 선언하는 기능을 제공하고 있지 않습니다. 대신, 값이 변하지 않는 const 기능을 간접적으로 사용할 수 있는 몇 가지 테크닉을 정리해보도록 하겠습니다. 1. 함수로 선언 상수로 사용할 값을 변수가 아니라 함수로 선언하여 값 변경을 우회하는 방법입니다. 예를 들어, pi라는 값을 3.14로 선언하기 위해서 아래와 같이 함수로 구현할 수 있습니다. def pi(): return 3.14 선언한 값에 대하여 실제 사용 및 값 변경 시도 예시는 아래와 같습니다. print(pi() + 2) # 5.14 pi() = 5 # SyntaxError: can't a..

Python/Utils 2022.10.11

파이썬 소인수분해 함수 : sympy 모듈의 factorint

Python 소인수분해 라이브러리 함수 파이썬에서 정수에 대한 소인수분해를 손쉽게 바로 진행해줄 수 있는 함수인 sympy 라이브러리의 factorint에 대하여 다루어보도록 하겠습니다. 사용법은 매우 간단합니다. factorint(정수) 형태로 사용해주시면 소인수분해 결과가 key가 소인수 밑, value가 지수인 딕셔너리 형태로 반환됩니다. from sympy.ntheory import factorint factorint(12) # {2: 2, 3: 1} factorint(30) # {2: 1, 3: 1, 5: 1} factorint(17) # {17: 1} 참고로, 음의 정수에 대해서도 사용이 가능합니다.(-1을 추가 소인수로 가정합니다.) 또한, 0에 대해서도 사용이 가능한데, 이 때는 0^1을 ..

Python/Utils 2022.10.10

파이썬 한글 또는 영문만 추출하기 / 제거하기

Python에서 정규표현식을 활용하여 한글 혹은 영어만 남기거나 제거하는 코드를 간략하게 정리해 보겠습니다. 한글만 추출, 제거 re.sub 함수 내 정규표현식에서 자모는 ㄱ-ㅣ, 온전한 글자는 가-힣으로 커버하며, 아래와 같이 ^ 유무의 차이로 한글만 남기기 혹은 한글만 제거를 모두 수행할 수 있습니다. 또한, 공백의 포함/제거 여부도 \s 포함 여부로 같이 조정할 수 있습니다. import re my_str = "안녕하세요 ㅎㅎ. Hello World! 12345?" kor_str = re.sub(r"[^ㄱ-ㅣ가-힣\s]", "", my_str) # 한글 + 공백만 남기기 not_kor_str = re.sub(r"[ㄱ-ㅣ가-힣]", "", my_str) # 한글만 제거하기 not_zamo_str = ..

Python/Utils 2022.09.26

구글 코랩(Colab)에서 파일을 업로드하는 3가지 방법

Google Colaboratory 파일 불러오기 방법 정리 구글 코랩을 사용할 때 코딩 환경 내에 텍스트, 이미지 등의 파일을 올리는 대표적인 방법 3가지를 정리해보도록 하겠습니다. 1. 로컬 환경에서 직접 드래그 가장 간단한 방법으로 로컬 환경에서 원하는 파일을 드래그하여 코딩 환경 내에 파일을 불러오는 방법입니다. 먼저, 코랩을 실행 후 왼쪽의 폴더 모양 아이콘을 클릭해줍니다. 이후, 원하는 파일을 드래그하여 좌측 아래의 빈 공간에 놓거나 혹은 가장 왼쪽의 화살표 모양이 그려진 버튼을 클릭하여 직접 파일을 지정해줍니다. 원하는 파일이 아래처럼 파일 목록에 잘 존재하면 업로드가 완료된 것입니다. 해당 방법의 장단점은 다음과 같습니다. 장점 : 가장 간편하다. 단점 : 파일이 너무 큰 경우 업로드가 어..

Python/Utils 2022.08.23

파이썬 활용 pdf 파일 내 텍스트 추출 방법 정리(pypdf2, tika)

Python pdf text 읽기 파이썬으로 pdf 파일에서 텍스트를 추출해내는 방법에 대하여 다루어보도록 하겠습니다. 여기에는 매우 다양한 방법이 있지만 여기서는 간편한 방법 예시 2가지로 pypdf2 모듈과 tika 모듈을 활용한 예제를 살펴보겠습니다. 이 두 모듈이 설치되어 있지않다면 먼저 아래 명령어로 사용할 모듈을 설치해주세요. !pip install pypdf2 !pip install tika 아래의 매우 간단한 텍스트 두 줄이 있는 pdf_1.pdf 파일을 예시로 설명하겠습니다. pypdf2 모듈 활용 방법 먼저, PdfFileReader를 활용하여 아래의 형식으로 파일 디렉토리와 읽기 모드(rb) 부분을 지정해줍니다. from PyPDF2 import PdfFileReader pdf1 = ..

Python/Utils 2022.08.22

파이참(Pycharm) 디버깅 모드 사용 방법 정리(변수 값, 오류 체크)

파이참 디버거 사용법 Pycharm에서 프로그래밍 중 디버깅 모드(디버거)를 사용하는 방법에 대하여 변수의 값과 오류를 확인하는 예시를 중심으로 간단하게 정리해보도록 하겠습니다. 기본 사용법 : 원하는 코드 위치에서 변수 값 확인 먼저, 파이참 디버거로 특정 코드 줄에서의 변수 값을 체크하는 방법을 살펴보겠습니다. 예시로 아래와 같은 간단한 코드로 구성된 main.py 파일이 있다고 가정해 보겠습니다. 변수 값을 알기를 원하는 코드 위치의 줄 번호 부분(붉은색 동그라미 부분)을 클릭하게 되면, 아래와 같이 동그라미 표시가 등장하게 됩니다. 이후, 오른쪽 위에서 벌레 모양의 아이콘을 클릭해주시거나, 혹은 메뉴바에서 Run 메뉴 > Debug 항목을 눌러주시면 디버거 실행이 완료됩니다. 디버깅 모드 실행 뒤..

Python/Utils 2022.07.05

파이썬 미분 구현 예제(미분계수, 도함수)

Python 미분계수, 도함수 계산하기 파이썬에서 주어진 함수의 특정 점에서 미분계수를 정의를 통해서 구해보고 sympy 모듈을 활용하여 도함수를 직접 얻어내는 방법에 관하여도 다루어 보겠습니다. 미분계수 구하기 우선 예시로, 아래와 같은 간단한 함수 f(x)를 가정해 보겠습니다. $$ f(x) = e^x + 5x^2 - 6x - 5 $$ 함수 f(x)에 대한 x = a에서의 미분계수는 아래와 같이 정의가 됩니다. $$ f'(a) = \lim_{h \to 0} \frac{f(a + h) - f(a)}{h}$$ 위의 정의를 통하여 미분계수를 계산하는 과정을 파이썬으로 구현하면 다음과 같습니다. import numpy as np def f(x): # 함수 선언 return np.exp(x) + 5 * x *..

Python/Utils 2022.06.30

파이썬 적분 구현, 면적 구하기 예제(부정적분, 정적분, 구분구적법)

Python 적분, 면적 계산하기 파이썬에서 부정적분, 정적분 및 구분구적법을 계산하는 방법을 살펴보고 그래프 아래의 면적을 적분을 통해서 구하는 방법까지 다루어 보겠습니다. 부정적분 계산 예시로, 아래와 같은 간단한 함수를 적분하는 예시를 살펴보겠습니다. $$\ f(x) = e^x + 2 x^2 + 3x + 4$$ 적분 계산은 sympy 모듈을 통하여 진행되는데, 먼저 식 표현은 아래와 같이 해주시면 됩니다. import sympy as sy x = sy.symbols('x') # x를 변수로 사용함을 선언 f = sy.exp(x) + 2 * x ** 2 + 3 * x + 4 f 이제 표현해둔 식에서 다음과 같은 부정적분의 계산을 해보겠습니다. $$\ \int e^x + 2 x^2 + 3x + 4\; ..

Python/Utils 2022.06.29

파이썬에서 모듈의 코드, 저장 경로와 내장 함수의 코드를 확인하는 방법

Python 라이브러리 코드/py 파일 위치, 내장 함수 코드 확인 파이썬에서 import한 모듈의 소스 코드와 코드 파일이 저장된 경로를 확인하고 내장 함수의 소스코드(파이썬 구현 코드)를 확인할 수 있는 방법을 살펴보도록 하겠습니다. 모듈 소스 코드 확인 : inspect.getsource() inspect 라이브러리의 getsource 함수를 통하여 모듈의 소스 코드를 살펴볼 수 있습니다. 만일, 해당 모듈의 설치가 필요하다면 !pip install inspect 명령어를 통하여 설치해주세요. 예시로, random 라이브러리의 소스 코드를 출력하는 예시 코드는 아래와 같습니다. import inspect import random codes = inspect.getsource(random) print..

Python/Utils 2022.05.20
반응형