반응형

분류 전체보기 500

[술술 읽히는 논문 요약] GloVe: Global Vectors for Word Representation

GloVe: Global Vectors for Word Representation 저자 : Jeffrey Pennington, Richard Socher, Christopher D. Manning 외 학회 : Empirical Methods in Natural Language Processing(EMNLP) 연도 : 2014년 실험 목적 기존 기법 종류 1. 통계 기반 예측 모델링 : LSA 등이 해당 장점 : 코퍼스 전체적으로 담겨있는 정보를 잘 활용 단점 : 디테일한 맥락 정보(옆 단어와의 관계 등)를 학습하는데에 어려움 2. local context window methods : Skip-gram 등이 해당 장점 : 디테일한 맥락 정보를 잘 활용함 단점 : 코퍼스 전체적으로 담겨있는 정보를 활용하는..

[Pandas] 인덱스 초기화, 재정렬 (groupby 후 행 정렬) - reset_index

Groupby 함수, 멀티인덱스 파이썬 데이터 분석 툴인 Pandas를 사용하다보면 groupby 기능을 자주 사용하게 되고, 두 가지 이상의 범주로 groupby를 실행한 경우, 자동으로 멀티인덱스가 적용되어, 다음과 같이 뭉쳐있는 데이터 프레임의 형태를 살펴볼 수 있다. 해당 데이터 셋은 kaggle에서 제공하는 타이타닉 데이터셋을 사용하였고, 다음과 같이 Pclass와 Survived 열로 groupby를 실행한 결과이다. df = pd.DataFrame(train.groupby(['Pclass', 'Survived'])['Name'].count()) 우리는 다음과 같이 각 행이 나누어져있고, 인덱스가 초기화된 결과를 얻고 싶을 때가 있다. 이후 인덱싱이나 다른 작업에 넘길때 일반 데이터프레임처럼 ..

Python/Pandas 2021.11.04

하모닉 수(조화수, Harmonic number)

무한 급수를 공부하는 과정에서 혹은 알고리즘을 공부하는 과정에서 조화수(harmonic number)라는 개념을 자주 맞닥드리게 됩니다. 마주칠 때 마다 혼동될 수 있는 조화수에 대해서 왜 발산하는지와 근사 값은 어떻게 유도되는지 간단히 포스팅을 진행해보도록 하겠습니다. 조화수 정의(Harmonic number definition) 먼저 하모닉 수에 대한 정의를 말씀드리겠습니다. 정의는 다음과 같습니다. $$ H_n = \sum_{i = 1}^{n} \frac{1}{i} = 1 + \frac{1}{2} + \frac{1}{3} + ... + \frac{1}{n}$$ 정의는 아주 간단한데요 n에따라서 하모닉 수의 근사값은 대략 다음 정도로 구할 수 있습니다. $$ n $$ $$ H_n $$ 1 1 2 1...

수학 2021.11.03

Latex 설치 없이 사용하기 - Overleaf

Latex Latex은 수식이 많이 들어간 글 등을 작성할 때, 큰 이점이 있는 문서 작성 툴인데요, 이 프로그램을 사용해야 하는 일이 생겼음에도 설치 과정이 어려워 고난에 부딪히시는 경우가 많을 것으로 생각됩니다. 그래서 이번 글에서는 Latex을 설치 없이 사용하고 실시간 컴파일 및 pdf 파일로 쉽게 변환까지 가능하게 해주는 Overleaf 사이트에 대해서 소개하려고 합니다. Overleaf 시작하기 별 다른 과정 없이 overleaf.com 사이트에 접속해주시면 바로 이용이 가능합니다. 접속해주시면 다음과 같은 화면이 나타날텐데요 화면 아래에 있는 로그인을 사용하셔도 되지만 저는 오른쪽 상단에 위치한 Log In 버튼을 클릭해보겠습니다. 그렇게되면 다음과 같이 로그인 창이 뜹니다. 구글 로그인 등..

2021.11.03

[술술 읽히는 논문 요약] Word2Vec 논문 - Skip-gram, CBOW

Efficient Estimation of Word Representations in Vector Space 저자 : Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean 외 학회 : International Conference on Learning Representations (ICLR) 연도 : 2013년 실험 목적 apple, orange, dog -> 컴퓨터가 학습할 수 없는 형태(단어) [1, 2], [1.5, 3.2], [2.2, 0] -> 컴퓨터가 학습할 수 있는 형태(벡터) 단어 -> 벡터로 표현해보자! 기존 시도 통계 기반 모델링도 이전에 자연어 연구에서 시도되었고(N-gram 등) 단어를 벡터로 표현하려는 시도는 처음은 아니었음(LDA, LSA 등..

프로그램 설치 없이 코딩 시작하기 3편 (Colab)

이번 포스팅에서는 프로그램 설치 없이 가상 환경에서 코딩을 시작해볼 수 있는 Google Colaboratory(Colab) 사이트의 사용 방법에 대해서 알려드리도록 하겠습니다. Colab 장점 코랩 환경의 장점은 나중에 머신 러닝에 활용하는 등 메모리나 GPU 자원을 필요로 할 때, 구글 측에서 무료로 제공하는 컴퓨터 자원을 활용할 수 있다는 장점이 있습니다. 또한 기본적으로 설치되어있는 패키지(Tensorflow, Pytorch etc...)가 많아 데이터 분석이나 딥러닝 실습 등에서 환경 세팅의 번거로움을 줄여줄 수 있다는 큰 장점이 있습니다. Python만 제공 앞에서 포스팅했던 구름 IDE나 repl.it와는 달리 Colab 환경에서는 Python 실습만이 가능하다는 단점이 있습니다. 그러나 파..

Python/Utils 2021.11.01

프로그램 설치 없이 코딩 시작하기 2편 (repl.it)

지난 구름 IDE 포스팅에 이어 이번에는 프로그램 설치 없이 가상의 환경에서 코딩을 진행할 수 있는 또 다른 사이트인 repl.it에 대해서 소개해드리도록 하겠습니다. 구름 IDE와 마찬가지로 Python 뿐 아니라 C언어, C++ 등 여러 언어도 지원하는 환경이라 다양한 언어의 프로그래밍을 처음 시작하는 단계에서 큰 이점을 볼 수 있습니다. 우선 홈페이지 주소는 매우 간단합니다. 주소창에 repl.it를 입력하신 뒤 접속을 해주시면 됩니다. repl.it 접속하기 사이트에 처음 접속하시면 다음과 같이 창이 뜨는데요, 오른쪽 상단에 Sign up을 하시기 전에 Log in을 바로 클릭해주셔도 좋습니다. 로그인을 클릭해주시면 다음과 같이 창이뜨는데요, 구글, 깃허브 혹은 페이스북 계정이 이미 있으시다면 따..

Python/Utils 2021.11.01

프로그램 설치 없이 코딩 시작하기 1편 (구름 IDE)

코딩 입문 Python을 비롯한 여러 프로그래밍 언어의 코딩을 처음 시작하실 때, 컴퓨터 내에 코딩 환경을 구축하는 방법은 파이썬 같은 경우는 먼저 파이썬을 설치하고, 아나콘다에서 환경을 세팅하고 주피터 노트북을 설치한 뒤에 자신이 원하는 패키지들을 설치하여 사용하시게 되고, 이는 다른 언어에서도 마찬가지입니다. 물론, 자신이 원하는 환경이 있는 경우 로컬 컴퓨터 환경 내에 세팅을 완료해주시는 것이 좋습니다. 다만, 코딩을 처음 접하는 상황이거나, 로컬 컴퓨터에서 원하는 프로그래밍 언어 설치나 특정 패키지 등을 구동하기 어려운 경우, 이미 세팅된 코딩 환경을 사용하거나 새로운 가상 환경 내에 세팅을 해주는 것이 편한 경우가 많습니다. 이번 포스팅에서는 아주 간단하게 이미 세팅된 코딩 환경을 사용할 수 있..

Python/Utils 2021.10.31

[술술 읽히는 논문 요약] Supervised Contrastive Learning

Supervised Contrastive Learning 저자 : Prannay Khosla, Piotr Teterwak, Chen Wang, Aaron Sarna, Yonglong Tian, Phillip Isola, Aaron Maschinot, Ce Liu, Dilip Krishnan 외 학회 : Neural Information Processing Systems(NIPS) 연도 : 2020년 논문 링크 : https://arxiv.org/abs/2004.11362 실험 목적 Contrastive Learning : 가까운 대상은 가깝게, 먼 대상은 멀게 가상의 공간 내에 Mapping하는 모델을 학습 ex) 자연어 처리 -> Word2Vec, 비전 분야에서도 활발히 연구 비전 분야에서 기존 Con..

[술술 읽히는 논문 요약] FaceNet 논문 - Triplet loss

FaceNet: A Unified Embedding for Face Recognition and Clustering 저자 : Florian Schroff, Dmitry Kalenichenko, James Philbin 외(구글 팀) 학회 : Computer Vision and Pattern Recognition(CVPR) 연도 : 2015년 논문 링크 : https://arxiv.org/abs/1503.03832 실험에서 구현하려고 한 것은? A사람 앞 모습 A사람 옆 모습 : 거리 0.9로 인식 A사람 앞 모습 B사람 앞 모습 : 거리 1.2로 인식 => 1~1.1 이정도를 기준으로 삼으면? : 같은 사람 / 다른 사람 구분 가능! 학습 방법(Triplet Loss) Input 1 세트의 구성(같은 사..

반응형