머신러닝 11

BERT 모델의 개념과 학습 과정

수업 내용 리마인드 및 아카이빙 목적의 업로드 BERT(Bidirectional Encoder Representations from Transformers)는 2018년 구글이 발표한 획기적인 자연어 처리(NLP) 모델입니다. BERT는 Transformer 아키텍처의 양방향 인코더를 기반으로 하여, 입력된 텍스트의 모든 단어를 양방향으로 동시에 처리합니다. 이를 통해 문맥을 더 깊이 이해하고, 기존 모델들보다 높은 성능을 발휘할 수 있게 되었습니다. 이번 글에서는 BERT 모델의 기본 개념, 학습 과정, 모델 구조, 그리고 파인튜닝(Fine-Tuning) 방법을 자세히 알아보겠습니다. 1. BERT 모델이란?BERT는 Transformer 아키텍처의 인코더 부분을 활용한 사전 학습된(pre-traine..

+ 개발 2024.09.29

파이토치(Pytorch): LSTM 기반 GasRateCO2 시계열 예측 모델 구현

수업 내용 리마인드 및 아카이빙 목적의 업로드 이번 글에서는 GasRateCO2 데이터셋을 사용해 시계열 예측을 진행하는 과정을 소개할게요. 우리는 파이토치 기반의 LSTM(Long Short-Term Memory) 모델을 사용해서 예측 작업을 수행할 거예요. 데이터를 불러오고 전처리한 뒤, 모델을 학습시키고 평가하는 전 과정을 함께 진행해 보겠습니다. 1. 필요 모듈 임포트우선, 필요한 모듈을 임포트해볼게요. torch, darts, torchinfo 등의 모듈을 사용하고, GPU가 사용 가능한지 확인해볼게요.!pip install darts!pip install torchinfoimport torchimport torch.nn as nnimport torch.optim as optimfrom torc..

+ 개발 2024.09.24

파이토치(Pytorch): LSTM 기반 주식 예측 모델 구현

수업 내용 리마인드 및 아카이빙 목적의 업로드 이번 글에서는 LSTM(Long Short-Term Memory) 모델을 사용해 주식 데이터를 예측하는 과정을 단계별로 설명하려고 합니다. 주식 시장의 데이터는 시간에 따라 변화하는 시계열 데이터로, 과거 데이터를 바탕으로 미래의 주가를 예측하는 데 LSTM은 RNN의 한계를 보완한 적합한 모델입니다. 1. 필요한 모듈 임포트먼저, 필요한 모듈을 모두 임포트하고 GPU가 사용 가능한 경우 이를 설정합니다.import torchimport torch.nn as nnimport torch.optim as optimfrom torchinfo import summaryfrom torch.utils.data import Dataset, DataLoaderimport ..

+ 개발 2024.09.23

파이토치(Pytorch): RNN 기반 이름 분류기 구현

수업 내용 리마인드 및 아카이빙 목적의 업로드 이번 글에서는 PyTorch를 활용해 이름 분류기를 만들어 볼 거예요. 이 실습에서는 이름 데이터를 사용해 특정 언어를 예측하는 모델을 만들어 보고, 학습한 후 모델의 성능을 평가해보겠습니다. 과정을 차근차근 따라가면 어렵지 않게 이해할 수 있으니, 함께 진행해봐요.1. 필요한 라이브러리 불러오기우선 실습에 필요한 라이브러리들을 불러올게요. GPU를 사용 가능한 경우, GPU를 사용해 학습 속도를 높일 수 있습니다.import torchimport torch.nn as nnimport torch.optim as optimfrom torch.nn.utils.rnn import pad_sequencefrom torch.utils.data import Datase..

+ 개발 2024.09.22

RNN과 LSTM의 차이점과 활용(시계열 데이터 처리)

수업 내용 리마인드 및 아카이빙 목적의 업로드 AI와 딥러닝을 배우다 보면 RNN(순환 신경망)과 LSTM(장단기 메모리)라는 용어를 자주 듣게 됩니다. 특히 시계열 데이터를 처리하는 데 뛰어난 성능을 보여주는데요. 오늘은 RNN과 LSTM의 기본 개념부터 그 차이점까지 하나씩 알아보겠습니다! 1. RNN(순환 신경망)이란?RNN은 순환 신경망(Recurrent Neural Network)의 약자입니다. 일반적인 신경망은 과거의 정보를 기억하지 못하는 단점이 있는데, RNN은 이전 시점의 정보를 활용해 새로운 데이터를 처리할 수 있습니다. 예를 들어, 문장이나 시간에 따라 변화하는 데이터를 다룰 때 유용해요. 1) RNN의 작동 방식RNN의 핵심 아이디어는 이전 시점의 정보를 반영해 더 나은 예측을 하자..

+ 개발 2024.09.21

파이토치(Pytorch): 다중 선형 회귀 모델 구현

수업 내용 리마인드 및 아카이빙 목적의 업로드  이번 글에서는 다중 선형 회귀를 파이토치로 직접 구현해보는 과정을 소개할게요. 다층 퍼셉트론(MLP) 모델을 사용해서 비선형 데이터에 대한 예측을 해볼 거예요. 처음부터 끝까지 함께 진행하면서 학습 과정과 평가 방법까지 차근차근 살펴봐요.  1. 필요 모듈 로드 먼저, 필요한 라이브러리를 가져오고 GPU가 사용 가능한지 확인해볼게요. 파이토치, 데이터 전처리 및 시각화를 위한 다양한 모듈들을 사용합니다. !pip install torchinfoimport torchimport torch.nn as nnimport torch.optim as optimfrom torch.utils.data import DataLoader, Dataset, random_spli..

+ 개발 2024.09.20

파이토치(Pytorch): 단순 선형 회귀 모델 구현

수업 내용 리마인드 및 아카이빙 목적의 업로드  이번 글에서는 파이토치(Pytorch)를 사용하여 단순 선형 회귀 모델을 구현하고 학습시키는 과정을 단계별로 살펴볼게요. 기본적인 데이터셋 생성부터 모델 정의, 학습, 평가, 시각화까지 전체 워크플로우를 다뤄요. 이 글을 통해 선형 회귀 모델이 어떻게 작동하는지 이해하고, 파이토치를 이용해 직접 모델을 구현해봐요.  1. 필요한 라이브러리 로드 먼저 실습에 필요한 라이브러리부터 설치하고 가져와야겠죠? torchinfo는 모델 구조를 확인하는 데 유용한 도구에요.pip install torchinfoimport torchimport torch.nn as nnimport torch.optim as optimfrom torch.utils.data import D..

+ 개발 2024.09.19

딥러닝(Deep Learning) 입문

수업 내용 리마인드 및 아카이빙 목적의 업로드  딥러닝은 최근 AI(인공지능) 기술의 핵심으로 자리 잡고 있습니다. 이미지 인식, 음성 인식, 자율주행차 등 우리가 일상에서 사용하는 기술의 기반이죠. 그렇다면 딥러닝(Deep Learning)이란 무엇일까요? 오늘은 딥러닝의 기본 개념부터 주요 학습 기법까지 차근차근 알아보겠습니다. 1. 딥러닝이란?딥러닝은 AI(인공지능)와 머신러닝의 한 분야로, 인간의 뇌처럼 작동하는 신경망(Neural Network)을 사용하여 데이터를 학습하고 예측하는 기술입니다. 쉽게 말해, 데이터를 보고 스스로 학습하여 결과를 도출하는 방법인데요, 머신러닝과 비슷하지만 더 복잡한 구조의 알고리즘을 사용해 더 깊이 있는 학습을 가능하게 합니다. 2. 머신러닝과 딥러닝의 차이딥러닝..

+ 개발 2024.09.18

머신러닝(Machine Learning) 입문

수업 내용 리마인드 및 아카이빙 목적의 업로드 머신러닝(Machine Learning)이라고 들어보셨나요? 요즘 AI(인공지능)라는 단어와 함께 자주 등장하는 용어인데요, 머신러닝은 데이터를 통해 컴퓨터가 스스로 학습하고 예측할 수 있도록 하는 기술이에요. 이 글에서는 머신러닝이 무엇인지, 그리고 머신러닝에서 사용되는 다양한 학습 방법에 대해 쉽고 간단하게 설명해 드릴게요! 1. 머신러닝이란?머신러닝은 컴퓨터가 사람처럼 데이터를 분석하고 학습해 스스로 결론을 내리는 과정을 말해요. 예를 들어, 수많은 사진을 보고 고양이와 강아지를 구분할 수 있게 되거나, 기온 데이터를 통해 내일의 날씨를 예측할 수 있는 기술이죠.머신러닝은 크게 AI(인공지능)의 한 분야로, 그중에서도 딥러닝(Deep Learning)이..

+ 개발 2024.09.17

문서 표현 기법(ft. Scikit-learn & Gensim)

수업 내용 리마인드 및 아카이빙 목적의 업로드자연어 처리(NLP)에서 문서를 어떻게 표현하느냐는 아주 중요한 부분이에요. 오늘은 두 가지 대표적인 파이썬 라이브러리인 Scikit-learn(Sklearn)과 Gensim을 가지고 문서 표현 방법을 쉽게 설명해볼게요. 이 두 라이브러리는 각기 다른 장점이 있어서 상황에 맞게 잘 선택해서 사용하면 좋아요. Scikit-learn과 Gensim 비교Sklearn은 일반적인 머신러닝 작업에 적합해요. 텍스트 데이터를 다룰 때, 분류나 클러스터링 같은 고급 머신러닝 작업을 할 때 많이 사용해요.Gensim은 대규모 텍스트 데이터에서 주로 쓰이는 라이브러리인데요, 주제 모델링(LDA)이나 단어 임베딩(Word2Vec) 같은 작업에 특히 강점이 있어요.1. BoW (..

+ 개발 2024.09.08