- 수업 내용 리마인드 및 아카이빙 목적의 업로드
1. 자연어 처리와 전통적인 프로그래밍의 차이
전통적인 프로그래밍에서는 컴퓨터가 이해할 수 있는 언어로 직접 명령을 내리죠. 하지만 자연어 처리는 컴퓨터가 사람의 언어, 즉 우리가 평소에 쓰는 말을 이해하고 소통할 수 있도록 돕는 기술이에요. 예를 들어, "오늘 날씨 어때?"라고 물으면, 자연어 처리를 통해 컴퓨터가 이 질문을 이해하고 적절한 답을 줄 수 있답니다.
2. 데이터의 유형: 정형 데이터 vs 비정형 데이터
정형 데이터는 말 그대로 구조가 잘 잡힌 데이터에요. 엑셀 파일이나 데이터베이스에 저장된 데이터를 생각하시면 돼요. 반면, 비정형 데이터는 글이나 이메일, 소셜 미디어 글처럼 정해진 틀이 없는 데이터를 말해요. 요즘은 인터넷과 모바일 덕분에 비정형 데이터가 엄청나게 늘어나고 있는데, 사실 전 세계 데이터의 70~80%가 이 비정형 데이터라고 해요. 이 데이터를 잘 분석하는 게 현대 사회에서 중요한 결정들을 내리는 데 아주 큰 도움이 됩니다.
3. 자연어 처리의 어려움
자연어 처리가 어려운 이유 중 하나는 동형이의어와 동음이의어 때문이에요. 같은 철자나 발음을 가진 단어도 문맥에 따라 의미가 달라질 수 있어요. 예를 들어 "Bolt"라는 단어는 상황에 따라 여러 가지 의미로 쓰일 수 있죠. 또, 한국어는 특히 자연어 처리가 어렵다고 해요. 구어와 문어의 차이, 복잡한 높임법, 그리고 자주 생략되는 주어·서술어·목적어 같은 요소들이 있어서 더 까다로워요.
4. 자연어 처리 시장 전망
자연어 처리 시장은 해마다 약 30%씩 성장하고 있다고 해요. 앞으로 5년 안에 시장이 3배로 커질 것으로 예상되는데요. 2016년 약 5,600억 원 규모였던 시장이 2025년에는 무려 24.9조 원 규모로 커질 거라고 해요. 이렇게 급성장하는 이유는 대형 언어 모델(LLM) 같은 기술의 발전, AI 비서의 수요 증가, 웹과 클라우드 기반 서비스의 확산 등이 있어요.
5. 자연어 처리의 일상 속 활용
자연어 처리는 우리 일상 속에서도 많이 쓰이고 있어요. 예를 들어, 검색 엔진은 우리가 입력한 검색어를 이해해서 관련 정보를 찾아주고, 이메일에서는 스팸 메일을 걸러내는 데도 사용돼요. 또, Siri나 구글 어시스턴트 같은 AI 비서가 명령을 이해하고 실행하는 데 자연어 처리가 쓰이죠. 소셜 미디어에서 사람들이 어떤 반응을 보이는지도 분석하고, 챗봇이 우리와 대화를 나눌 수 있게 해주는 기술도 바로 자연어 처리 덕분이에요.
'+ 개발' 카테고리의 다른 글
자연어 처리를 위한 텍스트 전처리(ft.NLTK & KoNLPy) (1) | 2024.09.05 |
---|---|
텍스트 마이닝 : 개념부터 활용까지 (9) | 2024.09.04 |
Streamlit으로 데이터 분석 및 시각화 (0) | 2024.09.02 |
논문 리뷰(#텍스트 마이닝 #뉴스 분석 #금융 시장 변동성)_Gen.AI (6) | 2024.09.01 |
뉴스 크롤링(#네이버 뉴스)_코드 설명 (0) | 2024.08.31 |