본문 바로가기
반응형

분류 전체보기188

자연어 처리2 - 단어의 원핫 인코딩 임베딩 코드 안녕하세요 앞서 자연어 처리1에서 문장의 토큰화를 해야된다고 포스팅 하였습니다. https://ruminz.tistory.com/287 (자연어 처리1- 문장의 토큰화) 하지만 단순히 단어의 출현 빈도만 가지고는 해당 단어가 어디에 왔는지 순서는 어떠했는지 알수가 없습니다. 이러한 관계 정보를 담기 위해서는 단어의 원핫 인코딩을 진행해야 됩니다. 단어의 원-핫 인코딩 예를들어 '오랫동안 꿈꾸는 이는 그 꿈을 닮아간다' 라는 문장이 있을때 각 단어를 모두 0으로 바꾸어 주고 원하는 단어만 1로 바꾸어 주는것이 단어의 원-핫 인코딩 입니다. 먼저 앞서 예시를 든 문장의 단어 인덱스 값을 출력해보겠습니다. 코랩으로 들어가서 아래와 같이 코드를 작성하고 실행해주세요 from tensorflow.keras.pre.. 2023. 11. 2.
자연어 처리1 - 문장의 토큰화 안녕하세요 작년에 챗 GPT가 정식으로 서비스하였습니다. 챗 GPT는 어떠한 원리로 작동하는지 챗 GPT에 물어보면 답변은 다음과 같이 자연어 처리로 작동한다고 답변을 합니다. 자연어 처리에 대해 알아봅시다. 자연어 처리 자연어란 사람들이 일상적으로 의사소통하고 정보를 교환하기 위해 사용되는 언어를 가리킵니다. 사람들이 평소에 쓰는 텍스트나 음성을 뜻하는데 챗 GPT를 비롯하여 애플의 시리, 구글의 어시스턴트, 네이버의 클로바 또한 이 자연어 처리를 통해 답변을 해줍니다. 하지만 사람들이 평소에 쓰는 말은 패턴 즉 규칙이 없습니다. 따라서 학습을 시키기가 굉장히 어려웠는데 딥러닝이 나오면서 자연어 처리 연구가 굉장히 활발해졌습니다. 그럼 자연어 처리가 어떠한 과정으로 처리 되는지 같이 알아봅시다. 텍스트.. 2023. 10. 29.
CNN 맥스풀링 드롭아웃 플래튼이란 무엇인가 안녕하세요 저번에 CNN에 대해 포스팅을 하였습니다. CNN은 이미지 딥러닝 처리기법중 하나입니다. 기존 이미지 처리 코드에서 CNN을 도입하면 정확도와 학습시간을 크게 단축시킬수있습니다. 하지만 CNN을 씀에도 여전히 그결과가 크거나 복잡할수있는데요 이때 맥스풀링,드롭아웃,플래튼을써서 다시 한번 축소를 시켜야 됩니다. 이 과정을 풀링이라고 합니다. 맥스 풀링 예를들어 다음과 같은 이미지가 있다고 해봅시다. 맥스 풀링을 적용하면 다음과 같이 4 구역으로 나눔니다. 그 다음 각 구역에서 가장 큰값을 추출합니다. 이 과정을 거쳐 불필요한 정보를 간추립니다. 맥스 풀링을 파이썬 코드로 나타내면 다음과 같습니다. model.add(MaxPooling2D(pool_size(2,2))) pool_size를 통해 풀.. 2023. 10. 27.
CNN으로 mnist데이터 학습하기 안녕하세요 cnn으로 mnist 데이터셋을 학습시켜 봅시다. mnist 데이터셋이 무엇인지이는 아래 포스팅을 참고해주세요 https://ruminz.tistory.com/282 (이미지 딥러닝 기초 mnist 써보기) CNN cnn은 컨볼루션 신경망의 약자로써 입력된 이미지에서 다시 한번 특징을 추출하기 위해 커널을 도입하는 기법입니다. 예를들어 이미지가 위와 같이 이루어져 있다고 해봅시다. 여기서 2X2 커널을 준비합시다. 각 칸에는 가중치가 들어가 있씁니다. 가중치를 각각 X1,X0이라고 하겠습니다. 커널을 적용시키면 다음과 같습니다. 왼쪽 위칸부터 차례대로 적용시킵니다. 각 값의 가중치를 곱합니다. 그리고 합을 해줍니다. 그러면 다음과 같습니다. (1X1) + (0X0) + (0X0) + (1X1).. 2023. 10. 20.
mnist로 이미지 학습하고 인식하기 안녕하세요 이제 본격적으로 mnist를 모델에 학습하고 인식해봅시다. 데이터 전처리에 대한 자세한 내용은 다음 포스팅을 참고해주세요 https://ruminz.tistory.com/282 (이미지 딥러닝 기초 mnist 써보기) mnist 데이터 전처리 먼저 관련 라이브러리를 임포트해줍니다. from tensorflow.keras.datasets import mnist from tensorflow.keras.utils import to_categorical import matplotlib.pyplot as plt import sys 그다음 mnist 데이터셋을 불러온다음 학습셋과 테스트셋으로 저장합니다. 그다음 몇 개의 이미지로 구성되어있는지 출력합니다. (X_train,y_train),(X_test,y.. 2023. 10. 19.

Post

다음글 무직자 대출 알아보기 >