[3] 정수 인코딩
2025.03.24 - [자연어처리] - [2] 정제와 추출 [2] 정제와 추출2025.03.21 - [자연어처리] - [1] 토큰화(Tokenizer) [1] 토큰화(Tokenizer)NLP(Natural Language Processing)은 인간의 언어를 이해하고 해석하기 위한 목적으로 발전해 왔습니다. 다만 분석 모델의 학습 데이터셋은up-one-coding.tistory.com정제와 추출을 겪은 텍스트는 드디어 학습에 사용하기 위해 숫자의 형태로 바꿀 준비가 되어 있습니다. 텍스트 데이터를 숫자의 형태로 바꾸는 가장 대표적인 방법은 빈도수에 따라 매핑하는 것입니다."A barber is a person. A barber is good personbarbergoodperson212 위의 예시처럼,..
자연어처리
2025. 3. 28. 16:31
TAG
- html #javascript #구구단 출력
- 잘라서 배열로 저장하기 #2차원으로 만들기
- nlp #토큰화 #nltk #konply
- subquery #sql 코딩테스트
- seaborn #데이터시각화 #타이타닉
- #attention #deeplearning
- pca #주성분분석 #특이값분해 #고유값분해 #공분산행렬 #차원의 저주
- 프로젝트 #머신러닝 #regression #eda #preprocessing #modeling
- gan #생성자 #판별자 #적대적 신경 신경망 #딥러닝 #computer vision
- 머신러닝 #project #classification #dacon
- randomforest #bagging #머신러닝 #하이퍼파라미터 튜닝
- python #deque #프로그래머스 #공 던지기 #문자열 계산하기 #코딩테스트
- 파이썬 #코딩테스트 #프로그래머스 #스택 #큐
- #tf idf
- #프로그래머스 #안전지대 #시뮬레이션
- python #프로그래머스 #겹치는선분의길이
- #python #프로그래머스 #외계어사전 #itertools #순열과조합
- 로지스틱 회귀 #오즈비 #최대우도추정법 #머신러닝
- #자연어 처리 #정수 인코딩 #빈도 수 기반
- 머신러닝 #xgboost #
- 머신러닝 #lightgbm #goss #ebf
- 딥러닝 #오차역전파 #연쇄법칙 #계산그래프 #최적화
- # 프로그래머스 #연속된 부분수열의 합 #이중 포인터 #누적합
- 자연어 처리 #정제 #정규표현식 #어간 추출 #표제어 추출
- #opencv #이미지 읽기 #이미지 제작 #관심영역 지정 #스레시홀딩
- #opencv #이미지 연산 #합성
- #seq2seq #encoder #decoder #teacher forcing
- python #프로그래머스 #리스트 #인덱싱
- #물고기 종류별 대어 찾기 #즐겨찾기가 가장 많은 식당 정보 출력하기 #mysql #programmers
- 파이썬 #시각화 #matplotlib
글 보관함
최근에 올라온 글