
분류 머신러닝 모델링에서 중요한 점은 종속 변수가 수치형이어야 하는 점입니다. 오늘 포스트 할 의사결정나무(Decision Tree Model)은 종속 변수가 범주형일 경우, 수치형일 경우 모두 사용할 수 있는 분류 지도학습 알고리즘입니다. 예를 들어, 고객의 OOT 서비스의 리뷰에 따라 재구독 여부를 분류하고자 할 때 종속 변수인 "재구독"과 "해지"가 범주형 데이터인 경우 의사결정나무를 통해 분류할 수 있습니다. 의사결정나무 모델은 데이터에 내재되어 있는 패턴을 분석해 예측 분류 모델을 나무의 형태로 만드는 것입니다. 전체 데이터가 특정 조건에 의해 이진 분할로 부분집합 형태로 나누어지고 더 이상 분류할 수 없을 때까지 과정을 반복하는 것입니다. 의사결정 나무 모델링에서 가장 먼저 이뤄지는 단계는 ..

SVM(Support Vector Machine), KNN 알고리즘과 같이 단일 분류 알고리즘을 조합해 하나의 예측 모형으로 만드는 지도학습 방법론을 앙상블 모델이라고 합니다. 이번 시간에는 앙상블 모델의 종류인 Bagging 기법과 Boosting 기법에 대해 포스트 하겠습니다. 앙상블 모델은 다수 모형의 분류 및 예측 결과를 종합하여 의사결정하는 방법입니다. 앙상블 모델의 성능은 단일 모델의 성능보다는 높다고 알려져 있지만, 단일 모델이 상호 독립적이어야 하고, 각 분류 모델의 오분류율이 적어도 50%보다는 낮아야 앙상블 모델을 사용할 가치가 있습니다. 이 포스트에서 알아볼 Bagging 기법과 Boosting 기법은 모두 단일 모델을 조합하는 방법 중 데이터를 조절하는 방법입니다. 적절한 표본 추출..

이번 포스팅에서는 2024.06.21 - [프로젝트] - [Time Series Forecasting] FinaceDataReader을 이용한 LSTM 시계열분석에서 주식 종목의 종가와 같은 시계열 데이터를 분석하기 위해 활용되었던 LSTM(Long Short-Term Memory)에 대해 포스트 하겠습니다. [Time Series Forecasting] FinaceDataReader을 이용한 LSTM 시계열분석투자하고 있는 주식 종목의 미래 가치를 예측하여 자산 관리에 도움이 될 수 있도록 하기 위해 이 프로젝트를 교내 학회에서 진행하였습니다. 1. Dataset 설명2. Data Preprocessing3. Modeling4. 확장점 1.up-one-coding.tistory.com 시계열 데이터는 ..

이번에는 저번 포스트 https://up-one-coding.tistory.com/12에 이어 합성곱 신경망의 다른 계층과 관련 용어에 대해 포스트 하겠습니다. 합성곱 신경망은 Feature Map을 생성하는 Convolution layer(합성곱 계층) 외에도 풀링 계층(Pooling layer)과 Fully Connected layer, Softmax layer로 구성되어 있습니다. 먼저 Pooling layer은 Feature Map의 공간적 크기를 줄이는 연산을 진행합니다. 합성곱 연산의 결과를 저장하는 Feature Map을 특정 조건을 토대로 일정 영역의 정보를 축약하는 것입니다. 그 종류로 일정 영역의 최댓값을 취하는 MaxPooling, 일정 영역의 평균값을 취하는 AveragePoolin..

이번 포스트에는 https://up-one-coding.tistory.com/11에서 언급된 합성곱 신경망(Convolution Neural Network)의 구조와 원리, 관련 용어를 2개의 포스트로 나누어 알아보겠습니다. 이번 포스트에서는 CNN의 등장 이유와 합성곱 연산이 이뤄지는 합성곱 계층에 대해 포스트 하겠습니다. 합성곱 신경망(Convolution Neural Network, CNN)은 기존 DNN(Deep Neural Network)의 구조에 합성곱 계층(Convolution layer)과 풀링 계층(Pooling layer)을 더해 만들어진 이미지 데이터 분석에 고성능을 가진 신경망 구조입니다. 그 이유는 주어진 이미지의 특징을 CNN의 합성곱 연산으로 쉽게 추출할 수 있기 때문입니다. ..

투자하고 있는 주식 종목의 미래 가치를 예측하여 자산 관리에 도움이 될 수 있도록 하기 위해 이 프로젝트를 교내 학회에서 진행하였습니다. 1. Dataset 설명2. Data Preprocessing3. Modeling4. 확장점 1. Dataset 설명FinaceDataReader은 금융데이터를 크롤링하여 데이터를 로드할 수 있는 파이썬 오픈소스입니다. https://github.com/FinanceData/FinanceDataReader GitHub - FinanceData/FinanceDataReader: Financial data readerFinancial data reader. Contribute to FinanceData/FinanceDataReader development by creat..
- #attention #deeplearning
- #자연어 처리 #정수 인코딩 #빈도 수 기반
- 파이썬 #코딩테스트 #프로그래머스 #스택 #큐
- 머신러닝 #lightgbm #goss #ebf
- subquery #sql 코딩테스트
- #물고기 종류별 대어 찾기 #즐겨찾기가 가장 많은 식당 정보 출력하기 #mysql #programmers
- #seq2seq #encoder #decoder #teacher forcing
- #프로그래머스 #안전지대 #시뮬레이션
- # 프로그래머스 # 카펫 # 완전탐색
- 자연어 처리 #정제 #정규표현식 #어간 추출 #표제어 추출
- python #프로그래머스 #리스트 #인덱싱
- 머신러닝 #xgboost #
- #opencv #이미지 연산 #합성
- pca #주성분분석 #특이값분해 #고유값분해 #공분산행렬 #차원의 저주
- seaborn #데이터시각화 #타이타닉
- #opencv #이미지 읽기 #이미지 제작 #관심영역 지정 #스레시홀딩
- 파이썬 #시각화 #matplotlib
- python #deque #프로그래머스 #공 던지기 #문자열 계산하기 #코딩테스트
- # 할인행사 #counter #딕셔너리 #프로그래머스
- #tf idf
- 머신러닝 #project #classification #dacon
- #python #프로그래머스 #외계어사전 #itertools #순열과조합
- # 프로그래머스 #연속된 부분수열의 합 #이중 포인터 #누적합
- 잘라서 배열로 저장하기 #2차원으로 만들기
- randomforest #bagging #머신러닝 #하이퍼파라미터 튜닝
- nlp #토큰화 #nltk #konply
- 프로젝트 #머신러닝 #regression #eda #preprocessing #modeling
- 로지스틱 회귀 #오즈비 #최대우도추정법 #머신러닝
- python #프로그래머스 #겹치는선분의길이
- html #javascript #구구단 출력