
2024.06.28 - [머신러닝] - [7] 앙상블 모델에서 언급된 Boosting 기반으로 만들어진 Xgboost는 Gradient Boosting 모델에 정규화 함수를 더해서 과적합을 방지하고 병렬 컴퓨팅을 통해 학습 속도를 개선시킨 장점을 가지고 있습니다. 이번 글에서는 Xgboost의 동작 원리에 대해 자세히 다뤄보겠습니다. [7] 앙상블 모델SVM(Support Vector Machine), KNN 알고리즘과 같이 단일 분류 알고리즘을 조합해 하나의 예측 모형으로 만드는 지도학습 방법론을 앙상블 모델이라고 합니다. 이번 시간에는 앙상블 모델의 종류인 Baggingup-one-coding.tistory.com 1. 동작원리 Xgboost의 기본 원리가 되는 Decision Tree(결정 트리)는..
Python에서는 itertools 패키지를 이용해 순열과 조합의 결과를 산출할 수 있습니다. https://docs.python.org/3/library/itertools.html itertools — Functions creating iterators for efficient loopingThis module implements a number of iterator building blocks inspired by constructs from APL, Haskell, and SML. Each has been recast in a form suitable for Python. The module standardizes a core set...docs.python.org Ex) 길이가 4인 리스트로 순열..

2024.06.28 - [머신러닝] - [7] 앙상블 모델에서 언급된 Bagging의 특징을 이용한 RandomForest 모델은 여러 개의 Tree 분류기를 생성하여 예측값을 도출하는 방법입니다. [7] 앙상블 모델SVM(Support Vector Machine), KNN 알고리즘과 같이 단일 분류 알고리즘을 조합해 하나의 예측 모형으로 만드는 지도학습 방법론을 앙상블 모델이라고 합니다. 이번 시간에는 앙상블 모델의 종류인 Baggingup-one-coding.tistory.com Bagging 기반으로 데이터셋을 복원 추출하고 여러 개의 분류기를 구현해 학습시키는 RandomForest 모델은 '집단 지성의 힘'으로 비유해 여러 개의 Tree 모델이 예측한 값들 가장 많은 값을 최종 예측값으로 사용하..

로지스틱 회귀 모델은 일종의 선형회귀 모델과 유사하지만 종속 변수가 범주형인 것을 대상으로 예측 결과가 분류 분석로써 활용될 수 있습니다. 종속 변수가 이항 변수의 경우, logit 변환을 통해 값이 0에서 1 사이로 변환되어 확률적 개념이 생기면 Threshold에 따라 분류할 수 있습니다. 종속 변수의 값이 1인 확률을 예측한 후, 설정한 Threshold에 따라 종속변수 1과 0을 분류하는 것입니다. 일반 선형회귀 모델과 달리 로지스틱 회귀 모델의 값은 아래 그래프와 같이 반드시 0에서 1 사이의 값만 산출됩니다. 로지스틱 회귀 모델에서 Odds(오즈)란 개념은 이항변수가 극단적일 때 일어날 확률을 비교하기 위해서 사용됩니다. EX) 도심지역의 발병 확률이 1 / 2000, 비도심지역의 발병확률이 ..
deque는 양방향 자료구조로써 한쪽으로만 데이터를 넣고 뺄 수 있는 리스트와 다르게 앞 뒤에서 데이터를 넣고 뺄 수 있는 자료구조입니다. Python에는 from collections import deque을 통해 deque 자료구조를 생성할 수 있습니다. 이번 글에서는 deque을 활용해 해결할 수 있는 문제들을 풀어보겠습니다. 1. 공 던지기https://school.programmers.co.kr/learn/courses/30/lessons/120843 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr공 던지기 게임 룰은 1번부터 던지면서 오른쪽으로 한 명을 건너뛰고 그다음 사람에게만 던질 수 있다..
Python의 List 자료형은 순서가 있는 자료형으로 인덱싱과 슬라이싱이 가능하여 원하는 위치에 존재하는 데이터를 쉽게 추출할 수 있다는 장점이 있습니다. 이번 글에서 List 자료형의 인덱싱을 활용하는 문제들을 풀어 보겠습니다. 1. 잘라서 배열로 저장하기https://school.programmers.co.kr/learn/courses/30/lessons/120913 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr입력된 문자열을 앞에서만큼 특정 길이만큼 잘라서 저장한 배열을 반환하는 문제 Test Case 1 : string1 = "abcdef123" n = 3 "abcdef1..
- #django #mvt 패턴
- #물고기 종류별 대어 찾기 #즐겨찾기가 가장 많은 식당 정보 출력하기 #mysql #programmers
- # 할인행사 #counter #딕셔너리 #프로그래머스
- 머신러닝 #project #classification #dacon
- #docker #image #build #dockerfile
- #opencv #이미지 연산 #합성
- 로지스틱 회귀 #오즈비 #최대우도추정법 #머신러닝
- #polars #대용량 데이터셋 처리
- nlp #토큰화 #nltk #konply
- #seq2seq #encoder #decoder #teacher forcing
- #docker #container #docker command
- #자연어 처리 #정수 인코딩 #빈도 수 기반
- randomforest #bagging #머신러닝 #하이퍼파라미터 튜닝
- 머신러닝 #xgboost #
- 머신러닝 #lightgbm #goss #ebf
- #tf idf
- python #프로그래머스 #겹치는선분의길이
- #docker #docker compose
- #python #프로그래머스 #외계어사전 #itertools #순열과조합
- 자연어 처리 #정제 #정규표현식 #어간 추출 #표제어 추출
- 잘라서 배열로 저장하기 #2차원으로 만들기
- #프로그래머스 #안전지대 #시뮬레이션
- pca #주성분분석 #특이값분해 #고유값분해 #공분산행렬 #차원의 저주
- # 프로그래머스 # 카펫 # 완전탐색
- #attention #deeplearning
- #with recursive #입양시각 구하기(2) #mysql
- #opencv #이미지 읽기 #이미지 제작 #관심영역 지정 #스레시홀딩
- # 프로그래머스 #연속된 부분수열의 합 #이중 포인터 #누적합
- 프로젝트 #머신러닝 #regression #eda #preprocessing #modeling
- #웹 프로그래밍 #서버 #클라이언트 #http #was