
머신러닝 카테고리의 네 번째 글에서는 지도학습 중 하나로 새로운 data를 미리 정의된 label 중 하나로 분류하는 K 근접 이웃 알고리즘(K nearest neighbor algorithm)에 대한 설명과 동작원리에 대해 설명하겠습니다. K 근접 이웃 알고리즘(knn)은 거리 기반으로 새로운 data를 미리 정의된 label 중 하나로 분류하는 알고리즘입니다. knn은 위 그림처럼 label이 정해진 데이터에 한해서 분류를 진행하는 지도학습 알고리즘의 종류입니다. 데이터가 적은 상황에서도 간단한 모델로 높은 분류 정확도를 가지는 것이 가장 큰 장점입니다. knn 알고리즘의 동작 원리는 학습 데이터와 새로운 데이터 간의 거리를 측정하여 가장 가까운 k개의 data들의 label 중 가장 많은 비율을..

머신러닝 카테고리의 세 번째 글에서는 지도학습 중 하나인 선형회귀에 대한 개념과 동작원리를 설명하겠습니다. 이 글의 목차는 다음과 같습니다.선형회귀의 개념선형회귀 동작원리(Gradient Descent)1. 선형회귀의 개념선형회귀는 독립변수의 패턴에 따라 종속변수가 어떻게 변하는지 보여주는 것입니다. 즉, x값의 변화 추이에 따라 y값의 변화 추이를 알아보고 새로운 x값이 들어오면 가장 정확한 y값을 예측하도록 해주는 모델입니다. 선형회귀의 기본적인 모델은 다음과 같습니다. 우리가 잘 알고 있는 일차함수의 모습이 선형회귀 모델이 됩니다. 선형회귀의 목표는 위의 모델에서 파라미터 w와 b를 추정하는 것입니다. 우리가 가지고 있는 데이터셋은 x값과 f(x)값을 대표하고 이들의 선형적인 패턴을 가장 잘 설명하..

머신러닝 카테고리의 두 번째 글에서는 머신러닝의 분류와 머신러닝 알고리즘을 모델링할 때 고려해야 하는 과적합에 대해 다뤄보겠습니다. 이 글의 목차는 다음과 같습니다.지도학습비지도학습Overfitting과 Underfitting 1. 지도학습머신러닝의 분류에서 첫 번째로 다룰 항목은 지도학습(Supervised Learning)입니다. 이전 글에서 머신러닝에서 가장 중요한 것은 data에 맞는 함수를 만들고 실제값에 근접한 예측값을 추출하는 것이라 언급하였습니다. 머신러닝은 data의 성질에 따라 각각 적절한 함수(모델)가 분류되어 있습니다. 먼저 지도학습 알고리즘은 분석에 사용되는 data 내에 label이라는 정답이 존재할 때 사용됩니다. 지도학습의 목적은 새로운 data의 label을 분류하거나 예측..

머신러닝 카테고리의 첫 번째 글에서는 머신러닝이 무엇이고 그 범위와 활용에 대해 알아보겠습니다. 제가 처음 머신러닝과 딥러닝을 이용한 데이터 분석가가 되겠다고 했을 때 머신러닝과 딥러닝에는 차이가 없는 단어라고 생각했습니다. 하지만 공부를 하면 할수록 두 단어는 엄연히 다르다는 것을 알 수 있었습니다. 이 글의 목차는 다음과 같습니다.머신러닝의 뜻과 개머신러닝과 딥러닝의 차이머신러닝의 활용 1. 머신러닝의 뜻과 개요머신러닝은 표현하는 방법은 아주 많지만 관통하는 가장 큰 뜻은 주어진 데이터를 학습하기 위한 모델을 생성하는 과정입니다. input data를 학습하기 위해 함수 F(x)를 구현하여 Output값을 추출하는 것이죠. 결국 머신러닝에서 가장 중요한 것은 data에 맞는 F(x)를 만들고 실제값..
- # 프로그래머스 # 카펫 # 완전탐색
- 머신러닝 #project #classification #dacon
- pca #주성분분석 #특이값분해 #고유값분해 #공분산행렬 #차원의 저주
- #python #프로그래머스 #외계어사전 #itertools #순열과조합
- seaborn #데이터시각화 #타이타닉
- 머신러닝 #xgboost #
- python #프로그래머스 #리스트 #인덱싱
- 잘라서 배열로 저장하기 #2차원으로 만들기
- 프로젝트 #머신러닝 #regression #eda #preprocessing #modeling
- #tf idf
- #docker #image #build #dockerfile
- python #deque #프로그래머스 #공 던지기 #문자열 계산하기 #코딩테스트
- #docker #container #docker command
- 자연어 처리 #정제 #정규표현식 #어간 추출 #표제어 추출
- #opencv #이미지 읽기 #이미지 제작 #관심영역 지정 #스레시홀딩
- #polars #대용량 데이터셋 처리
- #프로그래머스 #안전지대 #시뮬레이션
- #자연어 처리 #정수 인코딩 #빈도 수 기반
- python #프로그래머스 #겹치는선분의길이
- 로지스틱 회귀 #오즈비 #최대우도추정법 #머신러닝
- #물고기 종류별 대어 찾기 #즐겨찾기가 가장 많은 식당 정보 출력하기 #mysql #programmers
- 머신러닝 #lightgbm #goss #ebf
- randomforest #bagging #머신러닝 #하이퍼파라미터 튜닝
- #attention #deeplearning
- nlp #토큰화 #nltk #konply
- #opencv #이미지 연산 #합성
- # 프로그래머스 #연속된 부분수열의 합 #이중 포인터 #누적합
- #docker #docker compose
- #seq2seq #encoder #decoder #teacher forcing
- # 할인행사 #counter #딕셔너리 #프로그래머스