
https://school.programmers.co.kr/learn/courses/30/lessons/120876 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr2차원 배열 lines가 매개변수로 주어질 때, 2개 이상의 선분이 겹치는 부분의 길이를 구하는 문제 Test Case 1) lines = [[-3,-1], [-2, 1], [0, 2]]일 때, 선분이 2개 이상 겹친 곳은 [-2,-1], [0,1]로 길이 2 반환 Test Case 2) lines = [[-1,1], [1,3], [3,9]]일 때, 선분이 2개 이상 겹친 곳은 없으므로 길이 0을 반환 Solution) 겹치는 선분의 길이를 구..

https://dacon.io/competitions/official/236439/overview/description에서 진행된 부동산 허위매물 분류 해커톤에 참가해 EDA, 전처리, 모델링을 통해 데이터의 숨은 특성을 찾고 정확한 분류 모델을 구현하고자 하였습니다. 부동산 허위매물 분류 해커톤: 가짜를 색출하라! - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io최근 법을 위반한 부동산 허위 매물이 증가하는 추세지만, 소비자는 허위 매물을 객관적으로 판단할 기준이 모호하여 경제적인 피해를 입는 사태가 증가하고 있습니다. 이를 해결하기 위해 위 데이터와 머신러닝을 이용해 신뢰성 있는 부동산 거래 시장을 만들고자 하였습니다.변수명자료형변수명자료형허위매물..

2025.02.24 - [머신러닝] - [12] Xgboost에서 데이터셋이 커질 때 학습 속도가 느린 문제점을 해결한 Lightgbm은 모든 데이터를 탐색하지 않고 상호배타적인 변수를 줄여 학습 속도를 개선시킨 모델입니다. 이번 글에서는 Lightgbm의 동작 원리에 대해 자세히 다뤄보겠습니다. [12] Xgboost2024.06.28 - [머신러닝] - [7] 앙상블 모델에서 언급된 Boosting 기반으로 만들어진 Xgboost는 Gradient Boosting 모델에 정규화 함수를 더해서 과적합을 방지하고 병렬 컴퓨팅을 통해 학습 속도를 개선시킨up-one-coding.tistory.com 1. 동작 원리XGBoost와 Lightgbm의 가장 큰 차이점은 트리에서 리프 노드가 생성되는 방법입니다...

https://www.kaggle.com/datasets/taeefnajib/used-car-price-prediction-dataset Used Car Price Prediction DatasetPredict the price of a used vehiclewww.kaggle.com위 데이터셋을 이용해 중고차 가격 거품을 해결하는 가격 예측 분석 모델을 개발하고 거래를 위한 가격을 산정해 주는 추천 시스템을 개발해 신뢰성 있는 중고차 시장을 만들고자 하였습니다. 아울러 데이터셋의 특성을 살려 텍스트 데이터 전처리에 집중하였고 R2 score 0.6 이상의 지표를 산출하고자 노력했습니다 EDA & Preprocessing1. brand 카테고리 빈도수를 통한 전처리brand 칼럼은 brand 카테고리들의..

2024.06.28 - [머신러닝] - [7] 앙상블 모델에서 언급된 Boosting 기반으로 만들어진 Xgboost는 Gradient Boosting 모델에 정규화 함수를 더해서 과적합을 방지하고 병렬 컴퓨팅을 통해 학습 속도를 개선시킨 장점을 가지고 있습니다. 이번 글에서는 Xgboost의 동작 원리에 대해 자세히 다뤄보겠습니다. [7] 앙상블 모델SVM(Support Vector Machine), KNN 알고리즘과 같이 단일 분류 알고리즘을 조합해 하나의 예측 모형으로 만드는 지도학습 방법론을 앙상블 모델이라고 합니다. 이번 시간에는 앙상블 모델의 종류인 Baggingup-one-coding.tistory.com 1. 동작원리 Xgboost의 기본 원리가 되는 Decision Tree(결정 트리)는..
Python에서는 itertools 패키지를 이용해 순열과 조합의 결과를 산출할 수 있습니다. https://docs.python.org/3/library/itertools.html itertools — Functions creating iterators for efficient loopingThis module implements a number of iterator building blocks inspired by constructs from APL, Haskell, and SML. Each has been recast in a form suitable for Python. The module standardizes a core set...docs.python.org Ex) 길이가 4인 리스트로 순열..

2024.06.28 - [머신러닝] - [7] 앙상블 모델에서 언급된 Bagging의 특징을 이용한 RandomForest 모델은 여러 개의 Tree 분류기를 생성하여 예측값을 도출하는 방법입니다. [7] 앙상블 모델SVM(Support Vector Machine), KNN 알고리즘과 같이 단일 분류 알고리즘을 조합해 하나의 예측 모형으로 만드는 지도학습 방법론을 앙상블 모델이라고 합니다. 이번 시간에는 앙상블 모델의 종류인 Baggingup-one-coding.tistory.com Bagging 기반으로 데이터셋을 복원 추출하고 여러 개의 분류기를 구현해 학습시키는 RandomForest 모델은 '집단 지성의 힘'으로 비유해 여러 개의 Tree 모델이 예측한 값들 가장 많은 값을 최종 예측값으로 사용하..

로지스틱 회귀 모델은 일종의 선형회귀 모델과 유사하지만 종속 변수가 범주형인 것을 대상으로 예측 결과가 분류 분석로써 활용될 수 있습니다. 종속 변수가 이항 변수의 경우, logit 변환을 통해 값이 0에서 1 사이로 변환되어 확률적 개념이 생기면 Threshold에 따라 분류할 수 있습니다. 종속 변수의 값이 1인 확률을 예측한 후, 설정한 Threshold에 따라 종속변수 1과 0을 분류하는 것입니다. 일반 선형회귀 모델과 달리 로지스틱 회귀 모델의 값은 아래 그래프와 같이 반드시 0에서 1 사이의 값만 산출됩니다. 로지스틱 회귀 모델에서 Odds(오즈)란 개념은 이항변수가 극단적일 때 일어날 확률을 비교하기 위해서 사용됩니다. EX) 도심지역의 발병 확률이 1 / 2000, 비도심지역의 발병확률이 ..
deque는 양방향 자료구조로써 한쪽으로만 데이터를 넣고 뺄 수 있는 리스트와 다르게 앞 뒤에서 데이터를 넣고 뺄 수 있는 자료구조입니다. Python에는 from collections import deque을 통해 deque 자료구조를 생성할 수 있습니다. 이번 글에서는 deque을 활용해 해결할 수 있는 문제들을 풀어보겠습니다. 1. 공 던지기https://school.programmers.co.kr/learn/courses/30/lessons/120843 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr공 던지기 게임 룰은 1번부터 던지면서 오른쪽으로 한 명을 건너뛰고 그다음 사람에게만 던질 수 있다..
Python의 List 자료형은 순서가 있는 자료형으로 인덱싱과 슬라이싱이 가능하여 원하는 위치에 존재하는 데이터를 쉽게 추출할 수 있다는 장점이 있습니다. 이번 글에서 List 자료형의 인덱싱을 활용하는 문제들을 풀어 보겠습니다. 1. 잘라서 배열로 저장하기https://school.programmers.co.kr/learn/courses/30/lessons/120913 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr입력된 문자열을 앞에서만큼 특정 길이만큼 잘라서 저장한 배열을 반환하는 문제 Test Case 1 : string1 = "abcdef123" n = 3 "abcdef1..
- 딥러닝 #오차역전파 #연쇄법칙 #계산그래프 #최적화
- python #프로그래머스 #리스트 #인덱싱
- #물고기 종류별 대어 찾기 #즐겨찾기가 가장 많은 식당 정보 출력하기 #mysql #programmers
- html #javascript #구구단 출력
- pca #주성분분석 #특이값분해 #고유값분해 #공분산행렬 #차원의 저주
- python #프로그래머스 #겹치는선분의길이
- 파이썬 #시각화 #matplotlib
- #tf idf
- python #deque #프로그래머스 #공 던지기 #문자열 계산하기 #코딩테스트
- rnn #딥러닝 #시계열 데이터 #장기의존성 문제
- #프로그래머스 #안전지대 #시뮬레이션
- gan #생성자 #판별자 #적대적 신경 신경망 #딥러닝 #computer vision
- 머신러닝 #lightgbm #goss #ebf
- #seq2seq #encoder #decoder #teacher forcing
- #opencv #이미지 연산 #합성
- randomforest #bagging #머신러닝 #하이퍼파라미터 튜닝
- nlp #토큰화 #nltk #konply
- #자연어 처리 #정수 인코딩 #빈도 수 기반
- subquery #sql 코딩테스트
- 잘라서 배열로 저장하기 #2차원으로 만들기
- 로지스틱 회귀 #오즈비 #최대우도추정법 #머신러닝
- 파이썬 #코딩테스트 #프로그래머스 #스택 #큐
- 머신러닝 #project #classification #dacon
- 프로젝트 #머신러닝 #regression #eda #preprocessing #modeling
- #opencv #이미지 읽기 #이미지 제작 #관심영역 지정 #스레시홀딩
- #python #프로그래머스 #외계어사전 #itertools #순열과조합
- #attention #deeplearning
- 머신러닝 #xgboost #
- 자연어 처리 #정제 #정규표현식 #어간 추출 #표제어 추출
- seaborn #데이터시각화 #타이타닉