
https://dacon.io/competitions/official/236439/overview/description에서 진행된 부동산 허위매물 분류 해커톤에 참가해 EDA, 전처리, 모델링을 통해 데이터의 숨은 특성을 찾고 정확한 분류 모델을 구현하고자 하였습니다. 부동산 허위매물 분류 해커톤: 가짜를 색출하라! - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io최근 법을 위반한 부동산 허위 매물이 증가하는 추세지만, 소비자는 허위 매물을 객관적으로 판단할 기준이 모호하여 경제적인 피해를 입는 사태가 증가하고 있습니다. 이를 해결하기 위해 위 데이터와 머신러닝을 이용해 신뢰성 있는 부동산 거래 시장을 만들고자 하였습니다.변수명자료형변수명자료형허위매물..

https://www.kaggle.com/datasets/taeefnajib/used-car-price-prediction-dataset Used Car Price Prediction DatasetPredict the price of a used vehiclewww.kaggle.com위 데이터셋을 이용해 중고차 가격 거품을 해결하는 가격 예측 분석 모델을 개발하고 거래를 위한 가격을 산정해 주는 추천 시스템을 개발해 신뢰성 있는 중고차 시장을 만들고자 하였습니다. 아울러 데이터셋의 특성을 살려 텍스트 데이터 전처리에 집중하였고 R2 score 0.6 이상의 지표를 산출하고자 노력했습니다 EDA & Preprocessing1. brand 카테고리 빈도수를 통한 전처리brand 칼럼은 brand 카테고리들의..

https://www.kaggle.com/c/titanic Titanic | NoviceKaggle profile for Titanicwww.kaggle.com 위 데이터를 이용해 시각화로 변수 간의 관계를 알아봄으로써 Python의 시각화 라이브러리인 matplotlib과 seaborn을 연습해 보겠습니다. 데이터 설명 DefinitionKey Definition KeyPassengerId AgeAge in years SurvivedSurvival0 = No, 1 = YesSibSp# of siblings / spouses aboard the Titanic PclassTicket class1 = 1st, 2 = 2nd, 3 = 3rdParch# of parents / children aboard t..

투자하고 있는 주식 종목의 미래 가치를 예측하여 자산 관리에 도움이 될 수 있도록 하기 위해 이 프로젝트를 교내 학회에서 진행하였습니다. 1. Dataset 설명2. Data Preprocessing3. Modeling4. 확장점 1. Dataset 설명FinaceDataReader은 금융데이터를 크롤링하여 데이터를 로드할 수 있는 파이썬 오픈소스입니다. https://github.com/FinanceData/FinanceDataReader GitHub - FinanceData/FinanceDataReader: Financial data readerFinancial data reader. Contribute to FinanceData/FinanceDataReader development by creat..
생성형 AI의 발전에 따라 Deepfake 이미지가 많아지면서 이로 인해 발생하는 문제를 해결하고자 실제 이미지와 Deepfake 이미지를 분류하는 프로젝트를 전공 수업에서 진행하였습니다. Dataset 설명Preprocessing - Data AugmentationClassification using Transfer learning 1. Dataset 설명https://www.kaggle.com/datasets/manjilkarki/deepfake-and-real-images deepfake and real imagesDetect if any images is real image of deepfake imagewww.kaggle.com위 Kaggle Dataset을 이용하기 위해 Kaggle API t..
- #attention #deeplearning
- #docker #docker compose
- # 프로그래머스 #연속된 부분수열의 합 #이중 포인터 #누적합
- seaborn #데이터시각화 #타이타닉
- 머신러닝 #xgboost #
- 머신러닝 #project #classification #dacon
- 머신러닝 #lightgbm #goss #ebf
- nlp #토큰화 #nltk #konply
- 로지스틱 회귀 #오즈비 #최대우도추정법 #머신러닝
- #opencv #이미지 읽기 #이미지 제작 #관심영역 지정 #스레시홀딩
- #seq2seq #encoder #decoder #teacher forcing
- 잘라서 배열로 저장하기 #2차원으로 만들기
- randomforest #bagging #머신러닝 #하이퍼파라미터 튜닝
- # 프로그래머스 # 카펫 # 완전탐색
- pca #주성분분석 #특이값분해 #고유값분해 #공분산행렬 #차원의 저주
- python #프로그래머스 #겹치는선분의길이
- 자연어 처리 #정제 #정규표현식 #어간 추출 #표제어 추출
- #프로그래머스 #안전지대 #시뮬레이션
- # 할인행사 #counter #딕셔너리 #프로그래머스
- #물고기 종류별 대어 찾기 #즐겨찾기가 가장 많은 식당 정보 출력하기 #mysql #programmers
- #python #프로그래머스 #외계어사전 #itertools #순열과조합
- python #프로그래머스 #리스트 #인덱싱
- #docker #container #docker command
- #polars #대용량 데이터셋 처리
- #opencv #이미지 연산 #합성
- #자연어 처리 #정수 인코딩 #빈도 수 기반
- #tf idf
- 프로젝트 #머신러닝 #regression #eda #preprocessing #modeling
- #docker #image #build #dockerfile
- python #deque #프로그래머스 #공 던지기 #문자열 계산하기 #코딩테스트