본문 바로가기

아날로그와 디지털사이

검색하기
아날로그와 디지털사이
프로필사진 Sucheol Park

  • 분류 전체보기 (18)
    • SQL (6)
    • ML (4)
    • python (1)
    • DA (5)
    • Tableau (1)
    • 기타 (1)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
  • Elastic net
  • Lasso
  • EDA
  • 메타데이터
  • classification
  • knn
  • 크롤링
  • Titanic
  • mysql
  • Ridge
  • rlike
  • LLE
  • MOD
  • hackerrank
  • 인바운드
  • 아웃바운드
  • mnist
  • 데이터분석
  • 넷플릭스
  • 스크래핑
  • 차원축소
  • SQL
  • kaggle
  • PCA
  • 분류
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록Titanic (1)

아날로그와 디지털사이

Titanic_Feature Engineering & Data Cleansing(Kaggle)

모든 코드는 상단 html 다운로드하시면 확인 가능합니다.(*mobile은 조금 깨져서 나옵니다.) 아래 내용은 요약입니다.(Part2 부터 보시면 됩니다.) 0. Intro EDA에 이어 Feature Engineering, Data cleansing 진행 주어진 데이터 셋에서 모든 피처들이 중요하진 않으므로 특정 피처들은 제거해 주고 반대로 관찰된 피처 중 중요하다 생각되는 것은 새로운 피처로 얻을 수 있다. ​ 1. Age_band Age는 연속형 피처이기 때문에 나이대 별로 카테고리화 시켜주어야 한다 앞서 살펴본 바로는 80세가 최고령자이기 때문에 5개로 카테고리화 시킬 수 있다. (0-16, 17-32, 33-48, 49-64, 64-80세) Age-> Age_band( 카테고리화) 각 Pcla..

DA 2022. 1. 28. 11:13
Prev 1 Next

Blog is powered by kakao / Designed by Tistory

티스토리툴바