
여러분, 안녕하세요~? 이번 포스팅에서는 Pre-procesing의 네 번째 단계인 이상값 탐지 및 제거 (2) 과정을 이어서 실습 해보려고 합니다 ! 지난 포스팅에서 데이터 전처리 과정이 필요한 이유 중 또 다른 하나인 이상값 ( Outlier ) 에 대해서 알아보면서, 이상값의 첫 번째 탐지 방법 ! Tukey 방법 실습을 진행 해보았는데요 ~ 이번 포스팅에서는 두 번째 탐지 방법 ! Local Outlier Factor 방법을 알아보려고 합니다 ! 지난 시간과 이번 시간 두 시간에 걸쳐서 학습하니만큼 전처리 과정에서 이상값 처리 또한 ★ 매우 중요 ★ 하기 때문에, 지난 포스팅과 이번 포스팅을 꼼꼼하게 비교해보면서 학습하는 것을 추천드립니다 :) https://haewon-world.tistory...

여러분, 안녕하세요~? 이번 포스팅에서는 Pre-processing의 네 번째 단계인 이상값 탐지 및 제거 (1) 과정을 실습 해보려고 합니다 ! 데이터 전처리 과정에서 결측값 ( Missing Value ) 처리와 더불어 가장 중요하게 다뤄야 하는 과정은 무엇일까요~? 바로, 이상값 ( Outlier ) 처리입니다 ! 이상값 ( Outlier ) 이란, 정상 범주에서 크게 벗어난 이상한 값으로 논리적으로 존재할 수 없거나 극단적인 값을 의미합니다. 이러한 이상값은 분석 결과를 왜곡시키고 분석 모델의 성능 저해 문제를 발생시키기 때문에 데이터 분석 전 결측값과 함께 전처리 과정이 반드시 필요한데요 ! ★ 주의사항 ★ 으로는 ! 결측값의 존재 여부를 쉽게 판단 할 수 있었던 것과 달리, 이상값의 존재 여부..
- Total
- Today
- Yesterday
- 데이터 전처리
- 데이터전처리
- 이상값
- 이상값 탐지 및 제거
- 결측치 처리
- 전처리
- Missing Value
- Brightics Studio 실습
- 분석 프로젝트
- Brightics 분석 프로젝트
- 브라이틱스 튜토리얼
- Brightics 서포터즈
- 전파누리
- Pre-processing
- Brightics Studio
- 삼성 SDS 데이터 분석
- Public Wifi
- Brightics AI
- Outlier Detection and Removal
- Brightics Tutorial
- 한국공항공사
- 브라이틱스
- ANOVA
- 전처리 과정
- 결측값 처리
- Brightics 팀 분석 프로젝트
- Brightics 팀미션
- 데이터참쉽조
- Brightics 홍보 UCC
- eda
- 삼성 SDS
- data analysis
- Wifi Free
- Brightics vs R
- Brightics 개인 분석 프로젝트
- mtcars
- 브라이틱스 스튜디오
- 삼성 SDS 데이터 분석 프로젝트
- Brightics 개인미션
- ANOVA 검정
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |