정성적 데이터와 정량적 데이터
데이터 분석과 연구에서 정성적 데이터와 정량적 데이터는 기본적인 개념이자 중요한 도구입니다. 이 글에서는 두 데이터 유형의 정의, 차이점, 그리고 각각의 장단점과 활용 사례를 살펴보겠습니다.1. 정성적 데이터란?정성적 데이터(Qualitative Data)는 숫자로 표현되지 않는 데이터를 말합니다. 이러한 데이터는 보통 사람들의 감정, 경험, 의견과 같이 질적인 특성을 나타냅니다. 주로 텍스트, 이미지, 음성, 비디오 등의 형태로 나타나며, 해석적 접근이 필요합니다.특징:주관성: 정성적 데이터는 연구자의 관점이나 해석에 따라 분석 결과가 달라질 수 있습니다.심층적 통찰 제공: 사람들의 생각, 동기, 행동의 배경을 깊이 이해하는 데 유용합니다.예시:인터뷰에서 얻은 응답소셜 미디어 댓글관찰 기록하위 분류:내..
2025. 1. 7.
Data preprocessing
Data preprocessing 1) data cleaning : 누락 데이터 채우기, 노이즈 제거 , 아웃라이어 제거, inconsistency 수정 - Noisy Data : random error or variance in a measured variable => "SMOOTH" by Binning First, sort data and partition into (equal-frequency) bins then can smooth by bin means, bin median or bin boundaries : also can smooth by Regression, Clustering, Combined computer and human inspection ex) 다음 데이터(4,8,15,21,21..
2024. 3. 5.