반응형 Correlation2 Interestingness Measure: Correlation Lift * Measure of dependent/correlated events: lift 1) Statistiacal independence P(S∩B) = P(S) x P(B) => Statistically independence P(S∩B) > P(S) x P(B) => Postively correlated P(S∩B) Negatively correlated 2) lift : interestingness measure: (interesting = reasonable 정도로 이해하면 될 것 같다) - if the lift is equal to 1, then A and B are independent and there is no correlation between them. A⊥.. 2024. 3. 25. Data integration * Data integration : Combines data from multiple sources into a coherent dataset - Entity indentification problem : 실제로는 동일한 데이터이나 각각의 소스로부터 다른 방식으로 표현되어 있는 것을 어떻게 합칠 것인가? - 여러 데이터 베이스에서 수집한 자료를 합칠 때 Redundant data 의 문제는 일어나기 마련이다. : Redundant attributes may be able to be detected by correlation analysis and covariance analysis - Correlation Analysis (Nominal Data) 1) 카이스퀘어 검정, chi-square test .. 2024. 3. 5. 이전 1 다음 반응형