ECLAT: Frequent Pattern Mining with Vertical Data Format
* 기존의 Tid 순으로 표현했던 것을 각각의 아이템별로 Tid list 를 표현해낸다.
- (K+1) 의 itemset 의 후보가 되려면 모든 K-item subset 이 frequent 해야한다.
- Apriori 와는 달리 1) support 를 계산 하는데 짧은 시간이 걸린다. 2) 교집합을 찾기가 쉽다.
하지만 intermediate Tid 리스트가 너무 많은 메모리를 차지 할 수 있다.
ex) minimum support count = 2
반응형
'산업공학 > Data Analytics' 카테고리의 다른 글
Data Set, attributes (0) | 2024.03.25 |
---|---|
Interestingness Measure: Correlation Lift (0) | 2024.03.25 |
Data transformation (1) | 2024.03.05 |
Data integration (0) | 2024.03.05 |
Data preprocessing (0) | 2024.03.05 |