本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

数据采样的关联规则挖掘_数据挖掘中的关联规则

数据挖掘 cdadata 3020℃

数据采样的关联规则挖掘_数据挖掘中的关联规则

在某些情况下,数据矿工有施加任何算法之前的数据集上执行采样。主要原因是过多的数据开采。在这种情况下,一个可行的方法是随机抽样。如果类是均匀分布的,人们可以监督学习前用随机抽样。

但对于关联规则挖掘?如果使用随机抽样的关联规则算法之前,你可能会发现没有规则。其原因是关联规则挖掘分析数据作为交易。这样做是为了找到复发的趋势的一组通常是连续的交易。下面是一个例子:

交易ID /产品
112 /面包
112 /黄油
112 /果酱
113 /奶酪
113 /面包
...

用随机抽样的问题是,它不会考虑到事件的连续序列。在关联规则的情况下,应采取的数据的连续子集,以获得有意义的规则。

你有在那里的随机取样不能用于任何其他实施例?与关联规则挖掘的其他问题?随意对这个职位发表评论。

转载请注明:数据分析 » 数据采样的关联规则挖掘_数据挖掘中的关联规则

喜欢 (0)or分享 (0)