本站分享:大数据、数据分析师考试认证培训,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训广告位

什么是数据挖掘一个良好的分类准确度?

数据挖掘 cdadata 804℃

什么是数据挖掘一个良好的分类准确度?

有什么好问题!或者我应该说什么不好的问题。事实上,这个问题是不是一个很好的,因为如果我们要求它这样,我们可以期待一个答案是有效的任何数据挖掘问题。这当然是不可能的。这个问题可以通过数据挖掘来问,因为它是衡量数据挖掘算法的质量的一种方式。事实上,你可以通过估计测试集的分类率估计有多好您的决策树神经网络。我在这篇文章中的一点是要强调分类百分比取决于在数据挖掘中使用的应用程序的事实。

让我来解释一下,从我自己的经验的几个例子。我有一个朋友在人脸识别领域工作。据他介绍,当你得到例如97%以上,分类准确度的算法(在他的情况下,机器学习)是较好的拟合的问题。这可能是真实的,但只有在他的领域,这是人脸识别。在这一领域,应用机器学习图片识别人脸。在这种情况下,没有外界影响或可能影响的输出(你预测的类),这是不存在于图像的像素的变量。因此,一个非常高的分类准确率能达到。不要误会我的意思,我不是说人脸识别是一件容易的事,而与正确的算法和正确的数据准备,非常高的识别率可以达到。

让我们再应用:预测用户点击某个给定的广告。这是目前应用我的工作与FinWEB项目。在这种情况下,大多数的我的模型达到约70%的分类精度。是坏?那么,根据应用领域,不是真的。当我们预测,如果用户将点击或不能在广告中,我们并没有在我们掌握的所有可能的信息。我们只具有表示在给定的时间帧他的行为的一些数据。我们没有在数据库中的所有用户的大脑。有这么多的影响因素,它是相当满意的,达到70%的比例划分。

最后,我将在金融数据挖掘的例子。当应用数据挖掘选股的问题,我获得了55-60%的分类精度范围。虽然它看起来是一个贫穷的结果,它不是。我们应该考虑所有的影响因素,可以影响股票的价格。虽然我们可能会使用几百个输入参数,它们可能只是代表可能影响股票价格的所有信息的比例很小。这是从脸部识别的情况下与限定每个像素很远。

我在这个岗位一点是表明没有明确回答这个问题,这其实不是一个好。分类精度主要取决于应用领域。随时通过评论这篇文章来分享自己的经验!

转载请注明:数据分析 » 什么是数据挖掘一个良好的分类准确度?

喜欢 (0)or分享 (0)