本站分享:大数据、数据分析师考试认证培训,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训广告位

大数据挖掘到底能干什么_数据挖掘是干什么的

数据挖掘 cdadata 408℃ 0评论

大数据挖掘到底能干什么

关键词:数据挖掘是干什么的,数据挖掘实习在干什么,数据挖掘技术

数据挖掘有很多精彩的故事,但是大数据挖掘对于你来说能有啥作用,一直是一个令人困惑的话题,亦如前面提到的o2o,很好的思想,宏观指导挺起来都对,怎么下手做怎么在业务模型里用到,具体到自己的业务体系就是不好下手和无所适从。在自己的业务体系里通过这些技术和思想,来扩大用户价值攫取商业利益,这是个细致活。【回复“o2o”“o2o沙龙”可获取此前关于o2o的一些思考和相关文章】

我所知道的国内较早使用大数据挖掘形成形成业务模型优化的应该是中国移动,若干年前,刘德寰老师给我们公司做培训交流时候提到的,通过对客户性别、年龄、通话呼入呼出时长、月均话费、缴费方式、呼叫类型等上百个变量进行统计分析,建立起客户平均消费模型,从而指导建立不同级别的套餐定价、促销策略和新品开发,扩大单个用户ARPU。

那么对你的业务来说,是否需要大数据挖掘?如果你的数据存储量非常大,结构比较复杂,你需要整合应用,你可能需要数据挖掘;如果你的数据比较零散,而数据的关联调用非常困难,且数据结构化程度不高,你可能需要大数据挖掘技术。如果你的数据挖掘和多维度分析的计算能力要求高,算法和过程很复杂,也可能会需要大数据挖掘技术。

数据挖掘能干什么?这个显然跟你的业务有关系,你的业务需要不需要,哪里需要,需要干什么,希望投入什么样的成本,产出什么样的结果,这是决定你要不要做以及怎么做的一个基本考虑。这两年的做的几个项目都跟大数据挖掘有关,谈谈自己的对大数据挖掘的认识。大数据的核心是对数据的应用,之所以用大数据,就是希望通过数据分析处理,来更精准地把握用户、客户行为和更好地挖掘信息的价值,提升业务的利润和控制成本。

1 大数据挖掘可以让杂乱无序的数据清晰化可用度高
大数据有两个典型特征,其一是数据量大,其二是计算复杂。与传统数据库相比,大数据的结构化程度、可用度、数据抽取、数据清洗都是很大的一块工作。

特别典型的传统生产销售型企业的业务系统数据是隔离、分裂的,销售的、生产的、财务的、客户的等等,不同方面其实都是为自己负责的业务目标的和输出构建自己的IT系统、甚至是外包给不同的IT集成商或者软件开发商做的,因而系统都是相对独立,这种独立的结果不只是隔离,而是从数据的结构、数据的记录与存储、软件系统负载等产品技术层面都是不尽相同。数据挖掘需要根据你的目标构建挖掘模型,建立起多个数据系统的关联。

2 让数据和数据之间发生关系,这关系可能产生化学反应
著名的啤酒与尿布、口香糖与避孕套的例子就是典型的数据之间隐性关系的发现,通过对消费行为的数据进行建模和分析,能够发现从事理上,这两个原本不相干的东西,在用户采购东西的时候发生了关系,那么针对这一发现优化你的货架物品摆放就能够提高销售量。

用户亚马逊的朋友可能都看到过,买个手机马上推荐跟手机壳、存储卡打包购买有折扣哦。当然也有傻傻的推荐策略,比如淘宝,你买一个移动电源,他马上推一堆其他的移动电源,告诉你还有更便宜的哦,这玩意儿又不是包子,消费了就没有,不可能这么短的周期如此频繁的消费同类产品。当然,如果这个策略放在阿里巴巴则是很好的策略,对于批量采购行为,这种推荐很能节省用户的成本。

3 对数据产生态进行监控发现异常,预警纠错
通过对系统产生的数据的按照时间建模,记录每个时间点、时间周期内的均值和上下区间,如果某个节点出现超乎寻常的状况,系统能很快发现问题并进行预警和排查。当然这只是技术系统的价值。

从业务系统上,这种数据异常将会给你的经营状况给予警示,帮你从历史时间维度的对比,判断事情变化的因由,提供你决策分析必要的时间、数据和关联信息参考。

4 通过数据挖掘建立知识模型,提供决策支持信息
IT系统在发挥更大的价值在于能通过信息的整合,帮你提供决策参考信息。以前有一个提法叫做知识发现KDD,随着互联网信息内容的丰富、UGC分众智慧的发挥,网络信息的价值效用也越来越大。通过信息存在和信息特征提取,建立起不同信息之间的关联,并能通过语义分析、情感分析,提炼出信息本身的价值倾向、态度、消费效用等,这将为信息在决策参考上提供更系统、数据化的分析和参考。

5 强大的数据处理和分析能够建立以数据驱动的垂直商业生态
数据挖掘的技术系统将负责将所有数据,按照目标重新梳理和建立跟模型对应的数据索引。这个重新构建的数据的秩序将大大增加增加数据的可用性。从垂直行业切入,针对这行业信息服务的需求,建立模型,并不断优化各个细节和子节点的输出,使得行业参与的各较色能在生态上获取自己的利益和价值,那么这将建立起针对这个细分行业的垂直业务生态。

我们身边已经有很多大数据的应用,比如电商购物对用户做推荐,基于用户群和用户行为的分类做精准的广告投放等,亦或计算气象预报,计算地质数据做石油探测、矿产探测,还有金融行业对投资、贷款等的风险预估。

跟大数据挖掘相关的主要技术有数据存储、数据挖掘的分布式计算平台,结构化存储,计算任务管理和调度等,所以一般性的大数据挖掘项目都跟云计算、云存储和自动运维系统密切相关,需要一定投入才能搞得定。


数据挖掘是做什么的?

数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。
数据挖掘能做以下七种不同事情:
· 分类 (Classification)
· 估计(Estimation)
· 预测(Prediction)
· 相关性分组或关联规则(Affinity grouping or association rules)
· 聚类(Clustering)
· 描述和可视化(Description and Visualization)
· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)

转载请注明:数据分析 » 大数据挖掘到底能干什么_数据挖掘是干什么的

喜欢 (0)or分享 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址