数据挖掘具体要做什么?

我是做JAVA的,最近遇到这样的事情,搞不清楚。有搞过的同学麻烦给解答下。我想问的是实际在企业中做的时候要做的事情,而不是理论。理论看了一大堆,但是不知道如果在企业中要做什么,做出来是什么。

比如,我现在有个数据库,是数据源,里面各种信息。现在确定了需要解决的问题,那么我如何开始做数据挖掘?

比如建立模型,是干嘛的,要做什么工作,用什么工具建,要写代码吗?

整个流程不懂,具体细节,哪些用工具,哪些写代码用工具执行。。

最好是做过这方面的,详细具体的说说 每个环节到底做什么,用什么做,做出什么结果

数据挖掘是一个很大的方面。你会java,这个很好。可以从weka 这个工具学起来,他是一个java写的工具包。对于一个具体问题,比如,怎么获取测试数据,对于数据怎么预处理,这些weka都有直接的接口。
至于你说的建模,不是一句话可以说清楚,首先你肯定要调查这个领域做得比较好的有哪些方法,然后从中至少选取几种方法,都要实现,做统计,归纳结果,选择符合你数据集的。当然你的数据集合一定要有代表性,就是国际认可的,至于怎么找到这些数据,一般都是比较出名的论文引用的,这些就很可以。用的工具当然有很多,你不能局限于一种方式或者一种工具,不同情况下用不同的工具,根据实际需要选择。比如你要做聚类,你选择一个weka,做神经元,你可能会倾向于matlab,实际情况决定你选择的工具。
流程方面:数据获取------数据预处理-----完成预定的任务 这是一个大概的流程。这一套都可以用weka实现。对于数据挖掘而言,都是80%数据+20%算法,数据很重要,算法其实只是一个测试数据集的作用,这是一点看法,希望对你有帮助。
温馨提示:内容为网友见解,仅供参考
第1个回答  2021-09-17
数据挖掘的用处有很多,在这里我只想从技术和应用两个层面来简单谈谈。

1、从技术层面来说,按照数据挖掘产出的知识可以粗分为两大类:描述型挖掘和预测型挖掘。

描述型挖掘是对现有数据的进一步精炼和归纳,从中抽取中更宏观的反映数 据特征的概念描述。举个例子来说,某家银行有几百万客户,数据仓库中存储了每个客户的人口统计信息、账户信息、交易信息、客服联络信息等详细数据。但是银 行不可能清楚地了解每位客户是什么样的客户,客户的消费模式到底是怎样的?这时一般需要把全体客户进行细分,划分为几个客户群,而且这种划分可以保证具有 相似行为、相似价值的客户会被放入同一个群组中。有了这些客户群,银行就能更容易地发现营销机会并制定营销战略。这个例子中所用的挖掘技术是聚类模型,它 就是一种典型的描述型挖掘。

预测型挖掘,顾名思义,就是建立的挖掘模型具备预测能力。这种预测能力可能包括预测哪些客户下个月会流失,哪些客户对促销活动会积极响应,哪些客户的未来价值会成长以及成长多少等等。预测型挖掘常常对企业运营具有更强的指导作用,从而更快地见效。

2、从应用层面来说,数据挖掘可以应用到很多行业中,包括电信、银行、证券、保险、制造、因特网等等。

抛开具体行业的特定应用不谈,在各个行业中一般都会把数据挖掘应用在客户关系管理(CRM)之中。在CRM中的数据挖掘应用,包括客户细分、客户价值分析、客户获取、客户保持、交叉销售和提升销售等等。此外,信用评分、欺诈侦测和文本挖掘等也是常见的应用。
第2个回答  2020-12-03

数据挖掘的主要任务有:

    关联分析

    两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。

    聚类分析

    聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。

    分类

    分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。

    预测

    预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。

    时序模式

    时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。

    偏差分析

    在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。

第3个回答  推荐于2017-09-27

    对用户的年龄和消费水平进行收集

    对用户的行为特性进行了解

    对用户搜索行为习惯进行观察

    对用户信息反馈进行整理

    对用户需求和自身优势进行相结合

第4个回答  2013-07-18
就是将数据经过抽取、转换、加载到数据仓库 然后根据一定的指标分析、挖掘出可用的、有价值东西;

数据挖掘怎么做啊什么是数据挖掘
1、数据挖掘通常需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示8个步骤。2、数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模...

数据挖掘的基本过程
数据挖掘的基本过程?(1)数据清理:对噪声数据和不一致的数据做铲除操作。或者是对重复数据做删除,或者是对缺失数据做填充(众数、中位数、自己判断)。(2)数据集成:将多个数据源的数据做整合。(3)数据选择:选择需要的数据做发掘。比如一个人买不买电脑和他叫什么没什么联系,所以就不需要输入到机器...

数据挖掘的基本步骤是什么
建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。3、分析数据 分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗...

数据挖掘工程师是干什么的
数据挖掘工程师的职责:1、根据自己对行业,以及公司业务的了解,独自承担复杂分析任务,并形成分析报告;2、相关分析方向包括:用户行为分析、广告点击分析,业务逻辑相关以及竞争环境相关;3、根据业务逻辑变化,设计相应分析模型并支持业务分析工作开展。数据挖掘,从字面上理解,就是在数据中找到有用的东西...

数据挖掘是做什么的
数据挖掘是应用计算机技术从大数据中提取有价值信息,生成利于决策的模型和规律。方法包括分类、聚类、关联分析、异常检测与预测。其中,分类是数据分组,聚类则按相似性归类,关联分析发现事物间联系,异常检测识别异常事件,预测则预测未知数据。数据挖掘课程内容涉及数据预处理、特征选择、数据规约、分类与聚类...

数据挖掘是做什么的
数据挖掘的作用 数据挖掘可以帮助企业做出决策、规划生产和供应链、制定市场策略等。例如,基于过去的销售数据,可以使用数据挖掘技术预测未来几个季度的销售趋势,以便调整库存和生产计划。此外,数据挖掘还可用于群体分析和个性化推荐。通过对用户数据的挖掘,可以将用户分为不同的群体,了解他们的兴趣、偏好和...

数据挖掘是做什么的
数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘能做以下七种不同事情:· 分类 (Classification)· 估计(Estimation)· 预测(...

数据挖掘工程师一般都做什么
数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了。最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步,可以基于用户的浏览、点击、收藏、购买等行为推断用户的年龄、性别、购买能力、爱好等能表示一个人...

什么叫数据挖掘?
(3)模糊的和随机的数据挖掘是模糊的和随机的。这里的模糊可以和不准确性相关联。由于数据不准确导致只能在大体上对数据进行一个整体的观察,或者由于涉及到隐私信息无法获知到具体的一些内容,这个时候如果想要做相关的分析操作,就只能在大体上做一些分析,无法精确进行判断。而数据的随机性有两个解释,...

什么是数据挖掘?
(3)模糊的和随机的数据挖掘是模糊的和随机的。这里的模糊可以和不准确性相关联。由于数据不准确导致只能在大体上对数据进行一个整体的观察,或者由于涉及到隐私信息无法获知到具体的一些内容,这个时候如果想要做相关的分析操作,就只能在大体上做一些分析,无法精确进行判断。而数据的随机性有两个解释,...

相似回答