我是做JAVA的,最近遇到这样的事情,搞不清楚。有搞过的同学麻烦给解答下。我想问的是实际在企业中做的时候要做的事情,而不是理论。理论看了一大堆,但是不知道如果在企业中要做什么,做出来是什么。
比如,我现在有个数据库,是数据源,里面各种信息。现在确定了需要解决的问题,那么我如何开始做数据挖掘?
比如建立模型,是干嘛的,要做什么工作,用什么工具建,要写代码吗?
整个流程不懂,具体细节,哪些用工具,哪些写代码用工具执行。。
最好是做过这方面的,详细具体的说说 每个环节到底做什么,用什么做,做出什么结果
数据挖掘的主要任务有:
关联分析
两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。
聚类分析
聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。
分类
分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。
预测
预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。
时序模式
时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。
偏差分析
在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。
对用户的年龄和消费水平进行收集
对用户的行为特性进行了解
对用户搜索行为习惯进行观察
对用户信息反馈进行整理
对用户需求和自身优势进行相结合
数据挖掘怎么做啊什么是数据挖掘
1、数据挖掘通常需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示8个步骤。2、数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模...
数据挖掘的基本过程
数据挖掘的基本过程?(1)数据清理:对噪声数据和不一致的数据做铲除操作。或者是对重复数据做删除,或者是对缺失数据做填充(众数、中位数、自己判断)。(2)数据集成:将多个数据源的数据做整合。(3)数据选择:选择需要的数据做发掘。比如一个人买不买电脑和他叫什么没什么联系,所以就不需要输入到机器...
数据挖掘的基本步骤是什么
建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。3、分析数据 分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗...
数据挖掘工程师是干什么的
数据挖掘工程师的职责:1、根据自己对行业,以及公司业务的了解,独自承担复杂分析任务,并形成分析报告;2、相关分析方向包括:用户行为分析、广告点击分析,业务逻辑相关以及竞争环境相关;3、根据业务逻辑变化,设计相应分析模型并支持业务分析工作开展。数据挖掘,从字面上理解,就是在数据中找到有用的东西...
数据挖掘是做什么的
数据挖掘是应用计算机技术从大数据中提取有价值信息,生成利于决策的模型和规律。方法包括分类、聚类、关联分析、异常检测与预测。其中,分类是数据分组,聚类则按相似性归类,关联分析发现事物间联系,异常检测识别异常事件,预测则预测未知数据。数据挖掘课程内容涉及数据预处理、特征选择、数据规约、分类与聚类...
数据挖掘是做什么的
数据挖掘的作用 数据挖掘可以帮助企业做出决策、规划生产和供应链、制定市场策略等。例如,基于过去的销售数据,可以使用数据挖掘技术预测未来几个季度的销售趋势,以便调整库存和生产计划。此外,数据挖掘还可用于群体分析和个性化推荐。通过对用户数据的挖掘,可以将用户分为不同的群体,了解他们的兴趣、偏好和...
数据挖掘是做什么的
数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘能做以下七种不同事情:· 分类 (Classification)· 估计(Estimation)· 预测(...
数据挖掘工程师一般都做什么
数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了。最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步,可以基于用户的浏览、点击、收藏、购买等行为推断用户的年龄、性别、购买能力、爱好等能表示一个人...
什么叫数据挖掘?
(3)模糊的和随机的数据挖掘是模糊的和随机的。这里的模糊可以和不准确性相关联。由于数据不准确导致只能在大体上对数据进行一个整体的观察,或者由于涉及到隐私信息无法获知到具体的一些内容,这个时候如果想要做相关的分析操作,就只能在大体上做一些分析,无法精确进行判断。而数据的随机性有两个解释,...
什么是数据挖掘?
(3)模糊的和随机的数据挖掘是模糊的和随机的。这里的模糊可以和不准确性相关联。由于数据不准确导致只能在大体上对数据进行一个整体的观察,或者由于涉及到隐私信息无法获知到具体的一些内容,这个时候如果想要做相关的分析操作,就只能在大体上做一些分析,无法精确进行判断。而数据的随机性有两个解释,...