第1个回答 2019-11-08
大数据时代的数据的特点就是量大,质量一般,计算资源需要的多,所以做数据挖掘工作时,要注意一下几点:
1. 量大如果只是数据行数多,还好处理,如果特征太多,就需要降维处理了,所以要掌握各种降维方法,像主成分提取这样的
2. 大数据时代数据收集的是多,但是很多很乱很杂,需要大量的ETL处理,所以需要较强的ETL能力
3. 大数据的计算一般是要调用集群资源的,使用分布式计算,所以需要分析人员能够写脚本调用集群资源,像怎么写spark程序
亿信华辰豌豆DM可视化数据挖掘平台深入洞察企业数据规律,充分挖掘数据潜在价值,多维度深度分析更精准。