大数据开展至今,大数据处理主要分为两类大的需求,一是批处理,一是流处理。在企业的实践事务场景傍边,可能会只需求批处理或者流处理,也可能一起需求批处理和流处理,这就使得建立大数据体系平台的时候,需求依据具体场景来进行技能选型。
1ãæ¹å¤ç
æ¹å¤çæ¯å¤§æ°æ®å¤çåè¾¹çéåéæ±ï¼æ¹å¤ç主è¦æä½å¤§å®¹ééææ°æ®éï¼å¹¶å¨æ ¸ç®è¿ç¨å®æåè¿åææãé´äºè¿æ ·çå¤ç模å¼ï¼æ¹å¤çæ个ææ¾ç缺ç¹ï¼ä¾¿æ¯é¢å¯¹å¤§è§æ¨¡çæ°æ®ï¼å¨æ ¸ç®å¤ççåçä¸ï¼ä¸å°½å¦äººæã
ç°å¨æ¥è¯´ï¼æ¹å¤çå¨åºå¯¹å¾å¤æä¹ æ°æ®æ¹é¢çä½ç°æ为åºè²ï¼å èç»å¸¸è¢«ç¨äºå¯¹åå²æ°æ®è¿è¡åæã
2ãæµå¤ç
æ¹å¤çä¹ååç°çå¦ä¸ç§éåéæ±ï¼ä¾¿æ¯æµå¤çï¼é对å®æ¶è¿å ¥ä½ç³»çæ°æ®è¿è¡æ ¸ç®æä½ï¼å¤çææ马ä¸å¯ç¨ï¼å¹¶ä¼è·çæ°æ°æ®çæµè¾¾ç»§ç»æ´æ°ã
å¨å®æ¶æ§ä¸ï¼æµå¤çä½ç°ä¼å¼ï¼ä½æ¯æµå¤çåä¸æ¶é´åªè½å¤çä¸æ¡(çæ£çæµå¤ç)æå¾å°æ°(å¾®æ¹å¤çï¼Micro-batch Processing)æ°æ®ï¼ä¸åè®°å½é´åªç»´ææå°æ°çç¶åµï¼å¯¹ç¡¬ä»¶çè¦æ±ä¹è¦æ´é«ã
3ãæ¹å¤ç+æµå¤ç
å¨å®è·µç使ç¨åè¾¹ï¼æ¹å¤çåæµå¤çä¸èµ·åå¨çåºæ¯ä¹å¾å¤ï¼æ··åå¤çæ¡æ¶å°±æ¨å¨å¤çè¿ç±»é®é¢ãä¾ç»ä¸ç§æ°æ®å¤ççéç¨å¤çæ¹æ¡ï¼ä¸ä» å¯ä»¥ä¾ç»å¤çæ°æ®æéçåæ³ï¼ä¸èµ·ä¾ç»èªå·±çéæ项ãåºãä¸è¥¿ï¼å¯æ»¡è¶³å¾å½¢åæãæºå¨å¦ä¹ ã交äºå¼æ¥è¯¢çå¤ç§åºæ¯ã
å ³äºå¤§æ°æ®å¸¸ç¨å¤çæ¡æ¶æåªäºï¼éè¤å°ç¼å°±åæ¨å享å°è¿éäºãå¦ææ¨å¯¹å¤§æ°æ®å·¥ç¨ææµåçå ´è¶£ï¼å¸æè¿ç¯æç« å¯ä»¥ä¸ºæ¨æä¾å¸®å©ãå¦ææ¨è¿æ³äºè§£æ´å¤å ³äºæ°æ®åæå¸ã大æ°æ®å·¥ç¨å¸çæå·§åç´ æçå 容ï¼å¯ä»¥ç¹å»æ¬ç«çå ¶ä»æç« è¿è¡å¦ä¹ ã