hi, 您好。
首先,数据获取分两大类,数据交换购买以及
数据采集。
数据采集主要又分两大类:
自产(SDK采集、
埋点)
API采集
SDK采集,核心是提供服务,在基于服务顺带采集部分数据。例如MobTech的ShareSDK,初衷是为了解决分享以及授权登录的功能,然后才是采集数据。这里的难点是思维上的转变以及数据获取上的壁垒攻克。
埋点其实和SDK采集类似,当前其实更趋向无埋点。
爬虫,也即是API采集。根据自己
数据仓库需要去请求外部的API。例如基站定位查询、IP查询、微博舆情等等。爬虫的学问也挺多,爬虫Robots协议、反爬虫、投毒等等。
个人建议根据最小可行性方案,然后再去考虑是数据采集还是数据交换购买,再以此制定一些方案等。
Thx本回答被提问者采纳