網頁內容擷取

By
資料科學年會
黑客松
Splunk Live


資料科學家三項技能樹:資訊、數學、統計

BIg Data的5V

Volumne
Velocity
Variety
Veracity
Value

Crawler - facebook

Type A 直接從該平台或網站擷取資料
Type B 透過XML, CSV, API方式,以Crawler方式存取資料。

Type A cases: facebook, 104, PChome, Chunghwa Telecom, 591
Type B cases: Search Engine(Goolge, Yahoo)


0 意見:

張貼留言