更新時間:2021-03-12 來源:黑馬程序員 瀏覽量:
在數(shù)據(jù)科學應用中,數(shù)據(jù)工程師可以利用Spark進行數(shù)據(jù)分析與建模,由于Spark具有良好的易用性,數(shù)據(jù)工程師只需要具備一定的SQL語言基礎、統(tǒng)計學、機器學習等方面的經驗,以及使用Python、Matlab或者R語言的基礎編程能力,就可以使用Spark進行上述工作。
在數(shù)據(jù)處理應用中,大數(shù)據(jù)工程師將Spark技術應用于廣告、報表、推薦系統(tǒng)等業(yè)務中,在廣告業(yè)務中,利用Spark系統(tǒng)進行應用分析、效果分析、定向優(yōu)化等業(yè)務,在推薦系統(tǒng)業(yè)務中,利用Spark內置機器學習算法訓練模型數(shù)據(jù),進行個性化推薦及熱點點擊分析等業(yè)務。
Spark擁有完整而強大的技術棧,如今已吸引了國內外各大公司的研發(fā)與使用,淘寶技術團隊使用Spark來解決多次迭代的機器學習算法、高計算復雜度的算法等,應用于商品推薦、社區(qū)發(fā)現(xiàn)等功能。騰訊大數(shù)據(jù)精準推薦借助Spark快速迭代的優(yōu)勢,實現(xiàn)了在“數(shù)據(jù)實時采集、算法實時訓練、系統(tǒng)實時預測”的全流程實時并行高維算法,最終成功應用于廣點通投放系統(tǒng)上。優(yōu)酷土豆則將Spark應用于視頻推薦(圖計算)、廣告等業(yè)務的研發(fā)與拓展,相信在將來,Spark會在更多的應用場景中發(fā)揮重要作用。
猜你喜歡:
實時計算Spark Streaming工作原理是什么?