更新時(shí)間:2020-04-23 來源:黑馬程序員 瀏覽量:
隨著互聯(lián)網(wǎng)的高速發(fā)展,被收集并應(yīng)用于分析的數(shù)據(jù)量呈現(xiàn)出爆發(fā)式增長,面對(duì)如此量級(jí)的數(shù)據(jù),以及常見的實(shí)時(shí)利用該數(shù)據(jù)的需求,僅依靠人工處理難免力不從心,這就催生了所謂的大數(shù)據(jù)和機(jī)器學(xué)習(xí)系統(tǒng)。
機(jī)器學(xué)習(xí)是一門多領(lǐng)域的交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科,專門研究計(jì)算機(jī)如何模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。通俗地講,傳統(tǒng)計(jì)算機(jī)工作時(shí)需要接收指令,并按照指令逐步執(zhí)行,最終得到計(jì)算結(jié)果;機(jī)器學(xué)習(xí)是通過某種算法,將歷史數(shù)據(jù)進(jìn)行訓(xùn)練得出某種模型,當(dāng)有新的數(shù)據(jù)提供時(shí),可以使用訓(xùn)練產(chǎn)生的模型對(duì)未來進(jìn)行預(yù)測(cè)。機(jī)器學(xué)習(xí)是一種能夠賦予機(jī)器進(jìn)行自主學(xué)習(xí),不依靠人工進(jìn)行自主判斷的技術(shù),它和人類對(duì)歷史經(jīng)驗(yàn)歸納的過程有著相似之處,接下來,通過圖1和圖2對(duì)機(jī)器學(xué)習(xí)和人類思考過程進(jìn)行對(duì)比。
圖1
圖2
圖1是機(jī)器學(xué)習(xí)的過程,圖2圖則是人類思考的過程。人類在學(xué)習(xí)成長的過程中,積累了很多歷史經(jīng)驗(yàn),將經(jīng)驗(yàn)進(jìn)行歸納總結(jié),得到規(guī)律,因此當(dāng)人類遇到些問題時(shí),總能從事物的發(fā)展規(guī)律找到方向,進(jìn)行推測(cè);而機(jī)器學(xué)習(xí)中的訓(xùn)練和預(yù)測(cè)過程可以近似看作人類的歸納和推測(cè)的過程。從圖1中可以發(fā)現(xiàn),機(jī)器學(xué)習(xí)思想并不復(fù)雜,僅僅是對(duì)人類學(xué)習(xí)成長過程的一個(gè)模擬,由于機(jī)器學(xué)習(xí)不是通過編程的形式得出結(jié)果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出相關(guān)結(jié)論。這也可以聯(lián)想到人類為什么要學(xué)習(xí)歷史,歷史實(shí)際上是人類對(duì)過往經(jīng)驗(yàn)的總結(jié),俗話說“歷史總是驚人的相似”,通過學(xué)習(xí)歷史,可以從中歸納出事物發(fā)展的規(guī)律,從而指導(dǎo)今后的工作。如根據(jù)數(shù)據(jù)類型和需求的不同,建模方式也會(huì)不同。在機(jī)器學(xué)習(xí)領(lǐng)域中,按照學(xué)習(xí)方式分類,可以讓研究人員在建模和算法選擇的時(shí)候,根據(jù)輸入數(shù)據(jù)來選擇合適的算法,從而得到更好的效果,通常機(jī)器學(xué)習(xí)可以分為下面兩類。
(1)有監(jiān)督學(xué)習(xí)。通過已有的訓(xùn)練樣本(即已知數(shù)據(jù)以及其對(duì)應(yīng)的輸出)訓(xùn)練得到一個(gè)最優(yōu)模型,再利用這個(gè)模型將所有的輸入映射為相應(yīng)的輸出,對(duì)輸出進(jìn)行簡(jiǎn)單的判斷從而實(shí)現(xiàn)分類的目的。如分類、回歸和推薦算法都屬于有監(jiān)督學(xué)習(xí)。
(2)無監(jiān)督學(xué)習(xí)。針對(duì)類別未知(沒有被標(biāo)記)的訓(xùn)練樣本,需要直接對(duì)數(shù)據(jù)進(jìn)行建模,人們無法知道要預(yù)測(cè)的答案。如聚類、降維和文本處理的某些特征提取都屬于無監(jiān)督學(xué)習(xí)。
以上我們介紹了“機(jī)器學(xué)習(xí)的相關(guān)知識(shí)”,希望對(duì)您有所幫助,如果想了解更多機(jī)器學(xué)習(xí)相關(guān)知識(shí)可以關(guān)注黑馬程序員大數(shù)據(jù)課程。
猜你喜歡
大數(shù)據(jù)工程師培訓(xùn)課程有哪些內(nèi)容?
大數(shù)據(jù)培訓(xùn)之?dāng)?shù)據(jù)可視化教程
2020-03-22大數(shù)據(jù)工程師培訓(xùn)課程有哪些內(nèi)容?[黑馬程序員]
2019-12-18什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘前景怎么樣?
2019-12-11數(shù)據(jù)挖掘工具有哪些?[2020最新匯總]
2019-12-11數(shù)據(jù)挖掘十大經(jīng)典算法,想從事數(shù)據(jù)挖掘就不得不看
2019-12-11IPv6的時(shí)代已經(jīng)來臨,你對(duì)IPv6了解多少?
2019-12-03