更新時間:2023-03-24 來源:黑馬程序員 瀏覽量:
我們通常所說的數(shù)據(jù)可視化是指狹義的數(shù)據(jù)可視化,即將數(shù)據(jù)以圖表的方式進行呈現(xiàn),常見于PPT、報表、新聞等場景。圖表是數(shù)據(jù)可視化最基礎(chǔ)的應(yīng)用,它代表圖形化的數(shù)據(jù),通常以所用的圖形符號命名,例如使用圓形符號的餅圖、使用線條符號的折線圖等。下面介紹一些常見的圖表,并結(jié)合一些應(yīng)用場景給出圖表示例。
折線圖是將數(shù)據(jù)標注成點,并通過直線將這些點按某種順序連接而成的圖表,它以折線的方式形象地反映事物沿某個維度的變化趨勢,能夠清晰地展示數(shù)據(jù)增減的趨勢、速率、規(guī)律及峰值等特征。折線圖一般將時間序列作為x軸的數(shù)據(jù),將時間序列對應(yīng)的數(shù)值作為y軸的數(shù)據(jù),適用于反映具有固定時間間隔的數(shù)據(jù)的變化趨勢的場景,例如股票分析、天氣預(yù)報等。例如,??谑?月23-29日的最高氣溫和最低氣溫的變化情況如圖1-4所示。
圖1 ??谑?月23-29日的最高氣虛和最低氣溫的變化情況
柱形圖是由一系列寬度相等的縱向矩形條組成的圖表,它利用矩形條的高度表示數(shù)值,以此反映不同分類數(shù)據(jù)之間的差異。械形圖一般將分類作為x軸的數(shù)據(jù),將各分類對應(yīng)的值作為y軸的數(shù)據(jù),適用于中小規(guī)模數(shù)掘集的各分類之間比較的場景。例如,2015-2018年阿里巴巴公司的營業(yè)收入情況如圖2所示。
圖2 2015一2018年阿里巴巴公司的營業(yè)收入情況
條形圖是橫置的柱形圖,由一系列高度相等、長短不一的橫向矩形條組成。與柱形圖相比,條形圖更適用于矩形條數(shù)量較多的場合,但一般建議矩形條的數(shù)量不超過30個。例如,2019年上半年快手用戶對各類商品廣告的關(guān)注率如圖3所示。
圖3 2019年上半年快手用戶對各類商品戶告的關(guān)注率
堆積圖分為堆積面積圖、堆積柱形圖和堆積條形圖。其中堆積面積圖是由若干折線與折線或水平坐標軸之間的填充區(qū)域組成的圖表,它的最大區(qū)域是一個代表所有數(shù)據(jù)總和的整體,堆積的各區(qū)域代表各組數(shù)據(jù),用于反映整體與部分的關(guān)系:堆積柱形圖和堆積條形圖是由若干個以顏色或線條填充、高度不一的縱向矩形條或橫向矩形條堆疊而成的圖表,用于反映每個構(gòu)成部分在總體中的比重。例如,2017年全球及各地區(qū)一次性能源的消費結(jié)構(gòu)如圖4所示。
圖4 2017年全球及各地區(qū)一次性能源的消費結(jié)構(gòu)
直方圖又稱質(zhì)量分布圖,是由一系列高低不等的縱向矩形條或線段組成的圖表,用于反映數(shù)據(jù)的分布和波動情況。直方圖通常將連續(xù)型數(shù)據(jù)分割成若干個不重疊的值范圍分段,以此作為x軸的數(shù)據(jù),將每個范圍分段中統(tǒng)計的值頻率作為y軸的數(shù)據(jù),適用于了解產(chǎn)品質(zhì)量的分布規(guī)律、估算施工過程中的不合格率等工程領(lǐng)域,或者識別人臉特征的人工智能領(lǐng)域。例如,某廠商對100個抽樣產(chǎn)品的質(zhì)量級別評定情況如圖5所示。
圖5 某廠商對100個抽樣產(chǎn)品的質(zhì)量級別評定
注意:
柱形圖與直方圖展示的效果非常相似,但兩者又所不同,主要區(qū)別為:
(1)柱形圖用于展示離散型數(shù)據(jù)(記錄不同類別的數(shù)據(jù))的分布,而直方圖用于展示連續(xù)型數(shù)據(jù)(一定區(qū)間內(nèi)連續(xù)數(shù)值所組成的數(shù)提)的分布;
(2)柱形圖的各矩形條之間具有固定的間驚,而直方圖的各矩形條之間沒有任何間隙。
箱形圖又稱盒須圖、箱線圖,是令種利用數(shù)據(jù)中的5個統(tǒng)計量(最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)和最大值錨述數(shù)據(jù)的圖表,主要用于反映一組或多組數(shù)據(jù)的對稱性、分布程度等信息,因形狀如箱子而得名。箱形圖能夠識別異常值、判斷偏態(tài)與尾重、比較數(shù)據(jù)形狀,適用于品質(zhì)管理的場景。例如,不同廠家所產(chǎn)地毯的耐用性比較如圖6所示。
圖6 不同廠家所產(chǎn)地毯的耐用性
圖6中4個圖形從左到右依次代表廠家1、廠家2、廠家3和廠家4所產(chǎn)的地毯。由圖6可知,每個圖形的結(jié)構(gòu)相同,包括一個矩形箱體、上下兩條豎線、上下兩條橫線,其中箱體代表數(shù)據(jù)的集中范圍,上下兩條豎線分別代表數(shù)據(jù)向上和向下的延伸范圍,上下兩條橫線分別代表最大值和最小值。若數(shù)據(jù)中存在異常值(也稱為離群值),則會以圓圈的形式顯示到圖中橫線上方或下方。為了便于理解,下面通過圖7來描述箱形的結(jié)構(gòu)及異常值。
圖7 箱形的結(jié)構(gòu)及異常值
餅圖是由若干個面積大小不一、以條形或顏色填的扇形組成的圓形圖表,它使用圓表示數(shù)據(jù)的總量,組成圓的每個扇形表示數(shù)據(jù)中各項占總量的比例大小,主要用于顯示數(shù)據(jù)中各項大小與各項總和的比例。餅圖中的圓與扇形分別代表整體與部分,可以形象地展示數(shù)據(jù)整體與各項數(shù)據(jù)的關(guān)系,適用于快速了解整體數(shù)據(jù)中各項數(shù)據(jù)分配情況的場景。例如,2018年全國居民的人均消費支出情況如圖11新示。
圖8 2018年全國居民的人均消費支出情況
值得一提的是,圓環(huán)圖也能顯示各項與整體之間的關(guān)系,它使用圓環(huán)表示整體,組成圓環(huán)的每個楔形表示各項的占比,外形像空心的圓餅。與餅圖相比,圓環(huán)圖可以展示多組數(shù)據(jù)的比例,但并不容易被人們理解,很多時候可以用堆積柱形圖或堆積條形圖替代。
散點圖又稱X-Y圖,是由若干個數(shù)據(jù)點組成的圖表,主要用于判斷兩變量之間是否存在某種關(guān)聯(lián),或者總結(jié)數(shù)據(jù)點的分布模式。散點圖中數(shù)據(jù)點的分布情況可以體現(xiàn)變量之間的相關(guān)性:若所有的數(shù)據(jù)點在一條直線附近呈波動趨勢,說明變量之間是線性相關(guān)的;若數(shù)據(jù)點在曲線附近呈波動趨勢,說明變量之間是非線性相關(guān)的:若數(shù)據(jù)點沒有顯示任何關(guān)系,說明變量之間是不相關(guān)的,常見于分析兩變量相關(guān)性的場景。例如,股票回報率與基金回報率的投資分析情限如圖8所示。
圖9 股票回報率與基金回報半的投資分析情況
氣泡圖是散點圖的變形,它是一和能夠展示多變量關(guān)系的圖表。氣泡圖一般使用兩個變量標注氣泡在坐標系中的位置,使用3個變量標注氣泡的面積,適用于分類數(shù)據(jù)對比、多變量相關(guān)性等情況,常見于財數(shù)據(jù)分析中。例如,第1梯隊和第2梯隊主流App用戶量與上線時間的分布情況如圖10所示。
圖10 第1梯隊和第2梯隊主流App用戶量與上線時間的分布情況
值得一提的是,氣泡圖中過多的氣泡會增加圖表的閱讀難度,因此氣泡的數(shù)量不宜過多。為了能在有限的氣泡中展示更多的信息,可以給氣泡圖中的氣泡加入交互功能,單擊該氣泡圖1-13第1梯隊和第2梯隊主流App用戶量與上線時間的分布情況
值得一提的是,氣泡圖中過多的氣泡會增加圖表的閱讀難度,因此氣泡的數(shù)量不宜過多。為了能在有限的氣泡中展示更多的信息,可以給氣泡圖中的氣泡加入交互功能,單擊該氣泡即可查看其隱藏的信息。
誤差棒圖是使用誤差棒注明被測量數(shù)據(jù)的不確定度大小的圖表,用于表示測量數(shù)據(jù)中客觀存在的測量偏差(標準差或標準誤差)。誤差棒圖中誤差棒是以被測量數(shù)據(jù)的平均值為中點,在表示測量值大小的方向上畫出的一條線段,線段長度的一半為不確定度。例如,某城市上年降雨量的統(tǒng)計分析如圖11所示。
圖11 某城市年降雨量的統(tǒng)計分析
區(qū)圖,由一組坐標軸和多個等距同心圓或多邊形組成,雷達圖又稱蜘蛛網(wǎng)圖、星狀圖、是一種表現(xiàn)多維(4維以上)數(shù)據(jù)的圖表。雷達圖中的坐標軸起始于同一個圓心點,結(jié)束于最外圍圓周邊緣,每個坐標軸代表一個指標,其上面會將多個維度的數(shù)據(jù)映射成點,連接數(shù)據(jù)點圍成一個多邊形,適用于對多指標對象做出全局性、整體性評價的場景,常見于企業(yè)經(jīng)菲狀況的評價和財務(wù)分析。例如,某人通過霍蘭德職業(yè)興趣測試的結(jié)果如圖11所示。
圖12 某人通過霍蘭德職業(yè)興趣測試的結(jié)果
統(tǒng)計地圖是一種以地圖為背景,使用各種線紋、色彩、幾何圖形或?qū)嵨镄蜗髽俗⒅笜藬?shù)值及其在不同地理位置的分布狀況的圖表。統(tǒng)計地圖主要用于說明某些現(xiàn)象在地域上的分布,適用于比較人口、資源、產(chǎn)量等在各地區(qū)的分布情況。例如,某平臺朔州市用戶的地域分布情況如圖12所示。
圖13 2021年2月1日中國新型冠狀病毒肺炎疫情地圖
3D圖表是一類在三維坐標系中呈現(xiàn)數(shù)據(jù)的圖表。常用的3D圖表包括3D散點圖、3D折線圖、3D曲面圖、3D直方圖、3D柱形圖等。與2Q 相比,3D圖表的效果更為酷炫,其在視覺上的表現(xiàn)力更強,且可仿真很多場景,適用于金融、氣象、地理、建筑、交通等場景。例如,豆粕期權(quán)隱含波動率如圖14所示。
圖14 豆粕期權(quán)隱含波動率