-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
數(shù)據(jù)可視化怎么做(可視化數(shù)據(jù)平臺)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于數(shù)據(jù)可視化怎么做的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀企業(yè),服務(wù)客戶遍布全國,網(wǎng)絡(luò)營銷相關(guān)業(yè)務(wù)請撥打175-8598-2043,或微信:1454722008
本文目錄:
一、數(shù)據(jù)可視化6步法
數(shù)據(jù)可視化6步法
在當(dāng)前互聯(lián)網(wǎng),各種數(shù)據(jù)可視化圖表層出不窮,本文嘗試對數(shù)據(jù)可視化的方法進行歸納,整理成6步法。
一般的數(shù)據(jù)圖表都可以拆分成最基本的兩類元素: 所描述的事物及這個事物的數(shù)值,我們暫且將其分別定義為指標(biāo)和指標(biāo)值。比如一個性別分布中,男性占比30%,女性占比70%,那么指標(biāo)就是男性、女性,指標(biāo)值對應(yīng)為30%、70%。
1. 將指標(biāo)值圖形化
一個指標(biāo)值就是一個數(shù)據(jù),將數(shù)據(jù)的大小以圖形的方式表現(xiàn)。比如用柱形圖的長度或高度表現(xiàn)數(shù)據(jù)大小,這也是最常用的可視化形式。
傳統(tǒng)的柱形圖、餅圖有可能會帶來審美疲勞,可嘗試從圖形的視覺樣式上進行一些創(chuàng)新,常用的方法就是將圖形與指標(biāo)的含義關(guān)聯(lián)起來。
比如Google Zeitgeist在展現(xiàn)top10的搜索詞時,展示的就是“搜索”形狀的柱形,圖形與指標(biāo)的含義相吻合,同時也做了立體的視覺變化:
2. 將指標(biāo)圖形化
一般用與指標(biāo)含義相近的icon來表現(xiàn),使用場景也比較多,如下:
3.將指標(biāo)關(guān)系圖形化
當(dāng)存在多個指標(biāo)時,挖掘指標(biāo)之間的關(guān)系,并將其圖形化表達,可提升圖表的可視化深度。常見有以下兩種方式:
借助已有的場景來表現(xiàn)
聯(lián)想自然或社會中有無場景與指標(biāo)關(guān)系類似,然后借助此場景來表現(xiàn)。
比如百度統(tǒng)計流量研究院操作系統(tǒng)的分布,首先分為windows、mac還有其他操作系統(tǒng),windows又包含xp、2003等多種子系統(tǒng)。
根據(jù)這種關(guān)系聯(lián)想,發(fā)現(xiàn)宇宙星系中也有類似的關(guān)系: 宇宙中有很多星系,我們最為熟悉的是太陽系,太陽系中又包括各個行星, 因此整體借用宇宙星系的場景,將熟知的windows比喻成太陽系,將xp、window7等比喻成太陽系中的行星,將mac和其他系統(tǒng)比喻成其他星系,表現(xiàn)如下:
構(gòu)建場景來表現(xiàn)
指標(biāo)之間往往具有一些關(guān)聯(lián)特征,如從簡單到復(fù)雜、從低級到高級、從前到后等等。如無法找到已存在的對應(yīng)場景,也可構(gòu)建場景。
比如百度統(tǒng)計流量研究院中的學(xué)歷分布,指標(biāo)分別是小學(xué)、初中、高中、本科等等,它們之間是一種越爬越高,從低等級到高等級的關(guān)系,那么,這種關(guān)系可以通過構(gòu)建一個臺階去表現(xiàn),如下:
支付寶新出的個人年度賬單中,在描述付款最多的三項時,構(gòu)建了一個領(lǐng)獎臺的形式:
小結(jié):
根據(jù)之前3步,可將指標(biāo)、指標(biāo)值和指標(biāo)關(guān)系分別進行圖形化處理。
以最簡單的性別分布為例,可以得到一個線性的可視化過程,如下:
以上圖示為供參考的線性化過程,實際可視化思考中,將哪類元素進行圖形化或者圖形化前后的順序可能均有不同,需根據(jù)具體情況處理。
4. 將時間和空間可視化時間
通過時間的維度來查看指標(biāo)值的變化情況,一般通過增加時間軸的形式,也就是常見的趨勢圖。
空間
當(dāng)圖表存在地域信息并且需要突出表現(xiàn)的時候,可用地圖將空間可視化,地圖作為主背景呈現(xiàn)所有信息點。
Google Zeitgeist在2010和2012年的年度熱門回顧中,都是以地圖為主要載體(同時也結(jié)合了時間),來呈現(xiàn)熱門事件:
5. 將數(shù)據(jù)進行概念轉(zhuǎn)換
先看下生活中的概念轉(zhuǎn)換,當(dāng)我們需要喝水時,通常會說:給我來一杯水;而不會說:給我來30ml的水。在這里,30ml是一個實際數(shù)據(jù),但是難以感知,所以用一杯的概念來轉(zhuǎn)換。
同樣在數(shù)據(jù)可視化,有時需要對數(shù)據(jù)進行概念轉(zhuǎn)換,可加深用戶對數(shù)據(jù)的感知。常用方法有對比和比喻:
對比:
下圖是一個介紹中國煙民數(shù)量的圖表:如果只看左半部分中國煙民的數(shù)量:32000000,知道數(shù)據(jù)量級很大,但具體有多大卻很難感知;直到看到右半部分:中國煙民數(shù)量超過了美國人口總和,這樣一對比,對數(shù)據(jù)的感知就加深了。
比喻
下圖是一個介紹雅虎郵箱處理數(shù)據(jù)量的圖表,大意是每小時處理的電子郵件大小有1.2TB,相當(dāng)于644245094張打印的紙。
這又是一個很大的數(shù)據(jù),但到底有多大? 在這里用了一個比喻的手法:644245094張紙,如果把每一張紙首尾對接,可以繞地球4圈多。到這里,能較深刻感受到雅虎郵箱處理的數(shù)據(jù)量之大,為地球節(jié)省了很多紙張。
更進一步地,還將這個比喻進行了圖形化表現(xiàn)。
6.讓圖表“動”起來
數(shù)據(jù)圖形化完成后,可結(jié)合實際情況,將其變?yōu)閯討B(tài)化和可操控性的圖表,用戶在操控過程中能更好地感知數(shù)據(jù)的變化過程,提升體驗。
實現(xiàn)動態(tài)化通常以下兩種方式: 交互和動畫。
交互
交互包括鼠標(biāo)浮動、點擊、多圖表時的聯(lián)動響應(yīng)等等,如下是百度統(tǒng)計流量研究院的時間分布圖,采用左圖右表的聯(lián)動形式,左圖中,鼠標(biāo)浮動則顯示對應(yīng)數(shù)據(jù),點擊則切換選擇:
動畫
包括增加入場動畫、交互過程的動畫、播放動畫等等。
入場動畫:即在頁面載入后,給圖表一個“生長”的過程,取代“數(shù)據(jù)載入中”這樣的提示文字。
交互動畫:用戶發(fā)生交互行為后,通過動畫形式給以及時反饋。
播放動畫:一般來是提供播放功能,像看視頻一樣,讓用戶能夠完整看到數(shù)據(jù)隨時間變化的過程。下圖是Gapminder在描述多維數(shù)據(jù)時,提供隨時間播放的功能,可以直觀感受到所有數(shù)據(jù)的變化。
總結(jié)
數(shù)據(jù)可視化形式多樣,思考過程也不盡相同。以上6步法,是基于“數(shù)據(jù)”層面(區(qū)別于信息可視化),梳理思考過程,總結(jié)設(shè)計方法,為后續(xù)可視化提供可借鑒的思路。
二、如何做數(shù)據(jù)可視化的效果?
可以借助數(shù)據(jù)可視化分析軟件呀。如果數(shù)據(jù)太多,不好好的做數(shù)據(jù)可視化分析根本無法判斷好壞;沒有達到數(shù)據(jù)可視化的話,很多問題容易被隱藏。數(shù)據(jù)可視化分析一般通過儀表盤、柱狀圖、折線圖以及各類圖表的展現(xiàn),以更易理解的方式來詮釋數(shù)據(jù)之間的復(fù)雜關(guān)系和發(fā)展趨勢,以便更好地利用數(shù)據(jù)分析結(jié)果?!獖W 威 BI 好 用
可以看看
三、數(shù)據(jù)可視化的基本流程
作者 | 向倩文
來源 | 數(shù)據(jù)產(chǎn)品手記
大多數(shù)人對數(shù)據(jù)可視化的第一印象,可能就是各種圖形,比如Excel圖表模塊中的柱狀圖、條形圖、折線圖、餅圖、散點圖等等,就不一一列舉了。以上所述,只是數(shù)據(jù)可視化的具體體現(xiàn),但是數(shù)據(jù)可視化卻不止于此。
數(shù)據(jù)可視化不是簡單的視覺映射,而是一個以數(shù)據(jù)流向為主線的一個完整流程,主要包括數(shù)據(jù)采集、數(shù)據(jù)處理和變換、可視化映射、用戶交互和用戶感知。一個完整的可視化過程,可以看成數(shù)據(jù)流經(jīng)過一系列處理模塊并得到轉(zhuǎn)化的過程,用戶通過可視化交互從可視化映射后的結(jié)果中獲取知識和靈感。
圖1 可視化的基本流程圖
可視化主流程的各模塊之間,并不僅僅是單純的線性連接,而是任意兩個模塊之間都存在聯(lián)系。例如,數(shù)據(jù)采集、數(shù)據(jù)處理和變換、可視化編碼和人機交互方式的不同,都會產(chǎn)生新的可視化結(jié)果,用戶通過對新的可視化結(jié)果的感知,從而又會有新的知識和靈感的產(chǎn)生。
下面,對數(shù)據(jù)可視化主流程中的幾個關(guān)鍵步驟進行說明。
01
數(shù)據(jù)采集
數(shù)據(jù)采集是數(shù)據(jù)分析和可視化的第一步,俗話說“巧婦難為無米之炊”,數(shù)據(jù)采集的方法和質(zhì)量,很大程度上就決定了數(shù)據(jù)可視化的最終效果。
數(shù)據(jù)采集的分類方法有很多,從數(shù)據(jù)的來源來看,可以分為內(nèi)部數(shù)據(jù)采集和外部數(shù)據(jù)采集。
1.內(nèi)部數(shù)據(jù)采集:
指的是采集企業(yè)內(nèi)部經(jīng)營活動的數(shù)據(jù),通常數(shù)據(jù)來源于業(yè)務(wù)數(shù)據(jù)庫,如訂單的交易情況。如果要分析用戶的行為數(shù)據(jù)、APP的使用情況,還需要一部分行為日志數(shù)據(jù),這個時候就需要用「埋點」這種方法來進行APP或Web的數(shù)據(jù)采集。
2.外部數(shù)據(jù)采集:
指的數(shù)通過一些方法獲取企業(yè)外部的一些數(shù)據(jù),具體目的包括,獲取競品的數(shù)據(jù)、獲取官方機構(gòu)官網(wǎng)公布的一些行業(yè)數(shù)據(jù)等。獲取外部數(shù)據(jù),通常采用的數(shù)據(jù)采集方法為「網(wǎng)絡(luò)爬蟲」。
以上的兩類數(shù)據(jù)采集方法得來的數(shù)據(jù),都是二手?jǐn)?shù)據(jù)。通過調(diào)查和實驗采集數(shù)據(jù),屬于一手?jǐn)?shù)據(jù),在市場調(diào)研和科學(xué)研究實驗中比較常用,不在此次探討范圍之內(nèi)。
02
數(shù)據(jù)處理和變換
數(shù)據(jù)處理和數(shù)據(jù)變換,是進行數(shù)據(jù)可視化的前提條件,包括數(shù)據(jù)預(yù)處理和數(shù)據(jù)挖掘兩個過程。
一方面,通過前期的數(shù)據(jù)采集得到的數(shù)據(jù),不可避免的含有噪聲和誤差,數(shù)據(jù)質(zhì)量較低;另一方面,數(shù)據(jù)的特征、模式往往隱藏在海量的數(shù)據(jù)中,需要進一步的數(shù)據(jù)挖掘才能提取出來。
常見的數(shù)據(jù)質(zhì)量問題包括:
1.數(shù)據(jù)收集錯誤,遺漏了數(shù)據(jù)對象,或者包含了本不應(yīng)包含的其他數(shù)據(jù)對象。
2.數(shù)據(jù)中的離群點,即不同于數(shù)據(jù)集中其他大部分?jǐn)?shù)據(jù)對象特征的數(shù)據(jù)對象。
3.存在遺漏值,數(shù)據(jù)對象的一個或多個屬性值缺失,導(dǎo)致數(shù)據(jù)收集不全。
4.數(shù)據(jù)不一致,收集到的數(shù)據(jù)明顯不合常理,或者多個屬性值之間互相矛盾。例如,體重是負數(shù),或者所填的郵政編碼和城市之間并沒有對應(yīng)關(guān)系。
5.重復(fù)值的存在,數(shù)據(jù)集中包含完全重復(fù)或幾乎重復(fù)的數(shù)據(jù)。
正是因為有以上問題的存在,直接拿采集的數(shù)據(jù)進行分析or可視化,得出的結(jié)論往往會誤導(dǎo)用戶做出錯誤的決策。因此,對采集到的原始數(shù)據(jù)進行數(shù)據(jù)清洗和規(guī)范化,是數(shù)據(jù)可視化流程中不可缺少的一環(huán)。
數(shù)據(jù)可視化的顯示空間通常是二維的,比如電腦屏幕、大屏顯示器等,3D圖形繪制技術(shù)解決了在二維平面顯示三維物體的問題。
但是在大數(shù)據(jù)時代,我們所采集到的數(shù)據(jù)通常具有4V特性:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。如何從高維、海量、多樣化的數(shù)據(jù)中,挖掘有價值的信息來支持決策,除了需要對數(shù)據(jù)進行清洗、去除噪聲之外,還需要依據(jù)業(yè)務(wù)目的對數(shù)據(jù)進行二次處理。
常用的數(shù)據(jù)處理方法包括:降維、數(shù)據(jù)聚類和切分、抽樣等統(tǒng)計學(xué)和機器學(xué)習(xí)中的方法。
03
可視化映射
對數(shù)據(jù)進行清洗、去噪,并按照業(yè)務(wù)目的進行數(shù)據(jù)處理之后,接下來就到了可視化映射環(huán)節(jié)??梢暬成涫钦麄€數(shù)據(jù)可視化流程的核心,是指將處理后的數(shù)據(jù)信息映射成可視化元素的過程。
可視化元素由3部分組成:可視化空間+標(biāo)記+視覺通道
1.可視化空間
數(shù)據(jù)可視化的顯示空間,通常是二維。三維物體的可視化,通過圖形繪制技術(shù),解決了在二維平面顯示的問題,如3D環(huán)形圖、3D地圖等。
圖2 可視化空間示例
2.標(biāo)記
標(biāo)記,是數(shù)據(jù)屬性到可視化幾何圖形元素的映射,用來代表數(shù)據(jù)屬性的歸類。
根據(jù)空間自由度的差別,標(biāo)記可以分為點、線、面、體,分別具有零自由度、一維、二維、三維自由度。如我們常見的散點圖、折線圖、矩形樹圖、三維柱狀圖,分別采用了點、線、面、體這四種不同類型的標(biāo)記。
圖3 標(biāo)記類型示例
3.視覺通道
數(shù)據(jù)屬性的值到標(biāo)記的視覺呈現(xiàn)參數(shù)的映射,叫做視覺通道,通常用于展示數(shù)據(jù)屬性的定量信息。
常用的視覺通道包括:標(biāo)記的位置、大?。ㄩL度、面積、體積...)、形狀(三角形、圓、立方體...)、方向、顏色(色調(diào)、飽和度、亮度、透明度...)等。
圖3中的四個圖形示例,就很好的利用了位置、大小、顏色等視覺通道來進行數(shù)據(jù)信息的可視化呈現(xiàn)。
「標(biāo)記」、「視覺通道」是可視化編碼元素的兩個方面,兩者的結(jié)合,可以完整的將數(shù)據(jù)信息進行可視化表達,從而完成可視化映射這一過程。
關(guān)于可視化編碼元素的優(yōu)先級,以及如何根據(jù)數(shù)據(jù)的特征選擇合適的可視化表達,下次會專題來分享下。
04
人機交互
可視化的目的,是為了反映數(shù)據(jù)的數(shù)值、特征和模式,以更加直觀、易于理解的方式,將數(shù)據(jù)背后的信息呈現(xiàn)給目標(biāo)用戶,輔助其作出正確的決策。
但是通常,我們面對的數(shù)據(jù)是復(fù)雜的,數(shù)據(jù)所蘊含的信息是豐富的。
如果在可視化圖形中,將所有的信息不經(jīng)過組織和篩選,全部機械的擺放出來,不僅會讓整個頁面顯得特別臃腫和混亂,缺乏美感;而且模糊了重點,分散用戶的注意力,降低用戶單位時間獲取信息的能力。
常見的交互方式包括:
1.滾動和縮放:當(dāng)數(shù)據(jù)在當(dāng)前分辨率的設(shè)備上無法完整展示時,滾動和縮放是一種非常有效的交互方式,比如地圖、折線圖的信息細節(jié)等。但是,滾動與縮放的具體效果,除了與頁面布局有關(guān)系外,還與具體的顯示設(shè)備有關(guān)。
2.顏色映射的控制:一些可視化的開源工具,會提供調(diào)色板,如D3。用戶可以根據(jù)自己的喜好,去進行可視化圖形顏色的配置。這個在自助分析等平臺型工具中,會相對多一點,但是對一些自研的可視化產(chǎn)品中,一般有專業(yè)的設(shè)計師來負責(zé)這項工作,從而使可視化的視覺傳達具有美感。
3.數(shù)據(jù)映射方式的控制:這個是指用戶對數(shù)據(jù)可視化映射元素的選擇,一般一個數(shù)據(jù)集,是具有多組特征的,提供靈活的數(shù)據(jù)映射方式給用戶,可以方便用戶按照自己感興趣的維度去探索數(shù)據(jù)背后的信息。這個在常用的可視化分析工具中都有提供,如tableau、PowerBI等。
4.數(shù)據(jù)細節(jié)層次控制:比如隱藏數(shù)據(jù)細節(jié),hover或點擊才出現(xiàn)。
05
用戶感知
可視化的結(jié)果,只有被用戶感知之后,才可以轉(zhuǎn)化為知識和靈感。
用戶在感知過程,除了被動接受可視化的圖形之外,還通過與可視化各模塊之間的交互,主動獲取信息。
如何讓用戶更好的感知可視化的結(jié)果,將結(jié)果轉(zhuǎn)化為有價值的信息用來指導(dǎo)決策,這個里面涉及到的影響因素太多了,心理學(xué)、統(tǒng)計學(xué)、人機交互等多個學(xué)科的知識。
學(xué)習(xí)之路漫漫,一直在路上, 我們會持續(xù)分享數(shù)據(jù)可視化領(lǐng)域的知識,記得持續(xù)follow我們喲!
四、常見的數(shù)據(jù)可視化方法有哪些?
時態(tài)
時態(tài)可視化是數(shù)據(jù)以線性的方式展示。最為關(guān)鍵的是時態(tài)數(shù)據(jù)可視化有一個起點和一個終點。時態(tài)可視化的一個例子可以是連接的散點圖,顯示諸如某些區(qū)域的溫度信息。
多維
可以通過使用常用的多維方法來展示目前二維或高維度的數(shù)據(jù)。多維的展示使得效果更加多元化,滿足企業(yè)的需求。
分層
分層方法用于呈現(xiàn)多組數(shù)據(jù)。這些數(shù)據(jù)可視化通常展示的是大群體里面的小群體。分層數(shù)據(jù)可視化的例子包括一個樹形圖,可以顯示語言組。
網(wǎng)絡(luò)
在網(wǎng)絡(luò)中展示數(shù)據(jù)間的關(guān)系,它是一種常見的展示大數(shù)據(jù)量的方法。結(jié)構(gòu)較為復(fù)雜。
關(guān)于常見的數(shù)據(jù)可視化方法有哪些,青藤小編就和您分享到這里了。如果你對大數(shù)據(jù)工程有濃厚的興趣,希望這篇文章能夠?qū)δ阌兴鶐椭?。如果您還想了解更多數(shù)據(jù)分析師、大數(shù)據(jù)工程師的技巧及素材等內(nèi)容,可以點擊本站的其他文章進行學(xué)習(xí)。
以上就是關(guān)于數(shù)據(jù)可視化怎么做相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
抖音絕對不能開通數(shù)據(jù)看板(抖音絕對不能開通數(shù)據(jù)看板怎么辦)
關(guān)于大數(shù)據(jù)的介紹(關(guān)于大數(shù)據(jù)的介紹英文版)
如何利用大數(shù)據(jù)提升企業(yè)競爭優(yōu)勢
騰訊視頻可以幾個人用一個賬號(騰訊視頻可以幾個人用一個賬號登錄嗎)