• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            公告

            記錄我的生活和工作。。。
            <2010年12月>
            2829301234
            567891011
            12131415161718
            19202122232425
            2627282930311
            2345678

            統(tǒng)計(jì)

            • 隨筆 - 182
            • 文章 - 1
            • 評(píng)論 - 41
            • 引用 - 0

            留言簿(10)

            隨筆分類(lèi)(70)

            隨筆檔案(182)

            文章檔案(1)

            如影隨形

            搜索

            •  

            最新隨筆

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            淺談多元數(shù)據(jù)的可視化技術(shù)

            多元數(shù)據(jù)是最常見(jiàn)的數(shù)據(jù)類(lèi)型。人們經(jīng)常都要作出一系列的決定,比如吃什么,買(mǎi)什么新手機(jī),去哪里旅游,住什么旅館,等等。這類(lèi)決策往往是基于多元數(shù)據(jù)的分析:食物中熱量有多高,碳水化合物多少,是否含有反式脂肪,三聚氰胺等添加劑等;相機(jī)的價(jià)格,像素多少,光圈大小,焦距范圍,能否紅外拍攝,等等。多元數(shù)據(jù)的分析還能幫助我們發(fā)現(xiàn)一些數(shù)據(jù)間的聯(lián)系,并進(jìn)行預(yù)測(cè)。

            對(duì)于簡(jiǎn)單的多元數(shù)據(jù),最常見(jiàn)的可視化方法是散點(diǎn)圖(scatterplot)。比如,對(duì)于二維數(shù)據(jù),通常的方法就把它們直接畫(huà)成二維坐標(biāo)上的一系列點(diǎn),從而可以看出數(shù)據(jù)變化趨勢(shì)。對(duì)于更高維的數(shù)據(jù),一種方法是把數(shù)據(jù)的每種屬性用不同的圖形,顏色,紋理等,表示在二維坐標(biāo)上。比如下面的圖是由www.gapminder.org生成的,用來(lái)顯示了世界上國(guó)家的財(cái)富和人均壽命的關(guān)系。橫軸是人均收入,縱軸是平均壽命,每個(gè)國(guó)家表示一個(gè)圓,圓的大小表示該國(guó)的人口,圓的顏色對(duì)應(yīng)于所在的區(qū)域。這樣一張圖表達(dá)了一個(gè)國(guó)家的4個(gè)屬性。左邊的圖是基于1980年的數(shù)據(jù),而右邊的圖是基于2009年的數(shù)據(jù)。圖中那個(gè)大大的紅圓就是我們中國(guó),我們可以很直觀的看出這30年中國(guó)的發(fā)展還是很給力!網(wǎng)站上還能生成動(dòng)畫(huà),演示各個(gè)圓的位置變換,像中國(guó)那么大的圓還能動(dòng)那么快,也是獨(dú)一無(wú)二的。

            對(duì)于有更多屬性的數(shù)據(jù),用上面的方法就往往不能顯示了。常見(jiàn)的方法是用散點(diǎn)圖矩陣(scatterplot matrix),如果數(shù)據(jù)有N維(N個(gè)屬性),所有的屬性兩兩組合就生成N x N個(gè)二維散點(diǎn)圖。把這些圖排列成N x N的矩陣。這樣可以觀察任意兩個(gè)屬性間的關(guān)系。比如下面這張圖就顯示了汽車(chē)的主要屬性間的散點(diǎn)圖【1】。其中MPG代表了汽車(chē)的油耗(每加侖油能開(kāi)的旅程),從圖里我們看出,發(fā)動(dòng)機(jī)馬力越大MPG越小,車(chē)越重MPG越小,年齡越大MPG越小,等等。

            【1】M. O. Ward. Xmdvtool: Integrating multiple methods for visualizing multivariate data. In Proceedings of IEEE Conference on Visualization, 1994.

             

            散點(diǎn)圖可以很好的顯示少量屬性的數(shù)據(jù)。但是,即使用散點(diǎn)圖矩陣也無(wú)法解決屬性更多的情況,而且每個(gè)小圖只能顯示2個(gè)屬性間的聯(lián)系,多個(gè)屬性間的關(guān)系并不是很 直觀。這種局限性主要來(lái)自將數(shù)據(jù)投影在了二維直角坐標(biāo)系上。人們提出一系列的方法來(lái)解決這個(gè)局限性,而其中最著名的是1981年Alfred Inselberg 提出的平行坐標(biāo)系(Parallel Coordinates)。這種方法把各個(gè)屬性表示成一系列的平行的軸,組成一個(gè)平行坐標(biāo)系,每條數(shù)據(jù)就表示成這個(gè)坐標(biāo)系里的一條直線。比如我們有這樣一 組數(shù)據(jù)

            可以方便的表示成這樣的平行坐標(biāo)

            平行坐標(biāo)系的優(yōu)勢(shì)在于發(fā)現(xiàn)大規(guī)模數(shù)據(jù)間的屬性聯(lián)系。比如再回到前面的汽車(chē)的數(shù)據(jù),用平行坐標(biāo)可以表示成【1】
            多個(gè)屬性間的聯(lián)系比散點(diǎn)圖要清晰。比如可以清楚看出來(lái)Cylinder多的車(chē),MPG相對(duì)小,但是馬力大;Cylinder小的車(chē),MPG相對(duì)大,但是馬力 小。在平行坐標(biāo)里,我們還可以方便的進(jìn)行交互式刪選數(shù)據(jù),方便觀察,比如下面的圖,我們可以看一下,Cylinders多,MPG小,馬力大的車(chē)的其他屬性怎么樣。
            當(dāng)數(shù)據(jù)過(guò)多的時(shí)候,平行坐標(biāo)系里的線就會(huì)很多,數(shù)據(jù)間的聯(lián)系就看不清楚了,就像下面的左圖。一種解決方法是把線畫(huà)成半透明,這樣主要的線的趨勢(shì)就會(huì)隨著線的數(shù)目的增加而清晰,像下面的右圖【2】。當(dāng)數(shù)據(jù)很大的時(shí)候,主要的趨勢(shì)的分析通常是數(shù)據(jù)的分析的第一步。

            再回到我們前面第一個(gè)例子,雖然看上去學(xué)歷和收入成反比,但是如果我們有更多的數(shù)據(jù),像汽車(chē)的例子一樣,平行坐標(biāo)也可以給我們更清楚顯示收入和學(xué)歷,年齡等等的關(guān)系,所以還在讀高學(xué)位的朋友先不要灰心啊。

            【1】M. O. Ward. Xmdvtool: Integrating multiple methods for visualizing multivariate data. In Proceedings of IEEE Conference on Visualization, 1994.
            【2】 Chad Jones, et al. An Integrated Exploration Approach to Visualizing Multivariate Particle Data. Computing in Science & Engineering, Volume 10, Number 4, July/August, 2008, pp. 20-29

             

            作為多元數(shù)據(jù)可視化的主要兩種方法,散點(diǎn)圖和平行坐標(biāo)各有優(yōu)缺點(diǎn)。散點(diǎn)圖通常只能顯現(xiàn)兩個(gè)屬性間的聯(lián)系,但是每條數(shù)據(jù)都表示成一個(gè)點(diǎn),從而減少了總的像素?cái)?shù) 量和視覺(jué)復(fù)雜度;平行坐標(biāo)能顯示多個(gè)屬性間的聯(lián)系,但是每條數(shù)據(jù)(多條屬性)表示成一條線,增加了像素的數(shù)量,當(dāng)數(shù)據(jù)量很大的時(shí)候,復(fù)雜度就大大增加,而無(wú)法顯示數(shù)據(jù)間的聯(lián)系。2009年北大的袁曉如教授在IEEE VisWeek 上發(fā)表了篇文章【1】,提出了一種技術(shù)將兩種方法結(jié)合在一塊。基本的想法是在平行坐標(biāo)里的軸之間顯示散點(diǎn)圖,從而使原來(lái)在平行坐標(biāo)里看不清的數(shù)據(jù)趨勢(shì)用散點(diǎn)圖表示。像下面的左圖顯示的是平行坐標(biāo)圖,而右圖結(jié)合了散點(diǎn)圖。

            在兩個(gè)平行軸之間畫(huà)散點(diǎn)圖的基本思路是把右邊的軸旋轉(zhuǎn)90圖,這樣與左邊的形成直角坐標(biāo)系,散點(diǎn)圖的繪制和解讀也就與傳統(tǒng)的一致。畫(huà)散點(diǎn)圖的區(qū)域中原來(lái)的直線變成穿過(guò)散點(diǎn)圖的曲線,這樣保持了原來(lái)平行坐標(biāo)里的連接關(guān)系,也支持通過(guò)線來(lái)進(jìn)行數(shù)據(jù)篩選的功能。這種新的技術(shù)也用到了前面所說(shuō)的汽車(chē)數(shù)據(jù)的例子,有興趣的話找這篇論文讀一讀吧。

            【1】 Xiaoru Yuan, et al. Scattering Points in Parallel Coordinates. IEEE Transactions on Visualzation and Computer Graphics, November/December 2009 (vol. 15 no. 6)

             

            在科學(xué)計(jì)算可視化的時(shí)候,看到了這篇blog,文章講解得非常好!作者也是非常牛的!特此轉(zhuǎn)載到此!

            http://www.vizinsight.com/2010/12/%E6%B5%85%E8%B0%88%E5%A4%9A%E5%85%83%E6%95%B0%E6%8D%AE%E7%9A%84%E5%8F%AF%E8%A7%86%E5%8C%96%E6%8A%80%E6%9C%AF%EF%BC%88%E4%B8%8B%EF%BC%89/

             

            大家可以去頂一下這個(gè)blog

            http://www.vizinsight.com/

            posted on 2011-02-27 21:37 Sosi 閱讀(1052) 評(píng)論(0)  編輯 收藏 引用 所屬分類(lèi): Courses

            統(tǒng)計(jì)系統(tǒng)
            久久99精品久久久久久| 日韩人妻无码一区二区三区久久99| 色婷婷久久综合中文久久蜜桃av | 久久综合九色综合欧美狠狠| 久久香蕉综合色一综合色88| 久久久WWW成人免费精品| 激情五月综合综合久久69| 午夜精品久久久久久影视riav| 久久精品国产99国产精品亚洲| 青青国产成人久久91网| 久久99久国产麻精品66| 国产精品久久久久影视不卡| 亚洲国产成人精品久久久国产成人一区二区三区综 | 久久99精品久久久久久hb无码| 99久久精品费精品国产| 亚洲&#228;v永久无码精品天堂久久 | 奇米影视7777久久精品人人爽| 久久免费高清视频| 久久天天躁狠狠躁夜夜2020一| 国产成人久久777777| 久久青青草原亚洲av无码app| 精品人妻伦九区久久AAA片69| 精品乱码久久久久久久| 三级三级久久三级久久| 久久久网中文字幕| 日本久久久久久中文字幕| 久久精品99久久香蕉国产色戒 | 国内精品免费久久影院| 久久99亚洲网美利坚合众国| 思思久久精品在热线热| 久久久久久久综合狠狠综合| 久久精品国产国产精品四凭| 精品久久一区二区| 69久久夜色精品国产69 | 久久99精品久久久久久秒播| 国产91色综合久久免费| 99久久国产综合精品麻豆| 久久亚洲精品成人av无码网站| 综合久久国产九一剧情麻豆| 亚洲色欲久久久久综合网| 亚洲国产天堂久久久久久|