第八章 離散程度
全距
l 最大值減最小值就是全距(range):
全距=最大值-最小值
l 數字大表母體中之數值高的很高,但低的卻很低。
未分組資料之全距
l MAX()-MIN()、LARGE()-SMALL()或下文QUARTILE()與PERCENTILE()與函數求算全距:
l 以『依性別求運動時間全距』工作表F欄之男性部份言,運算公式為:
l F4極大 =DMAX($A$1:$C$116,$C$1,F$2:F$3)
l F5極小 =DMIN($A$1:$C$116,$C$1,F$2:F$3)
l F6全拒 =F4-F5
l F7平均 =DAVERAGE($A$1:$C$116,$C$1,F$2:F$3)
l F8樣本數 =DCOUNT($A$1:$C$116,$C$1,F$2:F$3)
分組資料之全距
全距=最大組之上界 - 最小組之下界
最大組之上界 = 前一組之上界 + 組距
全距之優缺點
優點為:
l 計算方法很簡單
l 意義明顯,容易解釋
缺點為:
l 反應不夠靈敏,當極大、極小數值不變,而其它各項數值皆改變時,全距仍不能反應出變化
l 易受兩極端數值的影響
四分位差
QUARTILE(陣列,類型)
l 求一個數值陣列或儲存格範圍的第幾個四分位數:
l 陣列是要求得四分位數的數值陣列或儲存格範圍。
類型用以指出要傳回的數值:
l 0 表最小值(0%處)
l 1 表第一個四分位數(25%處),下四分位數,Q1
l 2 表第二個四分位數(50%處),即中位數,Q2
l 3 表第三個四分位數(75%處),上四分位數,Q3
l 4 表最大值(100%處)
l 最大值減最小值就是前述之全距。
即四分位差(Q. D.),為Q3與Q1間距之半,故又稱半內距。
其意義為:以母群體居中百分之五十的數值(中位數),
未分組資料之四分位數
l 於Excel可直接使用QUARTILE()函數來求算四分位數,並計算出全距與四分位差:
分組資料之四分位數
l 若原資料係分組資料,
l n為總樣本數
l LQ1為Q1組之下限
l Fi為Q1組以下的累計次數(Q1組之次數不算)
l fi為Q1組之次數,即累計百分比為25%之組別所出現的樣本數
l h為Q1組之組距
l Q3為:
l n為總樣本數
l LQ3為Q3組之下限
l Fi為Q3組以下的累計次數(Q3組之次數不算)
l fi為Q3組之次數,即累計百分比為75%之組別所出現的樣本數
l h為Q3組之組距
四分位差之優缺點
l 優點為:不受少數極端值的影響。
缺點為:
l 僅能表示一次數分配中間一半變量之分散情況;而不是全部變量之分散情況
l 計算稍嫌麻煩,尤其是分組資料。
百分位數
PERCENTILE(陣列,百分比)
l 可用來求一個數值陣列或儲存格範圍的第幾個百分位數
l 百分比是介於0~1之百分比數字
平均絕對差
l 平均絕對差(MAD,mean absolute deviation)之公式為:
即取每一觀測值與其均數間差異的絕對值之算術平均,取其絕對值就是因為無論正差或負差,取絕對值後均為正值,就不會產生正負相抵銷之情況。
AVEDEV(數值1,數值2,...)
l 是一個很理想的離散程度之衡量方法。其值越小,表離散程度越小。
l 優點是:考慮到資料群內的每一個值
l 缺點為:易受極端值之影響,且公式因得取絕對值,不適合代數處理,所以才有變異數與標準差之發明。
母體變異數
l 變異數
l 用來衡量觀測值與平均值間的離散程度
l 值越小表母體的離散程度越小,齊質性越高。
VARP(數值1,數值2,...)
VARPA(數值1,數值2,...)
l 數值1,數值2,...為要計算變異數之儲存格或範圍引數。
l VARP()係所有數值的母體變異數
l VARPA()則求所有非空白儲存格之母體變異數。如
=VARP(C2:C8)
=VARPA(C2:C8)
母體標準差
STDEVP(數值1,數值2,...)
STDEVPA(數值1,數值2,...)
l 數值1,數值2,...為要計算標準差之儲存格或範圍引數,它是對應於母群體的1到30個數字引數。
樣本變異數
VAR(數值1,數值2,...)
VARA(數值1,數值2,...)
l 數值1,數值2,...為要計算變異數之儲存格或範圍引數,它是對應於某母群體抽樣選出的1到30個數字引數樣本。
l 樣本變異數的計算公式為:
變異數與標準差之優缺點
變異數與標準差是最常被用來衡量離散程度的方法,其優點為:
l 感應靈敏
l 嚴密精確
l 適於代數處理
l 受抽樣變動之影響甚小
但其缺點為
l 不是簡明易解
l 計算困難
l 受極端值影響較大
樣本標準差
STDEV(數值1,數值2,...)
STDEVA(數值1,數值2,...)
l 這兩個函數均用來計算樣本標準差。式中,斜體字表該部份可省略。
l 數值1,數值2,...為要計算標準差之儲存格或範圍引數,最多可達30個,它是於某母群體中所抽選出的樣本。
l 樣本標準差的計算公式為:
l 母體標準差的計算公式,在後者之分母為n;而前者為n-1。
l 當樣本個數n愈大時,樣本標準差與母體標準差會愈趨近於相等。
l STDEV()為求所有數值的標準差
以交叉表求標準差
l 利用「資料(D)/樞紐分析表及圖報表(P)…」來建立交叉表。
l 以樞紐分析表計算性別交叉居住狀況,求一週飲料花費平均數、標準差及人數。交叉表之結果為:
計算變異數與標準差
l 對問卷上,採用勾填某一區間所獲得之數字。
l IF()函數,將其代入到問卷資料中,續求算其均數、變異數與標準差。
直接以次數分配表求變異數
l 將原間斷之類別變數轉為組中點之數字;而直接以次數分配表求變異數。其公式為:
l xi為第i組之組中點
l fi為第i組之次數(樣本數)
l 如『以組中點求毎月所得變異數-次數分配』工作表:
敘述統計
l 在「工具(T)/增益集(I)…」,加入『分析工具箱』。則可以「工具(T)/資料分析(D)…」,計算一組資料內之各相關統計值。
2010年5月10日 星期一
第七章 集中趨勢
第七章 集中趨勢
均數
l 均數或稱算術均數,是指將總和除以個數。
AVERAGE(數值1,數值2, ...)
AVERAGEA(數值1,數值2, ...)
l 數值1,數值2, ...為要計算平均數之儲存格或範圍引數。
l AVERAGE()係計算所有含數值資料的儲存格之均數
l AVERAGEA()則計算所有非空白的儲存格之均數。
l 但若例子改為求學生平時作業之均數,其中,第一位學號93001之學生並未繳交『作業2』,以AVERAGE()求算(詳『均數3』工作表)或AVERAGEA()函數求算:(詳『均數4』工作表)
l 所以,若您是老師,應記得於未繳作業處輸入0。以避免前面之不合理情況:
l 最方便之方式為:將所有成績選取,以「編輯(E)/取代(E)…」,一舉將全部之空白儲存格均改為0,其『尋找目標(N)』處並不必輸入任何內容:
l 按「全部取代」鈕,即可將全部之空白儲存格均改為0:
l 要不,就於未繳作業處補個“缺”字,續利用AVERAGEA()來求算平均數,也可以獲得正確值:
l 但以"缺"字來代表未交作業時,千萬別還是以AVERAGE()來求算平均數,其值還是錯誤的:
平均數之優點
l 代表性容易被接受。
l 平均數永遠存在且只有一個;不像眾數,可能會有好幾個眾數或根本沒有眾數。
l 所有數值均被使用到,對代表性均有貢獻。不像眾數或中位數,忽略兩端之數字。
l 但它的缺點就是會受兩端之極端值影響,而減弱了代表性。如:
6, 8, 10, 7, 6, 7, 5, 2000
未將最高之極端值排除,其均數為256.125,實在有點高;若將最高之極端值2000排除,其均數為7,似乎更能代表實際之情況。
馬上練習
l 依『運動時間均數』工作表內容,計算每次平均運動時間。
馬上練習
l 依『手機平均月費均數』工作表內容,計算有手機者(B欄為1者)手機平均月費之均數。
有條件的均數
l 前面『手機平均月費均數』是一種有條件的均數,於Excel中,可利用SUMIF()/COUNTIF()來求得,即
或直接使用含準則範圍之DAVERAGE()函數來計算。
依條件算加總SUMIF()
SUMIF(準則範圍,條件準則,加總範圍)
l 準則範圍是條件準則用來進行條件比較的範圍。
l 條件準則可以是數字、比較式或文字。但除非使用數值,否則應以雙引號將其包圍。如:50000、"門市"或">=800000"。
l 加總範圍則用以標出要進行加總的儲存格範圍,如果省略,則計算準則範圍中的儲存格。僅適用於準則範圍為數值時,如:=SUMIF(C2:C9,">=30000")
將加總C2:C9範圍內,大於或等於30000者。
l 如,擬於『分組加總1』工作表中,分別求各部門之業績的總和:
l 若將相關文字及條件輸入於儲存格內,則求合計之各公式可改為:(詳『分組加總2』工作表)
依條件求平均
l 事實上,Excel並無依條件求算均數之AVERAGEIF(),要依條件求算均數,可將SUMIF()除以COUNTIF()來求算。如,先以COUNTIF()求筆數:(詳『分組均數』工作表)
l 續將SUMIF()之合計除以COUNTIF()之筆數,來求算有條件之均數
l 所以,前面『手機平均月費均數』之問卷實例(詳『依條件求手機平均月費均數』工作表),則可以
=SUMIF(B2:B192,1,C2:C192)
求有手機者之月費加總,以
=COUNTIF(B2:B192,1)
求有手機者之筆數,續將兩者相除,求得均數
=G2/G3
馬上練習
l 依『不同性別之運動時間均數』工作表內容,計算男女性每次平均運動時間。
依準則求均數DAVERAGE()
DAVERAGE(資料庫表單,欄名或第幾欄,準則範圍)
l 資料庫表單 為一資料庫表單之範圍(應含欄名列),如:所輸入含欄名之問卷資料
l 欄名或第幾欄 以數值標出欲處理之欄位為資料庫表單內的第幾欄,由1起算。也可以是以雙引號包圍之欄位名稱,如:"薪資"、"運動時間"、"月費"、…。當然,也可引用已存有欄名之儲存格內容。
l 準則範圍 為一含欄名列與條件式的準則範圍(參見第四章『以進階篩選找出不合理之關聯題』處之說明)
l 以前文『馬上練習』求不同性別之運動時間均數的例子來說,我們可將其安排成:(詳『男女性運動時間均數』工作表)
l 其F3之內容:
=DAVERAGE($A$1:$C$116,$C1,F2:F3)
表示依$A$1:$C$116資料庫,以F2:F3為準則(『性別』欄為1,即男性),求$C1(每次運動時間/分)之均數。抄給G3就變成以G2:G3為準則(『性別』欄為2),將求算女性之每次運動時間均數;抄給H3就變成以H2:H3為準則(『全體』欄為空白,表無任何條件。)。事實上,$A$1:$C$116資料庫根本也沒有一個『全體』欄,但因其下H3無條件,將求算所有人之每次運動時間均數。
l F3之內容,也可以改為:
=DAVERAGE($A$1:$C$116,"每次運動時間/分",F2:F3)
=DAVERAGE($A$1:$C$116,3,F2:F3)
以字串標出欄名,或以數字標出第幾欄,其效果均同。
馬上練習
l 依『一週飲料花費』工作表內容,計算不同居住狀況之受訪者,一週飲料花費的均數。
含『且』的準則
l 前文『手機平均月費均數』之問卷實例(詳『依兩條件求手機平均月費均數』工作表),必須同時使用兩個條件。如,求男性之手機平均月費均數的條件為:『是否有手機』為1且『性別』為1。其準則範圍應為:
l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,F1:G2)
l 求女性之手機平均月費均數的條件為:『是否有手機』為1且『性別』為2。其準則範圍應為:
l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,I1:J2)
l 求全體之手機平均月費均數的條件為:『是否有手機』為1。其準則範圍應為:
l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,L1:L2)
l 於G7:I7,以
=DCOUNT($A$1:$D$192,$C1,F1:G2)
=DCOUNT($A$1:$D$192,$C1,I1:J2)
=DCOUNT($A$1:$D$192,$C1,L1:L2)
依相同之準則分別求男/女及全體人數,可使報表資料更完備一點:
交叉表求均數
l 對於必須同時使用兩個條件求均數;且還得一併求人數之情況,最便捷之處理方式為利用「資料(D)/樞紐分析表及圖報表(P)」來建立交叉表。
l 以『性別交叉是否有手機求平均月費』工作表之資料為例,以「資料(D)/樞紐分析表及圖報表(P)…」建立交叉表之步驟為:
l 以滑鼠單按問卷資料之任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之1』對話方塊
l 於上半部之來源,選「Microsoft Excel清單或資料庫(M)」;於下半部之報表類型,選「樞紐分析表(T)」
l 按「下一步」鈕,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之2』對話方塊
l 按「下一步」鈕,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊,以拖曳方式安排樞紐表內各部位內容(分兩次拖曳)
l 雙按 ,轉入『樞紐分析表欄位』對話方塊,於『摘要方式(S):』處將其改為「平均數」,以求算平均數,並將其『名稱(M)』改為「平均月費均數」
l 雙按 ,轉入『樞紐分析表欄位』對話方塊,於『摘要方式(S):』處將其改為「項目個數」,以求算資料筆數,並將其『名稱(M)』改為「人數」
l 按「確定」鈕
l 按「確定」鈕,回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊,將樞紐分析表安排於目前工作表之F3處
l 完成設定後,按「確定」離開,於F3處獲致交叉分析表
l 於F5:F6及H4:I4輸入各數字所對應之文字
l 其組中點之算法為:
上題整個家庭月所得狀況的各答案,可轉為下示之組中點:
l 然後,以IF()函數:
=IF(B2=1,25000,IF(B2=2,75000,IF(B2=3,125000,IF(B2=4,175000,225000))))
將其代入到問卷資料中,續求算其平均值:(詳『以組中點求毎月所得均數-IF』工作表)
l 由於,各組之組距均為50000,故亦可將上示之IF()函數簡化成:
=25000+(B2-1)*50000
所求得之組中點及均數(87500)亦完全相同。(詳『以組中點求毎月所得均數-計算』工作表)
中位數之優點
l 不受極端值的影響
l 恆為所有資料的中間分界,它是存在且易瞭解
l 對於分配不對稱之資料,中位數比平均數更適合當集中趨勢的代表值。
中位數之缺點
l 僅注重中央之數字,忽略了兩端之所有數字
l 不靈敏,當資料發生變動,中位數並不一定會變動
l 若改為以均數來代表,將可以很容易地排出所有公司之排名:
連續資料之中位數
l 若問卷係開放題,可直接以MEDIAN()函數來求算中位數
分組資料之中位數
l n為總樣本數
l Li為中位數組之下限
l Fi為中位數組以下的累計次數(中位數組之次數不算)
l fi為中位數組之次數,即累計百分比為50%之組別所出現的樣本數
l h為組距
l 如『求分組資料之中位數』工作表之資料,其中位數近似值為:
眾數
l 眾數(Mode,以Mo表示)係指在一群體中出現次數最多的那個數值,
l MODE(數值1,數值2, ...)
l 數值1,數值2, ...為要求眾數之儲存格或範圍引數,最多可達30個。
l 眾數、中位數與平均數,均是用來衡量母體的集中趨勢。
眾數之優/缺點
優點:
l 簡單易瞭解
l 不受兩端極端值影響
缺點:
l 可能會同時有好幾個眾數的情況發生
l 也可能會沒有眾數
l 不靈敏,當資料發生變動眾數並不一定會變動
均數
l 均數或稱算術均數,是指將總和除以個數。
AVERAGE(數值1,數值2, ...)
AVERAGEA(數值1,數值2, ...)
l 數值1,數值2, ...為要計算平均數之儲存格或範圍引數。
l AVERAGE()係計算所有含數值資料的儲存格之均數
l AVERAGEA()則計算所有非空白的儲存格之均數。
l 但若例子改為求學生平時作業之均數,其中,第一位學號93001之學生並未繳交『作業2』,以AVERAGE()求算(詳『均數3』工作表)或AVERAGEA()函數求算:(詳『均數4』工作表)
l 所以,若您是老師,應記得於未繳作業處輸入0。以避免前面之不合理情況:
l 最方便之方式為:將所有成績選取,以「編輯(E)/取代(E)…」,一舉將全部之空白儲存格均改為0,其『尋找目標(N)』處並不必輸入任何內容:
l 按「全部取代」鈕,即可將全部之空白儲存格均改為0:
l 要不,就於未繳作業處補個“缺”字,續利用AVERAGEA()來求算平均數,也可以獲得正確值:
l 但以"缺"字來代表未交作業時,千萬別還是以AVERAGE()來求算平均數,其值還是錯誤的:
平均數之優點
l 代表性容易被接受。
l 平均數永遠存在且只有一個;不像眾數,可能會有好幾個眾數或根本沒有眾數。
l 所有數值均被使用到,對代表性均有貢獻。不像眾數或中位數,忽略兩端之數字。
l 但它的缺點就是會受兩端之極端值影響,而減弱了代表性。如:
6, 8, 10, 7, 6, 7, 5, 2000
未將最高之極端值排除,其均數為256.125,實在有點高;若將最高之極端值2000排除,其均數為7,似乎更能代表實際之情況。
馬上練習
l 依『運動時間均數』工作表內容,計算每次平均運動時間。
馬上練習
l 依『手機平均月費均數』工作表內容,計算有手機者(B欄為1者)手機平均月費之均數。
有條件的均數
l 前面『手機平均月費均數』是一種有條件的均數,於Excel中,可利用SUMIF()/COUNTIF()來求得,即
或直接使用含準則範圍之DAVERAGE()函數來計算。
依條件算加總SUMIF()
SUMIF(準則範圍,條件準則,加總範圍)
l 準則範圍是條件準則用來進行條件比較的範圍。
l 條件準則可以是數字、比較式或文字。但除非使用數值,否則應以雙引號將其包圍。如:50000、"門市"或">=800000"。
l 加總範圍則用以標出要進行加總的儲存格範圍,如果省略,則計算準則範圍中的儲存格。僅適用於準則範圍為數值時,如:=SUMIF(C2:C9,">=30000")
將加總C2:C9範圍內,大於或等於30000者。
l 如,擬於『分組加總1』工作表中,分別求各部門之業績的總和:
l 若將相關文字及條件輸入於儲存格內,則求合計之各公式可改為:(詳『分組加總2』工作表)
依條件求平均
l 事實上,Excel並無依條件求算均數之AVERAGEIF(),要依條件求算均數,可將SUMIF()除以COUNTIF()來求算。如,先以COUNTIF()求筆數:(詳『分組均數』工作表)
l 續將SUMIF()之合計除以COUNTIF()之筆數,來求算有條件之均數
l 所以,前面『手機平均月費均數』之問卷實例(詳『依條件求手機平均月費均數』工作表),則可以
=SUMIF(B2:B192,1,C2:C192)
求有手機者之月費加總,以
=COUNTIF(B2:B192,1)
求有手機者之筆數,續將兩者相除,求得均數
=G2/G3
馬上練習
l 依『不同性別之運動時間均數』工作表內容,計算男女性每次平均運動時間。
依準則求均數DAVERAGE()
DAVERAGE(資料庫表單,欄名或第幾欄,準則範圍)
l 資料庫表單 為一資料庫表單之範圍(應含欄名列),如:所輸入含欄名之問卷資料
l 欄名或第幾欄 以數值標出欲處理之欄位為資料庫表單內的第幾欄,由1起算。也可以是以雙引號包圍之欄位名稱,如:"薪資"、"運動時間"、"月費"、…。當然,也可引用已存有欄名之儲存格內容。
l 準則範圍 為一含欄名列與條件式的準則範圍(參見第四章『以進階篩選找出不合理之關聯題』處之說明)
l 以前文『馬上練習』求不同性別之運動時間均數的例子來說,我們可將其安排成:(詳『男女性運動時間均數』工作表)
l 其F3之內容:
=DAVERAGE($A$1:$C$116,$C1,F2:F3)
表示依$A$1:$C$116資料庫,以F2:F3為準則(『性別』欄為1,即男性),求$C1(每次運動時間/分)之均數。抄給G3就變成以G2:G3為準則(『性別』欄為2),將求算女性之每次運動時間均數;抄給H3就變成以H2:H3為準則(『全體』欄為空白,表無任何條件。)。事實上,$A$1:$C$116資料庫根本也沒有一個『全體』欄,但因其下H3無條件,將求算所有人之每次運動時間均數。
l F3之內容,也可以改為:
=DAVERAGE($A$1:$C$116,"每次運動時間/分",F2:F3)
=DAVERAGE($A$1:$C$116,3,F2:F3)
以字串標出欄名,或以數字標出第幾欄,其效果均同。
馬上練習
l 依『一週飲料花費』工作表內容,計算不同居住狀況之受訪者,一週飲料花費的均數。
含『且』的準則
l 前文『手機平均月費均數』之問卷實例(詳『依兩條件求手機平均月費均數』工作表),必須同時使用兩個條件。如,求男性之手機平均月費均數的條件為:『是否有手機』為1且『性別』為1。其準則範圍應為:
l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,F1:G2)
l 求女性之手機平均月費均數的條件為:『是否有手機』為1且『性別』為2。其準則範圍應為:
l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,I1:J2)
l 求全體之手機平均月費均數的條件為:『是否有手機』為1。其準則範圍應為:
l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,L1:L2)
l 於G7:I7,以
=DCOUNT($A$1:$D$192,$C1,F1:G2)
=DCOUNT($A$1:$D$192,$C1,I1:J2)
=DCOUNT($A$1:$D$192,$C1,L1:L2)
依相同之準則分別求男/女及全體人數,可使報表資料更完備一點:
交叉表求均數
l 對於必須同時使用兩個條件求均數;且還得一併求人數之情況,最便捷之處理方式為利用「資料(D)/樞紐分析表及圖報表(P)」來建立交叉表。
l 以『性別交叉是否有手機求平均月費』工作表之資料為例,以「資料(D)/樞紐分析表及圖報表(P)…」建立交叉表之步驟為:
l 以滑鼠單按問卷資料之任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之1』對話方塊
l 於上半部之來源,選「Microsoft Excel清單或資料庫(M)」;於下半部之報表類型,選「樞紐分析表(T)」
l 按「下一步」鈕,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之2』對話方塊
l 按「下一步」鈕,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊,以拖曳方式安排樞紐表內各部位內容(分兩次拖曳)
l 雙按 ,轉入『樞紐分析表欄位』對話方塊,於『摘要方式(S):』處將其改為「平均數」,以求算平均數,並將其『名稱(M)』改為「平均月費均數」
l 雙按 ,轉入『樞紐分析表欄位』對話方塊,於『摘要方式(S):』處將其改為「項目個數」,以求算資料筆數,並將其『名稱(M)』改為「人數」
l 按「確定」鈕
l 按「確定」鈕,回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊,將樞紐分析表安排於目前工作表之F3處
l 完成設定後,按「確定」離開,於F3處獲致交叉分析表
l 於F5:F6及H4:I4輸入各數字所對應之文字
l 其組中點之算法為:
上題整個家庭月所得狀況的各答案,可轉為下示之組中點:
l 然後,以IF()函數:
=IF(B2=1,25000,IF(B2=2,75000,IF(B2=3,125000,IF(B2=4,175000,225000))))
將其代入到問卷資料中,續求算其平均值:(詳『以組中點求毎月所得均數-IF』工作表)
l 由於,各組之組距均為50000,故亦可將上示之IF()函數簡化成:
=25000+(B2-1)*50000
所求得之組中點及均數(87500)亦完全相同。(詳『以組中點求毎月所得均數-計算』工作表)
中位數之優點
l 不受極端值的影響
l 恆為所有資料的中間分界,它是存在且易瞭解
l 對於分配不對稱之資料,中位數比平均數更適合當集中趨勢的代表值。
中位數之缺點
l 僅注重中央之數字,忽略了兩端之所有數字
l 不靈敏,當資料發生變動,中位數並不一定會變動
l 若改為以均數來代表,將可以很容易地排出所有公司之排名:
連續資料之中位數
l 若問卷係開放題,可直接以MEDIAN()函數來求算中位數
分組資料之中位數
l n為總樣本數
l Li為中位數組之下限
l Fi為中位數組以下的累計次數(中位數組之次數不算)
l fi為中位數組之次數,即累計百分比為50%之組別所出現的樣本數
l h為組距
l 如『求分組資料之中位數』工作表之資料,其中位數近似值為:
眾數
l 眾數(Mode,以Mo表示)係指在一群體中出現次數最多的那個數值,
l MODE(數值1,數值2, ...)
l 數值1,數值2, ...為要求眾數之儲存格或範圍引數,最多可達30個。
l 眾數、中位數與平均數,均是用來衡量母體的集中趨勢。
眾數之優/缺點
優點:
l 簡單易瞭解
l 不受兩端極端值影響
缺點:
l 可能會同時有好幾個眾數的情況發生
l 也可能會沒有眾數
l 不靈敏,當資料發生變動眾數並不一定會變動
2010年5月9日 星期日
第六章 交叉分析表
第六章 交叉分析表
建立樞紐分析表
l 以『政黨傾向與地區別』工作表為例,進行說明建立交叉分析表之過程
l 滑鼠單按問卷資料之任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之1』對話方塊
l 選「Microsoft Excel清單或資料庫(M)」;於下半部之報表類型,選「樞紐分析表(T)」
l 按「下一步」鈕入『樞紐分析表和樞紐分析圖精靈-步驟3之2』對話方塊,以標定建表範圍
l 按「下一步」鈕入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊,以安排樞紐分析表之列、欄與資料內容
l 假定,欲建立受訪者『居住地區』與『政黨傾向』的交叉表。
l 將『居住地區』拖曳到『欄(C)』處,
l 『政黨傾向』拖曳到『列(R)』處,
l 『性別』拖曳到『資料(D)』處,
l 如下示結果:
l 於其上雙按滑鼠,轉入『樞紐分析表欄位』對話方塊,
l 於『摘要方式(S):』處將其改為「項目個數」,以求算出現次數,將其『名稱(M)』改為「人數」。
l 按「確定」鈕,『資料(D)』處所求算之統計量已改為人數( )
l 按鈕回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊,
l 選「已經存在的工作表(E)」項,選按L3儲存格:
l 完成設定後,按「完成」離開
l M4:P4輸入各數字所對應居住地區
l 於L5:L10輸入各數字所對應之政黨名稱
加入百分比
l 表中可加入三種百分比:
l 總百分比
l 欄百分比
l 列百分比
l 以滑鼠單按樞紐分析表內任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」
l 進入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕進『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊
l 將「性別」拖曳到『資料(D)』處,使『資料(D)』處擁有兩個內容
l 於 上雙按,將『摘要方式(S):』改為「項目個數」並將『名稱(M)』改為「%」
l 按「選項」鈕,轉入
l 選取使用「總欄數的百分比」
l 按兩次「確定」回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「完成」離開,百分比之交叉分析表
加入分頁依據
l 於前文之樞紐分析表內再加入『性別』作為分頁依據。其處理步驟為:以滑鼠單按樞紐分析表內任一儲存格
執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊
l 將「性別」拖曳到「分頁(P)」處,
l 按「確定」及「完成」鈕離開,完成入分頁設定
建表的新方式
l 以滑鼠單按要求得樞紐分析表之資料清單的任一儲存格
l 轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「確定」鈕,顯示一空白的樞紐分析表、『樞紐分析表欄位清單』及『樞紐分析表』工作列
l 在『樞紐分析表欄位清單』上,將要作為樞紐分析表欄內容之欄名按鈕將要作為樞紐分析表列內容之欄名按鈕拖曳到『將列欄位拖曳到這裏』
l 將要作為樞紐分析表資料內容之欄名按鈕(本例使用「居住地區」),拖曳到『將資料欄位拖曳到這裏』,即可獲致一樞紐分析表
l 選取表中資料內容的任一儲存格
l 按 『欄位設定』鈕入『樞紐分析表欄位』
l 將「加總」改為「項目個數」,並將『名稱(M)』改為「人數」
l 按「確定」鈕離開,獲致新的樞紐分析表
變更樞紐分析表的版面配置
l 於樞紐分析表或『樞紐分析表』工具列上,直接拖放欄位
l 到『樞紐分析表和樞紐分析圖精靈』對話方塊,再以拖曳方式,重新安排欄列內容
欄列位置互換
l 欲將樞紐分析表進行轉軸(移轉欄列方向),其處理步驟為:(詳『欄列位置互換』工作表)
l 以滑鼠單按樞紐分析表內任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊
l 以拖曳方式,將欄(C)/列(R)上之欄位互換位置
l 按「確定」及「完成」鈕獲新樞紐分析表
建立樞紐分析表
l 以『政黨傾向與地區別』工作表為例,進行說明建立交叉分析表之過程
l 滑鼠單按問卷資料之任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之1』對話方塊
l 選「Microsoft Excel清單或資料庫(M)」;於下半部之報表類型,選「樞紐分析表(T)」
l 按「下一步」鈕入『樞紐分析表和樞紐分析圖精靈-步驟3之2』對話方塊,以標定建表範圍
l 按「下一步」鈕入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊,以安排樞紐分析表之列、欄與資料內容
l 假定,欲建立受訪者『居住地區』與『政黨傾向』的交叉表。
l 將『居住地區』拖曳到『欄(C)』處,
l 『政黨傾向』拖曳到『列(R)』處,
l 『性別』拖曳到『資料(D)』處,
l 如下示結果:
l 於其上雙按滑鼠,轉入『樞紐分析表欄位』對話方塊,
l 於『摘要方式(S):』處將其改為「項目個數」,以求算出現次數,將其『名稱(M)』改為「人數」。
l 按「確定」鈕,『資料(D)』處所求算之統計量已改為人數( )
l 按鈕回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊,
l 選「已經存在的工作表(E)」項,選按L3儲存格:
l 完成設定後,按「完成」離開
l M4:P4輸入各數字所對應居住地區
l 於L5:L10輸入各數字所對應之政黨名稱
加入百分比
l 表中可加入三種百分比:
l 總百分比
l 欄百分比
l 列百分比
l 以滑鼠單按樞紐分析表內任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」
l 進入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕進『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊
l 將「性別」拖曳到『資料(D)』處,使『資料(D)』處擁有兩個內容
l 於 上雙按,將『摘要方式(S):』改為「項目個數」並將『名稱(M)』改為「%」
l 按「選項」鈕,轉入
l 選取使用「總欄數的百分比」
l 按兩次「確定」回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「完成」離開,百分比之交叉分析表
加入分頁依據
l 於前文之樞紐分析表內再加入『性別』作為分頁依據。其處理步驟為:以滑鼠單按樞紐分析表內任一儲存格
執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊
l 將「性別」拖曳到「分頁(P)」處,
l 按「確定」及「完成」鈕離開,完成入分頁設定
建表的新方式
l 以滑鼠單按要求得樞紐分析表之資料清單的任一儲存格
l 轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「確定」鈕,顯示一空白的樞紐分析表、『樞紐分析表欄位清單』及『樞紐分析表』工作列
l 在『樞紐分析表欄位清單』上,將要作為樞紐分析表欄內容之欄名按鈕將要作為樞紐分析表列內容之欄名按鈕拖曳到『將列欄位拖曳到這裏』
l 將要作為樞紐分析表資料內容之欄名按鈕(本例使用「居住地區」),拖曳到『將資料欄位拖曳到這裏』,即可獲致一樞紐分析表
l 選取表中資料內容的任一儲存格
l 按 『欄位設定』鈕入『樞紐分析表欄位』
l 將「加總」改為「項目個數」,並將『名稱(M)』改為「人數」
l 按「確定」鈕離開,獲致新的樞紐分析表
變更樞紐分析表的版面配置
l 於樞紐分析表或『樞紐分析表』工具列上,直接拖放欄位
l 到『樞紐分析表和樞紐分析圖精靈』對話方塊,再以拖曳方式,重新安排欄列內容
欄列位置互換
l 欲將樞紐分析表進行轉軸(移轉欄列方向),其處理步驟為:(詳『欄列位置互換』工作表)
l 以滑鼠單按樞紐分析表內任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊
l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊
l 以拖曳方式,將欄(C)/列(R)上之欄位互換位置
l 按「確定」及「完成」鈕獲新樞紐分析表
訂閱:
文章 (Atom)