2010年5月10日 星期一

第七章 集中趨勢

第七章 集中趨勢
均數
l 均數或稱算術均數,是指將總和除以個數。
AVERAGE(數值1,數值2, ...)
AVERAGEA(數值1,數值2, ...)
l 數值1,數值2, ...為要計算平均數之儲存格或範圍引數。

l AVERAGE()係計算所有含數值資料的儲存格之均數
l AVERAGEA()則計算所有非空白的儲存格之均數。

l 但若例子改為求學生平時作業之均數,其中,第一位學號93001之學生並未繳交『作業2』,以AVERAGE()求算(詳『均數3』工作表)或AVERAGEA()函數求算:(詳『均數4』工作表)

l 所以,若您是老師,應記得於未繳作業處輸入0。以避免前面之不合理情況:

l 最方便之方式為:將所有成績選取,以「編輯(E)/取代(E)…」,一舉將全部之空白儲存格均改為0,其『尋找目標(N)』處並不必輸入任何內容:

l 按「全部取代」鈕,即可將全部之空白儲存格均改為0:

l 要不,就於未繳作業處補個“缺”字,續利用AVERAGEA()來求算平均數,也可以獲得正確值:








l 但以"缺"字來代表未交作業時,千萬別還是以AVERAGE()來求算平均數,其值還是錯誤的:
平均數之優點
l 代表性容易被接受。
l 平均數永遠存在且只有一個;不像眾數,可能會有好幾個眾數或根本沒有眾數。
l 所有數值均被使用到,對代表性均有貢獻。不像眾數或中位數,忽略兩端之數字。
l 但它的缺點就是會受兩端之極端值影響,而減弱了代表性。如:
6, 8, 10, 7, 6, 7, 5, 2000
未將最高之極端值排除,其均數為256.125,實在有點高;若將最高之極端值2000排除,其均數為7,似乎更能代表實際之情況。
馬上練習
l 依『運動時間均數』工作表內容,計算每次平均運動時間。
馬上練習
l 依『手機平均月費均數』工作表內容,計算有手機者(B欄為1者)手機平均月費之均數。
有條件的均數
l 前面『手機平均月費均數』是一種有條件的均數,於Excel中,可利用SUMIF()/COUNTIF()來求得,即


或直接使用含準則範圍之DAVERAGE()函數來計算。
依條件算加總SUMIF()
SUMIF(準則範圍,條件準則,加總範圍)
l 準則範圍是條件準則用來進行條件比較的範圍。
l 條件準則可以是數字、比較式或文字。但除非使用數值,否則應以雙引號將其包圍。如:50000、"門市"或">=800000"。
l 加總範圍則用以標出要進行加總的儲存格範圍,如果省略,則計算準則範圍中的儲存格。僅適用於準則範圍為數值時,如:=SUMIF(C2:C9,">=30000")
將加總C2:C9範圍內,大於或等於30000者。

l 如,擬於『分組加總1』工作表中,分別求各部門之業績的總和:

l 若將相關文字及條件輸入於儲存格內,則求合計之各公式可改為:(詳『分組加總2』工作表)
依條件求平均
l 事實上,Excel並無依條件求算均數之AVERAGEIF(),要依條件求算均數,可將SUMIF()除以COUNTIF()來求算。如,先以COUNTIF()求筆數:(詳『分組均數』工作表)




l 續將SUMIF()之合計除以COUNTIF()之筆數,來求算有條件之均數

l 所以,前面『手機平均月費均數』之問卷實例(詳『依條件求手機平均月費均數』工作表),則可以
=SUMIF(B2:B192,1,C2:C192)
求有手機者之月費加總,以
=COUNTIF(B2:B192,1)
求有手機者之筆數,續將兩者相除,求得均數
=G2/G3
馬上練習
l 依『不同性別之運動時間均數』工作表內容,計算男女性每次平均運動時間。
依準則求均數DAVERAGE()
DAVERAGE(資料庫表單,欄名或第幾欄,準則範圍)
l 資料庫表單 為一資料庫表單之範圍(應含欄名列),如:所輸入含欄名之問卷資料
l 欄名或第幾欄 以數值標出欲處理之欄位為資料庫表單內的第幾欄,由1起算。也可以是以雙引號包圍之欄位名稱,如:"薪資"、"運動時間"、"月費"、…。當然,也可引用已存有欄名之儲存格內容。
l 準則範圍 為一含欄名列與條件式的準則範圍(參見第四章『以進階篩選找出不合理之關聯題』處之說明)

l 以前文『馬上練習』求不同性別之運動時間均數的例子來說,我們可將其安排成:(詳『男女性運動時間均數』工作表)

l 其F3之內容:
=DAVERAGE($A$1:$C$116,$C1,F2:F3)
表示依$A$1:$C$116資料庫,以F2:F3為準則(『性別』欄為1,即男性),求$C1(每次運動時間/分)之均數。抄給G3就變成以G2:G3為準則(『性別』欄為2),將求算女性之每次運動時間均數;抄給H3就變成以H2:H3為準則(『全體』欄為空白,表無任何條件。)。事實上,$A$1:$C$116資料庫根本也沒有一個『全體』欄,但因其下H3無條件,將求算所有人之每次運動時間均數。

l F3之內容,也可以改為:
=DAVERAGE($A$1:$C$116,"每次運動時間/分",F2:F3)
=DAVERAGE($A$1:$C$116,3,F2:F3)
以字串標出欄名,或以數字標出第幾欄,其效果均同。
馬上練習
l 依『一週飲料花費』工作表內容,計算不同居住狀況之受訪者,一週飲料花費的均數。
含『且』的準則
l 前文『手機平均月費均數』之問卷實例(詳『依兩條件求手機平均月費均數』工作表),必須同時使用兩個條件。如,求男性之手機平均月費均數的條件為:『是否有手機』為1且『性別』為1。其準則範圍應為:



l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,F1:G2)

l 求女性之手機平均月費均數的條件為:『是否有手機』為1且『性別』為2。其準則範圍應為:




l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,I1:J2)

l 求全體之手機平均月費均數的條件為:『是否有手機』為1。其準則範圍應為:




l 所使用之公式應為:
=DAVERAGE($A$1:$D$192,$C1,L1:L2)

l 於G7:I7,以
=DCOUNT($A$1:$D$192,$C1,F1:G2)
=DCOUNT($A$1:$D$192,$C1,I1:J2)
=DCOUNT($A$1:$D$192,$C1,L1:L2)
依相同之準則分別求男/女及全體人數,可使報表資料更完備一點:
交叉表求均數
l 對於必須同時使用兩個條件求均數;且還得一併求人數之情況,最便捷之處理方式為利用「資料(D)/樞紐分析表及圖報表(P)」來建立交叉表。
l 以『性別交叉是否有手機求平均月費』工作表之資料為例,以「資料(D)/樞紐分析表及圖報表(P)…」建立交叉表之步驟為:
l 以滑鼠單按問卷資料之任一儲存格
l 執行「資料(D)/樞紐分析表及圖報表(P)…」,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之1』對話方塊

l 於上半部之來源,選「Microsoft Excel清單或資料庫(M)」;於下半部之報表類型,選「樞紐分析表(T)」
l 按「下一步」鈕,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之2』對話方塊
l 按「下一步」鈕,轉入『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊



l 按「版面配置」鈕,轉入『樞紐分析表和樞紐分析圖精靈-版面配置』對話方塊,以拖曳方式安排樞紐表內各部位內容(分兩次拖曳)

l 雙按 ,轉入『樞紐分析表欄位』對話方塊,於『摘要方式(S):』處將其改為「平均數」,以求算平均數,並將其『名稱(M)』改為「平均月費均數」

l 雙按 ,轉入『樞紐分析表欄位』對話方塊,於『摘要方式(S):』處將其改為「項目個數」,以求算資料筆數,並將其『名稱(M)』改為「人數」

l 按「確定」鈕

l 按「確定」鈕,回『樞紐分析表和樞紐分析圖精靈-步驟3之3』對話方塊,將樞紐分析表安排於目前工作表之F3處







l 完成設定後,按「確定」離開,於F3處獲致交叉分析表

l 於F5:F6及H4:I4輸入各數字所對應之文字

l 其組中點之算法為:


上題整個家庭月所得狀況的各答案,可轉為下示之組中點:

l 然後,以IF()函數:
=IF(B2=1,25000,IF(B2=2,75000,IF(B2=3,125000,IF(B2=4,175000,225000))))
將其代入到問卷資料中,續求算其平均值:(詳『以組中點求毎月所得均數-IF』工作表)

l 由於,各組之組距均為50000,故亦可將上示之IF()函數簡化成:
=25000+(B2-1)*50000
所求得之組中點及均數(87500)亦完全相同。(詳『以組中點求毎月所得均數-計算』工作表)
中位數之優點
l 不受極端值的影響
l 恆為所有資料的中間分界,它是存在且易瞭解
l 對於分配不對稱之資料,中位數比平均數更適合當集中趨勢的代表值。
中位數之缺點
l 僅注重中央之數字,忽略了兩端之所有數字
l 不靈敏,當資料發生變動,中位數並不一定會變動

l 若改為以均數來代表,將可以很容易地排出所有公司之排名:
連續資料之中位數
l 若問卷係開放題,可直接以MEDIAN()函數來求算中位數
分組資料之中位數

l n為總樣本數
l Li為中位數組之下限
l Fi為中位數組以下的累計次數(中位數組之次數不算)
l fi為中位數組之次數,即累計百分比為50%之組別所出現的樣本數
l h為組距

l 如『求分組資料之中位數』工作表之資料,其中位數近似值為:
眾數
l 眾數(Mode,以Mo表示)係指在一群體中出現次數最多的那個數值,
l MODE(數值1,數值2, ...)
l 數值1,數值2, ...為要求眾數之儲存格或範圍引數,最多可達30個。

l 眾數、中位數與平均數,均是用來衡量母體的集中趨勢。
眾數之優/缺點
優點:
l 簡單易瞭解
l 不受兩端極端值影響
缺點:
l 可能會同時有好幾個眾數的情況發生
l 也可能會沒有眾數
l 不靈敏,當資料發生變動眾數並不一定會變動

沒有留言:

張貼留言