統計與機率: 4月 2010

2010年4月25日星期日

第五章次數分配

第五章次數分配
傳統的建表方式
l 建立次數分配表是以人工進行，先將各選項排好，然後就像投票所開票一樣，取得一份問卷，看其答案編號為幾？即於該答案項下，劃一記號（－）；再有另一答案出現時，再劃一記號（T）、…，等慢慢組成一個『正』字後，則再換另一新字重新劃記號、…。如：

l 由於，每個『正』字，剛好5劃，很方便就可統計出最後結果。如，上圖之資料：有手機者有42人；無手機者有15人。
l 然後計算出各組所佔之比例：
COUNTIF()函數
COUNTIF(range,criteria)
l 可於指定之範圍內，依條件準則進行求算符合條件之筆數。
l 條件準則可以是數字、比較式或文字。但除非恰好找等於某數值，可省略等號

l 於『COUNTIF函數』工作表中，分別求男女人數：
以COUNTIF()求次數分配表
l 『政黨支持率-原始資料1』工作表，為於受訪之1,000人中，訪問取得其居住地區與政黨傾向

l 輸妥E欄之政黨名稱、F欄之政黨代碼，以及第1列之標題字
l 停於G2，輸入
=COUNTIF($B$2:$B$1001,F1)

l 按鈕結束函數，將求得支持民進黨之樣本數

l 拖曳G2右下角之複製控點拖曳到G7位置求得支持各政黨之樣本數

l 於G8，按『自動加總』鈕，將自動取得=SUM(G2:G7)之公式

l 按Enter鈕，完成加總
l 於H2輸入=G2/$G$8之公式，分母將永遠固定為G8（可先輸入=G2/G8，按F4『絕對』鍵，將分母轉為絕對）
l 按『百分比樣式』鈕格式設定為百分比樣式
l 按『增加小數位數』鈕，增加1位小數

l 拖曳H2右下角之複製控點，將其複製到填滿H2:H8，即為所求

受訪者中，以無政黨傾向者居最（28.1%）。有明顯政黨傾向之受訪者中，以民進黨的支持率最高（22.8%），其次依序為國民黨（20.4%）、親民黨（19.6%）、台聯（5.5%）、新黨（3.6%）。
FREQUENCY()函數
FREQUENCY(資料陣列,組界範圍陣列)
l 可用來計算某一個範圍內，各不同值出現的次數，，輸妥公式後，以Ctrl+Shift+Enter完成輸入。
l 資料陣列是一個要計算次數分配的數值陣列或數值參照位址。
l 組界範圍陣列是一個陣列或儲存格範圍參照位址，用來安排各答案之分組結果。

l =FREQUENCY(B2:B1001,F2:F7)
l 按Ctrl+Shift+Enter完成輸入，即可

l 完成G8之加總及H欄之比例

l 將指標移往表格之上，其左上角將出現一個四向箭頭，點按該處，可選取整個表格
l 按『置中』鈕，可將表格安排成置中格式
直方圖
l 取得次數分配表後，於分析上，為方便解釋，經常將其繪製成直方圖或圓餅圖。

l 步驟為：
l 於『政黨支持率-直方圖』工作表選取E2:E7，續按住Ctrl鈕，再取H2:H7。

l 按『圖表精靈』鈕啟動『圖表精靈』，轉入『圖表精靈』建立圖表步驟4之1，選取圖表類型。

l 按「下一步」鈕，轉入『圖表精靈步驟4之2』
l 按「下一步」鈕，轉入『圖表精靈步驟4之3』。於『標題』標籤，輸入標題。

l 轉入『圖例』標籤，取消「顯示圖例(S)」
加入各黨黨旗
l 將其資料數列之圖點改為各黨黨旗：

l 單按滑鼠右鍵，續選「複製(C)」記下其內容

l 選取欲變更圖樣之資料數列的圖點，
l 再按一次，才只選取欲變更圖樣之資料數列圖點

l 按『貼上』鈕，即可將所記下之圖案

l 將所有資料數列的圖點，均改為黨旗圖案，即為所求
堆疊圖案
l 將資料數列轉為使用某一圖案後，Excel是預設使用伸展格式之圖案。
l 此時，可以下列步驟，將前面之黨旗改為堆疊圖案）

l 執行「格式(O)/選定資料點(E)…」

l 按右下角之「填滿效果」鈕
l 於左下角之『格式』方塊內，選「堆疊(A)」（或「堆疊且縮放(C)」至某一單位）
l 本例最後選「堆疊(A)」
l 續按兩次「確定」鈕，完成設定

l 將所有已改為黨旗顯示之資料數列，均進行相同之設定
圓餅圖、資料標籤
l 單選題之次數分配，各答案之百分比累計後恰為100%。
l 假定，要續將前文所繪製含黨旗圖案之直方圖改為立體圓餅圖、加上資料標籤並使某一圖塊脫離圓心：

l 其處理步驟為：
選取已經將圖塊轉為黨旗之直方圖圖案
執行「圖表(C)/圖表類型(T)…」，將其類型改為立體圓形圖

l 其處理步驟為：
選取已經將圖塊轉為黨旗之圖案

l 執行「圖表(C)/圖表類型(T)…」，將其類型改為立體圓形圖
l 按「確定」鈕改為立體圓形圖

l 執行「圖表(C)/圖表選項(I)…」，轉入『資料標籤』設定其標籤為包含「類別名稱(G)」與「百分比(P)」

l 按「確定」鈕，取得含資料標籤之立體圓形圖

l 按圓形圖外圍矩形任一塊灰色區塊，調整立體圓形圖之大小。

2010年4月15日星期四

第四章設計問卷

第四章設計問卷
設計問卷步驟
l 列舉收集之資訊
l 決定:
l 訪問之型態
方式
問題之內容
訪問之型式
訪問之用語
問題之順序
問卷之外觀
l 試訪及修訂
幾種典型的問卷題目
l 單選：答案只有一個之題目
l 複選：有多個答案之題目
l 填充/開放：受訪者自行填答之開放題
l 量表：衡量態度的尺度量表
l 權數：衡量態度之量表的重要程度
l 等級/順序：以偏好程度、品質或服務水準排列其等級或名次
l 子題：附屬於某一題目之下，必須答了某一特定答案後，才可以問的問題
單選題
l 這是最常見的問卷題目類型，使用選擇題，且其答案只有一個。如：
l Q1. 請問您現在是否擁有手機？
□1.有 □2.沒有（跳答Q12題）
l Q2. 請問您的手機是那一家電信公司？
□1.中華電信 □2.遠傳 □3.台灣大哥大
□4.和信□5.泛亞 □6.東榮 □7.其他

l 先選取所有答案項

l 確定水平尺規左側顯示『靠左定位點』；否則，點按幾次將其切換出來
l 將滑鼠指標移往水平尺規之數字部份，於12、18、25與30位置，分別點按一下，將出現幾個L符號，那就是定位點要對齊的位置，又稱為定位停駐點
如何編碼/鍵入單選題
l 將問卷回答結果，轉為適當之數字就是編碼。
l 將數字，輸入到電腦中，以利進行後續之統計分析。
l 將編碼填入於問卷之題目前，然後才開始輸入。

l 對於單選題，只需將答案編號，直接鍵入於同一列之對應欄位內即可：
複選題如何編碼/鍵入
l 對於複選題，由於其答案為多個，編碼/鍵入時，須依該題限制之答案數上限，保留欄數。如：最多三項，應保留三欄。

l 若只答一個，僅需輸入於第一欄，其餘兩欄則輸入0（如編號304之記錄）；
l 若只答兩個，僅需輸入於第一、二欄，而將第三欄輸入成0（如編號307之記錄）。
l 有的受訪者因答題流程之關係，該題免答，故一個答案也不用填，則於三欄均輸入0（如編號229、230之記錄）：
凍結窗格
l 第1列之標題將被捲出螢幕畫面，將因看不到標題而造成輸入上的不便：

l 經固定之標題內容永遠保留於畫面上。
l 當指標移往其下之畫面時，可看到這些標題便於輸入/查閱及編修資料：
填充/開放題
l 填充題就是開放題，不提示任何答案，要求使用者直接填答。
l 對數值性之資料，為了取得其真正之數字（650）；而非僅取得間斷之區間（600～800）。會採用填充題之方式取得資料：

l 若是像問答題之開放題：
請問您政府應該如何做，才可提高就業率？ _______________________________
l 其答案常常是五花八門，得先將答案一一詳列，等所有問卷均回收後，再將這些答案以人工歸類成少數的幾類，並賦予數字編號。再回到原問卷上，寫上受訪者所答之答案的代碼。然後，才可開始輸入。
l 此時，它的輸入方式就變成是單選或複選題了。若每人均只發表一個解決方案時，那就是單選題。反之，如果有人發表數個解決方案時，那就是複選題。
量表
l 問卷上出現衡量態度的量表，或稱評價尺度（rating scale）。

l 量表是一種順序尺度，只有大小先後之關係；但無倍數之關係。
l 研究上，經常將其視為連續之數值資料，而直接求其均數、標準差、…等統計量。
量表如何編碼/鍵入
l 量表之數值可安排成兩種方式：

l 直接將數字輸入於欄位內即可，對未填答者則將其安排為0。
l 將來平均數較高者，就代表該項目之重要性較高。
權數
權數如何編碼/鍵入
l 權數也是一種數值，其輸入方式同於填充/開放題。
等級/順序
l 排等級（ranking）是一種衡量的方式。如，將幾個品牌、廠牌、商店或屬性，依其品質、服務水準、偏好程度、…排等級

事後-資料驗證及圈選錯誤資料
l 若來不及做事前的資料驗證，也可以於完成資料輸入後依照前述步驟去設定驗證規則來找出錯誤資料。
馬上練習
l 於『事後驗證』工作表內，找出C、D、E三欄中，購買原因複選題內之錯誤資料。（其範圍應介於0～10）
馬上練習
l 『事後驗證-篩選』工作表內，H欄『重量輕巧』處也有錯誤資料。如，H15之-4與H19之8（資料範圍應為0～5），請找出所有資料範圍錯誤之記錄。
找重複之記錄
l 不必建立條件範圍，以滑鼠單按問卷資料上之任一儲存格
l 執行「資料(D)/篩選(F)/進階篩選(A)…」，會先選取整個問卷資料範圍，續轉入『進階篩選』對話方塊
l 選「不選重複的記錄(R)」，表欲將重複之記錄排除
l 選「將篩選結果複製到其他地方(O)」，另停於『複製到(T)：』後，點選A33儲存格，表欲將篩選結果複製到A33

l 按「確定」鈕進行篩選，若記錄存有完全相同之內容（原第2筆與第6筆編號同為230），將僅顯示其中之一筆，而將多餘之重複記錄排除，以確保記錄均為唯一
最後，將不含重複記錄之輸出結果，複製到新的工作表；或將含重複記錄之舊內容刪除，即可得到沒有重複輸入之資料內容。

2010年4月13日星期二

機率與統計平時考（一）參考解答

北台灣科學技術學院資訊傳播系
機率與統計平時考（一）參考解答學號：姓名：
一、解釋名詞：
母體（Population）我們想要研究調查之所有對象。通常以大寫N表示
基本單位：母體中的個別份子。
抽查(sampling survey)：僅在母體中，抽出一小部分個體進行調查研究。
樣本：母體的一個部分。通常以小寫n表示。

二、影響樣本數大小的因素
母體大小可用資源可容忍之誤差誤差的代價母體變異量

三、簡述抽樣程序？
界定母體確定抽樣架構選出樣本單位選擇抽樣方法決定樣本大小收集樣本資料評估抽樣結果

四、若要在excel上製造亂數，應該使用哪一個函數？
RAND

五、可於儲存格上按滑鼠右鍵，選按儲存格格式，選類別中的自訂後再輸入類型

六、=1+RAND()*79

七、主管部份的抽取公式可為：=1+RAND()*(100-1)
員工部份之抽取公式為：= 101+RAND()*(1000-101)

八、ROUND()

九、

十、

機率與統計平時考（一）

北台灣科學技術學院資訊傳播系
機率與統計平時考（一）學號：姓名：
一、解釋名詞：
1. 母體 2. 絕對參照3. 樣本 4.抽查 5.
二、說明影響樣本數大小的因素
三、簡述抽樣程序？
四、若要在EXCEL上製造亂數，應該使用哪一個函數？
五、如果要讓資料顯示3位整數，應該如何在EXCEL上操作？（請以EXCEL 2003版說明之）
六、如果使用簡單隨機抽樣，擬於80位同學中, 以隨機方式抽出25位接受問卷調查。可於儲存格上輸入的公式為何？
七、假定, 全公司有1000人, 1~100號為主管, 101~1000為普通員工。擬隨機抽出10位主管及50位員工, 接受問卷調查。
（1）主管部份的抽取公式可為？（2）員工部份的抽取公式可為？
八、在EXCEL上四捨五入應該使用哪一個函數？
九、母體變異數的計算公式為？
十、母體變異數已知時，樣本數之計算公式為？

機率與統計平時考（三）參考答案

北台灣科學技術學院資訊傳播系
機率與統計平時考（三）學號：姓名：

1. 【答】

因此總抽樣個數至少需139，即需再抽樣
139－50＝89 個。
2. 【答】

即需調查1068位市民。
3. 【答】
(1). 列舉所要收集之資訊 (2). 決定訪問之型態 (3). 決定訪問之方式
(4). 決定問題之內容 (5). 決定訪問之型式 (6). 決定訪問之用語
(7). 決定問題之順序 (8). 試訪及修訂 (9). 決定問卷之外觀
4. 【答】單選複選填充/開放量表權數等級/順序子題
5【答】將其由區間轉為組中點。如：將201～400轉為300、將401～600轉為500、……, 才可進行計算均數、標準差、變異數、極大、極小、……等。
6. 【答】輸入0
7. 【答】
8. 【答】
9. 【答】
（1）受訪者往往不是將所有衡量變項均加以考慮後, 才去填答權數；而是由上而下逐一填入數字, 等填到底下才發現總計可能會超過100%
（2）為了調整權數, 以免總計超過100%。會使得排在前面之幾個變項的權數, 普遍高於排在後面之幾個變項。
10【答】未填之兩項均填為4

機率與統計平時考（三）

北台灣科學技術學院資訊傳播系
機率與統計平時考（三）學號：姓名：
1. 假定, 上個月蔬菜之銷售比率為10%(p)。這個月, 於95%的信賴水準下（α=0.05）, 希望調查結果之支持率的允許誤差（e）為5%, 應取樣多少？
2. 『以保守估計求樣本數』工作表進行計算, 保守估計執政黨的支持度為50%。要以90%之信賴水準（風險顯著水準α=0.1）, 希望調查結果之支持率的誤差為±3%, 應取樣多少？
3. 簡述設計問卷的步驟
4. 問卷題目的種類有哪些？
5. 將取得非連續之區間代碼,若要求算各種統計量：均數、標準差、變異數、極大、極小、……等應如何處理？
6. 填充/開放題中，若受訪者未填任何數字, 則應如何處理？
7. 量表之數值可安排成哪兩種方式？
8. 如, 某份問卷之填答結果如下所示，其合計超過100％應如何調整？

9. 使用權數時應注意哪些事項？
10. 問卷結果如下所示，其中有兩項未填，應如何處理？

機率與統計平時考（二）參考答案

北台灣科學技術學院資訊傳播系
機率與統計平時考（二）參考答案學號：姓名：
1.變異數是用來衡量觀測值與平均值間的離散程度，其值越小表母體的離散程度越小，齊質性越高
2. 如圖若要計算由Z值為-1.96開始累計到右尾的機率, 則將查得之值（0.475）加上0.5, 即0.975。

3 Z值-1.96, 查得1.96之值之0.475, 以0.5-0.475=0.025即為所求
4

至少應取得523個樣本, 才能有95%的保證其誤差不超過0.3。
5.

至少應取得54個樣本, 才能有95%的保證其誤差不超過100
6.
（1）＝SQRT(12.25)
（2）＝（12.25）^1/2

7.

8. 母體內某一類元素的總數除以母體的元素個數。
9.
(1) 列舉所要收集之資訊
(2) 決定訪問之型態
(3) 決定訪問之方式
(4) 決定問題之內容
(5) 決定訪問之型式
(6) 決定訪問之用語
(7) 決定問題之順序
(8) 試訪及修訂
(9) 決定問卷之外觀
10
(1) 結構-直接訪問
(2) 非結構-直接訪問

機率與統計平時考（二）

北台灣科學技術學院資訊傳播系
機率與統計平時考（二）學號：姓名：
1說明變異數的用途
2計算由Z值為-1.96開始累計到常態分配曲線右尾的機率（已知Z值1.96
的機率為0.475）

3. 計算由Z值自左尾開始累計到Z值為-1.96的機率。
4. 假定, 母體變異數σ2=12.25, 於風險顯著水準α=0.05（Zα/2=1.96）的情況下, 希望對母體均數μ的估計誤差e不超過0.3, 其樣本數應為多大？
5. 大學生之平均每月零用錢為1500元, 其變異數為90000。至少應取得多少樣本？才能有95%的信賴水準, 保證其估計誤差不超過100元。
6.將12.25求其平方根，在EXCEL中的操作有那兩種作法？
7. 取得120位大學生之手機平均月費。計算出其樣本變異數（S2）為109,593、於顯著水準α=0.05（Zα/2=1.96）的情況下, 希望對母體手機平均月費μ的估計誤差不超過30元, 其樣本數應為多大？
8.何謂母體比例？
9. 說明設計問卷的步驟有那些？
10 說明訪問之型態有有那些？

2010年4月2日星期五

第三章樣本大小

第三章樣本大小
樣本大小之選擇
l 樣本過大浪費成本
l 過小會有大的抽樣誤差。
樣本大小母體變異數已知
l 於母體變異數（σ2）已知之情況下，樣本數（n）為：

l α為顯著水準或風險水準，（1-α）即信賴係數或信賴水準
l e為可容忍誤差
l σ為母體標準差
常態分配之z值
l 一般統計學之常態數值（Z），可利用NORMSINV()標準常態分配反函數來查得；
l 若知道Z值可以NORMSDIST()函數來求得其機率。
常態分配（normal distribution）
常態分配（normal distribution）是次數分配呈中間集中，而逐漸向左右兩端勻稱分散的鐘形曲線分佈。根據中央極限定理，不論原母體的分配為何？只要樣本數夠大（n>=30），樣本平均數的分配，會趨近於常態分配。
標準常態分配NORMSDIST()
NORMSDIST(z)
l 求自標準常態分配曲線左端累加到z值處的總面積（機率）。即，下圖之陰影部份：

l 有了此函數，即可省去查常態分配表某z值之機率的麻煩。
=NORMSDIST(-1.96) 為0.025
=NORMSDIST(-1.645) 為0.05
=NORMSDIST(0) 為0.5
=NORMSDIST(1.96) 為0.975
標準常態分配反函數NORMSINV()
NORMSINV(probability)
l =NORMSINV(0.025) 為-1.96
l =NORMSINV(0.5) 為0
l =NORMSINV(0.95) 為1.645
l =NORMSINV(0.975) 為1.96
樣本大小母體變異數已知

l 若母體變異數σ2=6.25風險顯著水準α=0.05（Zα/2=1.96），母體均數μ的估計誤差e不超過0.3，其樣本數為？

平方根SQRT()函數
SQRT(number)
l 本函數是用來求某數值的平方根，

l 也可利用 ^ 運算符號也可達成開方之動作
l 如：=64^(1/2)之結果即=SQRT(64)
樣本大小母體變異數未知
l 母體變異數未知，可利用過去調查之樣本變異數（S2）來計算。
l 樣本數：
樣本大小估計比率
l 樣本數（n）為：

l p為母體的真正比率
l α為風險顯著水準，（1-α）即信賴係數
l e為可容忍誤差

l σp為母體標準差：

l 樣本數（n）：

l 假定上個月支持執政黨之比率為38%(p)。這個月，於95%的信賴水準下（α=0.05），調查結果之支持率的允許誤差（e）為3%，應取樣多少？

l 至少應取得1006個樣本，才有95%的信心
保守估計母體比率
l 於將前面之抽樣中，若將不同之p值分別代入，其樣本數勢必不同

l 可發現，其樣本數的極大值1067係發生於母體比率為0.5時
l 採取最保守的估計，將母體比率設定為0.5。

訂閱：意見 (Atom)

統計與機率

2010年4月25日星期日

第五章次數分配

2010年4月15日星期四

第四章設計問卷

2010年4月13日星期二

機率與統計平時考（一）參考解答

機率與統計平時考（一）

機率與統計平時考（三）參考答案

機率與統計平時考（三）

機率與統計平時考（二）參考答案

機率與統計平時考（二）

2010年4月2日星期五

第三章樣本大小

追蹤者

網誌存檔

關於我自己

2010年4月25日 星期日

2010年4月15日 星期四

2010年4月13日 星期二

2010年4月2日 星期五

追蹤者

網誌存檔

關於我自己

2010年4月25日星期日

2010年4月15日星期四

2010年4月13日星期二

2010年4月2日星期五