第二章 抽樣
抽樣設計
l 根據研究目的決定母體
l 定義母體
l 列出名單
l 決定樣本數
l 決定抽樣方法
l 決定訪員數目
研究程序
l 撰寫計畫書
l 收集資料
l 分析及解釋資料
l 提出報告
l 繪製甘特圖
繪製甘特圖
l 假定開始日期、工作天數與結束日期
l C欄之天數以「格式(O)/儲存格(E)…
甘特圖處理步驟:
l 選取A2:C9為資料來源
l 按 鈕,啟動『圖表精靈』,
l 進入『圖表精靈—步驟4之1』,選繪製「立體堆疊橫條圖」
l 按「下一步」鈕,到『圖表精靈—步驟4之2』『數列』標籤
按底端『類別X軸標籤(T)』後之文字方塊,刪除原內容,續選取A2:A9之工作項目當類別X軸標籤
單按『數值(V)』後之文字方塊,全數刪除原內容,選取B2:B9之開始日期為『數列1』之新內容
l 按『數列(S)』方塊下方之鈕,加入一新數列『數列2』
l 按『數值(V)』後之文字方塊,全數刪除原內容,選取C2:C9之工作天數當『數列2』
l 按「下一步」鈕進入『圖表精靈—步驟4之3』『標題』標籤,輸入圖表標題『工作進度表』
l 進入『圖表精靈—步驟4之3』『圖例』標籤,取消「顯示圖例(S)」
l 轉入『圖表精靈—步驟4之3』『資料標籤』標籤,加選「內容(V)」當其資料標籤
l 按「下一步」轉入『圖表精靈—步驟4之4』,將圖表存成「工作表中的物件(O)」
l 按「完成」鈕
l 調整字型大小為8
l 改變『工作進度表』標題的字型、顏色及字體
l DBclick標籤之『數列1』的橫條圖之圖塊,進入『資料數列格式』設定『圖樣』為無框線且區域無填滿
l 按「確定」鈕,
l DBclick 『數列1』的標籤,進『資料標籤格式』對話方塊之『數值』標籤,將其設定為僅顯示月日資料
l 按「確定」鈕
l DBclick橫軸上之日期,入『座標軸格式』之『刻度』標籤,最小值設定為比工作進度開始日期2003/1/1
l 最大值設定為(2003/6/1)
l 主要刻度間距改為30(約當一個月)
l 按「確定」鈕
抽樣程序
l 界定母體
l 確定抽樣架構
l 選出樣本單位
l 選擇抽樣方法
l 決定樣本大小
l 收集樣本資料
l 評估抽樣結果
樣本單位
l 樣本單位是指母體中的個別份子
選擇抽樣方法
l 機率抽樣
又稱隨機抽樣(random sampling)
其機率並不一定要相同,但要能知道每一基本單位被選為樣本之機率。
l 常見之機率抽樣
簡單隨機抽樣
系統抽樣
決定樣本大小
l 樣本大小取決於:母體大小
l 可用資源
l 可容忍之誤差
l 誤差的代價
l 母體變異量
l 收集樣本資料
l 評估抽樣結果
l 評估抽樣結果
簡單隨機抽樣
l 母體中每一個單位被抽選到的機率都完全相同。
l 進行簡單隨機抽樣前,建立每一基本單位一個獨立的編號,以利抽樣
亂數RAND()
RAND()
l 會隨機產生亂數
l =RAND()
以亂數產生器產生亂數表
執行「工具(T)/資料分析(D)…」,選「亂數產生器」
l 假定,全公司有1000人,1~100號為主管,101~1000為普通員工。
l 隨機抽出10位主管
l 50位員工
l 主管部份
=$D$2+RAND()*($F$2-$D$2)
l 一般員工部份之抽取公式,則為
=$D$7+RAND()*($F$7-$D$7)
亂數RANDBETWEEN()
RANDBETWEEN(下限,上限)
l 全公司有2500人,1~100號為主管,101~2500為普通員工。
l 隨機抽出10位主管及50位員工,接受問卷調查。主管部份的抽取公式,由於C1為1,E1為100,故:
=RANDBETWEEN1100)
一般員工部份之抽取公式, =RANDBETWEEN101,2500)
相對參照、絕對參照與混合參照
l 相對參照:將其複製到其他儲存格時,將隨儲存格而改變其相對位置。
l 絕對參照:將其複製到其他儲存格時,並不隨儲存格而改變其位置。
l 混合參照:將其複製到其他儲存格時,有 $ 絕對符號之部份,將不隨儲存格而改變其位置;而無絕對符號者,則仍將隨儲存格而改變其相對位置。
系統抽樣
l 又稱『準隨機抽樣』。
l 將母體毎一單位編號。
l 以母體總數÷樣本數(N/n),計算出樣本區間。
l 隨機由1到I間,抽一個編號,作為起始編號,假定為B。
l 由起始編號B開始,毎次加上樣本區間之I值
l 假定,要於總數為1500人(編號1~1500)之母體,抽選出10人。
l 輸入開始編號(1)、結束編號(1500)及樣本數(10)
l 計算樣本間距I=150(=B2/B3)
l 隨機由1到I樣本間距間,以
=RANDBETWEEN(B1,B4)
抽一個編號,作為起始編號
l 按F2鍵與F9鍵
l 第一個樣本編號(=B5)
l 第二個樣本編號(=B7+B5)
l 選取兩個抽樣編號
l 按『複製』鈕,按『貼上』鈕右側之向下箭頭,選擇「值」,將公式轉為常數
l 拖曳其右下角之複製控點到B16,產生10個抽樣編號
四捨五入ROUND()
ROUND(number,num_digits)
l 進行四捨五入的數字或運算式。
2010年3月5日 星期五
第一章 機率與統計概論
第一章 機率與統計概論
為何要使用Excel來學習統計
l Minitab、SPSS、SAS等統計分析軟體,在市面上的普及率非常之低
l 價格昂貴
l 學習困難
l 報表難懂
l 很容易會面臨到無適當軟體可用之窘境,縱有一身絕技,也難以發揮。
l 微軟的Office已相當普及,廣泛地為工商企業及個人使用,且其具有易學易懂之特性。所以,本書決定以Excel為工具,來學習統計技巧。
l 八成五的上班族對自己的薪水不滿意,同時近三成的受訪者表示有兼職工作
l 教育費用連年攀升,65年一年只要2142元就夠支付一個孩子的教育費,但到了90年台灣家長平均一年要付出4萬5千元讓孩子受教育,足足增加21倍
l 台灣地區35歲以上的中高齡失業人口數約有25萬人,其中近3成已經苦苦找了超過1年
l 三分之一的民眾認為晚上外出不安全;竊盜和搶奪是民眾最大的困擾
什麼是統計
l 統計學(Statistics)用以蒐集、整理、分析資料,進而推論分析結果之科學方法
l 探討如何由一群數字資料之全體中(母體),以某一抽取過程(抽樣),抽出部份資料(樣本),研討如何利用這一部分資料,去估計/檢定或預測資料全體的某些未知特性值。
統計學範圍
l 蒐集資料
l 整理資料
l 分析資料
l 推論資料
統計學的分類
l 應用統計學(Applied Statistics):著重於如何將統計方法,應用到各種自然或社會科學上。
l 數理統計學(Mathematical Statistics):探討統計學之數學原理
母體
l 母體(Population)研究調查之所有對象,由一群具有某種共同性的基本單位所組成母體可以是
普查
l 普查(census)對整個母體進行全面調查或研究。
抽查
l 抽查(sampling survey)在某一母體中,抽出一小部份個體進行調查而已。
l 抽查之目的,在省時、省力及省錢。
樣本
l 樣本是母體的一個部份,由數個數值所組成,以小寫n表示。
l 使用樣本主要原因為:
l 經濟 時效 難以接觸 母體過大 正確性
影響樣本數大小之因素
l 母體大小:
l 可容忍之誤差:
l 誤差的代價:
l 母體變異量:
觀察値 (observation)
l 觀測一個實驗或統計問題之結果,所記錄下來的結果
參數
l 參數(parameters),
l 母體的數值性敘述值,
l 即用來描述母體某一特性之數字
統計量
l 統計量(statistic)又稱估計值(estimate)
:樣本的數值性敘述值,也就是用來描述樣本某一特性之數字。
抽樣誤差
l 母體與樣本之間的差異
l 抽樣誤差大小決定於兩個因數:
l 樣本大小
l 變異量大小
變數 (variables)
l 描述母體中成員的某一特性。
如:性別、年齡、職業、教育程度、所得、…等人 口統計變數。
l 間斷變數 (discrete variable)或稱不連續變數、類別變數或質變數,
l 連續變數(continuous variable)或稱量變數。如:成績、年齡、所得、長度、距離、體重、身高、智力、溫度、…等,均屬連續變數。
連續變數常見的分析
l 敘述統計:
l 繪製統計圖表:
l 檢定兩組之變異數是否相同:
l 檢定男/女兩組之手機平均月費的均數:
為何要使用Excel來學習統計
l Minitab、SPSS、SAS等統計分析軟體,在市面上的普及率非常之低
l 價格昂貴
l 學習困難
l 報表難懂
l 很容易會面臨到無適當軟體可用之窘境,縱有一身絕技,也難以發揮。
l 微軟的Office已相當普及,廣泛地為工商企業及個人使用,且其具有易學易懂之特性。所以,本書決定以Excel為工具,來學習統計技巧。
l 八成五的上班族對自己的薪水不滿意,同時近三成的受訪者表示有兼職工作
l 教育費用連年攀升,65年一年只要2142元就夠支付一個孩子的教育費,但到了90年台灣家長平均一年要付出4萬5千元讓孩子受教育,足足增加21倍
l 台灣地區35歲以上的中高齡失業人口數約有25萬人,其中近3成已經苦苦找了超過1年
l 三分之一的民眾認為晚上外出不安全;竊盜和搶奪是民眾最大的困擾
什麼是統計
l 統計學(Statistics)用以蒐集、整理、分析資料,進而推論分析結果之科學方法
l 探討如何由一群數字資料之全體中(母體),以某一抽取過程(抽樣),抽出部份資料(樣本),研討如何利用這一部分資料,去估計/檢定或預測資料全體的某些未知特性值。
統計學範圍
l 蒐集資料
l 整理資料
l 分析資料
l 推論資料
統計學的分類
l 應用統計學(Applied Statistics):著重於如何將統計方法,應用到各種自然或社會科學上。
l 數理統計學(Mathematical Statistics):探討統計學之數學原理
母體
l 母體(Population)研究調查之所有對象,由一群具有某種共同性的基本單位所組成母體可以是
普查
l 普查(census)對整個母體進行全面調查或研究。
抽查
l 抽查(sampling survey)在某一母體中,抽出一小部份個體進行調查而已。
l 抽查之目的,在省時、省力及省錢。
樣本
l 樣本是母體的一個部份,由數個數值所組成,以小寫n表示。
l 使用樣本主要原因為:
l 經濟 時效 難以接觸 母體過大 正確性
影響樣本數大小之因素
l 母體大小:
l 可容忍之誤差:
l 誤差的代價:
l 母體變異量:
觀察値 (observation)
l 觀測一個實驗或統計問題之結果,所記錄下來的結果
參數
l 參數(parameters),
l 母體的數值性敘述值,
l 即用來描述母體某一特性之數字
統計量
l 統計量(statistic)又稱估計值(estimate)
:樣本的數值性敘述值,也就是用來描述樣本某一特性之數字。
抽樣誤差
l 母體與樣本之間的差異
l 抽樣誤差大小決定於兩個因數:
l 樣本大小
l 變異量大小
變數 (variables)
l 描述母體中成員的某一特性。
如:性別、年齡、職業、教育程度、所得、…等人 口統計變數。
l 間斷變數 (discrete variable)或稱不連續變數、類別變數或質變數,
l 連續變數(continuous variable)或稱量變數。如:成績、年齡、所得、長度、距離、體重、身高、智力、溫度、…等,均屬連續變數。
連續變數常見的分析
l 敘述統計:
l 繪製統計圖表:
l 檢定兩組之變異數是否相同:
l 檢定男/女兩組之手機平均月費的均數:
訂閱:
文章 (Atom)