2010年3月5日 星期五

第一章 機率與統計概論

第一章 機率與統計概論
為何要使用Excel來學習統計
l Minitab、SPSS、SAS等統計分析軟體,在市面上的普及率非常之低
l 價格昂貴
l 學習困難
l 報表難懂
l 很容易會面臨到無適當軟體可用之窘境,縱有一身絕技,也難以發揮。
l 微軟的Office已相當普及,廣泛地為工商企業及個人使用,且其具有易學易懂之特性。所以,本書決定以Excel為工具,來學習統計技巧。

l 八成五的上班族對自己的薪水不滿意,同時近三成的受訪者表示有兼職工作
l 教育費用連年攀升,65年一年只要2142元就夠支付一個孩子的教育費,但到了90年台灣家長平均一年要付出4萬5千元讓孩子受教育,足足增加21倍
l 台灣地區35歲以上的中高齡失業人口數約有25萬人,其中近3成已經苦苦找了超過1年
l 三分之一的民眾認為晚上外出不安全;竊盜和搶奪是民眾最大的困擾
什麼是統計
l 統計學(Statistics)用以蒐集、整理、分析資料,進而推論分析結果之科學方法
l 探討如何由一群數字資料之全體中(母體),以某一抽取過程(抽樣),抽出部份資料(樣本),研討如何利用這一部分資料,去估計/檢定或預測資料全體的某些未知特性值。
統計學範圍
l 蒐集資料
l 整理資料
l 分析資料
l 推論資料
統計學的分類
l 應用統計學(Applied Statistics):著重於如何將統計方法,應用到各種自然或社會科學上。
l 數理統計學(Mathematical Statistics):探討統計學之數學原理
母體
l 母體(Population)研究調查之所有對象,由一群具有某種共同性的基本單位所組成母體可以是
普查
l 普查(census)對整個母體進行全面調查或研究。
抽查
l 抽查(sampling survey)在某一母體中,抽出一小部份個體進行調查而已。
l 抽查之目的,在省時、省力及省錢。
樣本
l 樣本是母體的一個部份,由數個數值所組成,以小寫n表示。
l 使用樣本主要原因為:
l 經濟 時效 難以接觸 母體過大 正確性
影響樣本數大小之因素
l 母體大小:
l 可容忍之誤差:
l 誤差的代價:
l 母體變異量:
觀察値 (observation)
l 觀測一個實驗或統計問題之結果,所記錄下來的結果
參數
l 參數(parameters),
l 母體的數值性敘述值,
l 即用來描述母體某一特性之數字
統計量

l 統計量(statistic)又稱估計值(estimate)
:樣本的數值性敘述值,也就是用來描述樣本某一特性之數字。
抽樣誤差
l 母體與樣本之間的差異
l 抽樣誤差大小決定於兩個因數:
l 樣本大小
l 變異量大小
變數 (variables)
l 描述母體中成員的某一特性。
如:性別、年齡、職業、教育程度、所得、…等人 口統計變數。

l 間斷變數 (discrete variable)或稱不連續變數、類別變數或質變數,
l 連續變數(continuous variable)或稱量變數。如:成績、年齡、所得、長度、距離、體重、身高、智力、溫度、…等,均屬連續變數。
連續變數常見的分析
l 敘述統計:
l 繪製統計圖表:
l 檢定兩組之變異數是否相同:
l 檢定男/女兩組之手機平均月費的均數:

沒有留言:

張貼留言