AP統(tǒng)計學備考四大要點總結

知識點時間：2020-03-25 15:15

在當今社會發(fā)展中，數(shù)據(jù)統(tǒng)計越來越重要，不少專業(yè)領域對于學生統(tǒng)計學知識的掌握也愈發(fā)看重，今天A加未來小編就帶大家一起來解析一下在AP統(tǒng)計學備考中的一些要點和公式，一起來了解一下吧！

th (7).jpg

一. Exploring Data

探索性數(shù)據(jù)分析部分包括分類變量的描述分析和數(shù)值型變量的描述分析兩部分。

分類變量包含兩部分：單變量分類變量部分要了解頻數(shù)分布表（frequency distribution table），條形圖（bar chart）以及餅圖（pie chart）；雙變量分類變量部分要掌握列聯(lián)表（two-way table）的圖形展示方法即對比條形圖，如何求列聯(lián)表中某一個cell對應的expected number。

單變量數(shù)值型變量 (univariate metric variable) 部分要掌握的主要內(nèi)容包括：

頻數(shù)分布表 (frequency distribution table)，點圖（dot plot），條形圖（stem plot），直方圖（histogram）。
分布的三種形狀：對稱分布（symmetric distribution）、左偏分布（skew to the left）、右偏分布（skew to the right）
分布中可以體現(xiàn)出的特征：集群和缺口（cluster and gap），異常值（outlier）：指與數(shù)據(jù)中的其他部分有顯著不同的數(shù)據(jù)點。
衡量分布的中心（center of distribution）：均值（mean），中位數(shù)（median），眾數(shù)（mode），其中中位數(shù)和眾數(shù)不受outlier的影響。一個mode的數(shù)據(jù)為unimodal，兩個mode的數(shù)據(jù)為bimodal。
衡量分布的波動（variation of distribution）：極差（range）、標準差（standard deviation）以及四分數(shù)差（interquartile range）。其中四分位差不受異常值的影響.
衡量分布的位置（position of distribution）：四分位數(shù)（quartiles）、百分位數(shù)（percentiles）以及標準計分（z-score）。
箱線圖（boxplot），掌握如何繪制箱線圖，并讀取箱線圖的數(shù)據(jù)。
對隨機變量X進行變換（add or multiple）后，變換后新隨機變量的均值，中位數(shù)，標準差，四分位數(shù)，極差，四分位差等的變換。

雙變量數(shù)值型變量（bivariate metric variable）部分要掌握的主要內(nèi)容包括：

散點圖（scatterplot)，散點圖可以反映出：變量之間是否有關系，正關系還是負關系，關系強弱程度。
相關系數(shù)（Correlation）是衡量兩個變量之間相關程度大小的量，取值范圍為[-1,1]。改變變量的計量單位對變量間相關系數(shù)的大小沒有影響。
最小二乘回歸線 (least square regression line)，，掌握截距項（intercept）和斜率（slope）兩個系數(shù)的含義，殘差（residual）的定義，判定系數(shù)（Coefficient of determination）的含義，殘差圖（residual plot）及斜率的區(qū)間估計和假設檢驗。

二. 抽樣和實驗設計（sampling and experiment）

抽樣和實驗設計部分需要掌握的主要內(nèi)容包括：

數(shù)據(jù)獲取的方式主要包括四種：普查、抽樣調(diào)查、觀測研究和實驗設計
抽樣方法主要包含兩種：隨機抽樣（random sampling）和有偏抽樣（biased sampling）。隨機抽樣主要包括：簡單隨機抽樣（simple random sampling），分層隨機抽樣（stratified random sampling）、系統(tǒng)抽樣（systematic sampling）以及整群抽樣（cluster sampling）。有偏抽樣主要包括：判斷抽樣（judgmental sampling）、方便抽樣（convenience sampling）以及自愿樣本（volunteer sampling）。
抽樣中可能存在的誤差或偏差。抽樣誤差（Sampling error）是指由于抽樣這一動作所帶來的誤差，所以不可消除，只能通過一定的手段降低。涵蓋不全偏差（undercoverage bias）、無回答偏差（nonresponse bias）以及回答偏差（response bias）等。
實驗設計的基本概念

三. 抽樣和實驗設計（sampling and experiment）

總體參數(shù)以及所對應的樣本統(tǒng)計量，如：總體均值對應樣本均值，總體方差對應樣本方差，總體標準差對應樣本標準差，總體比例對應樣本比例，總體均值差對應樣本均值差，總體比例差對應樣本均值差。
樣本均值的抽樣分布，樣本均值如何實現(xiàn)正態(tài)分布：
獨立樣本均值差的抽樣分布，樣本均值差如何實現(xiàn)正態(tài)分布：
樣本比例的抽樣分布，樣本比例如何實現(xiàn)正態(tài)分布：
獨立樣本比例差的抽樣分布，樣本比例差如何實現(xiàn)正態(tài)分布：

四. 統(tǒng)計推斷 (statistical inference)

統(tǒng)計推斷包含參數(shù)估計和假設檢驗兩部分。

參數(shù)估計需要掌握的主要內(nèi)容包括：

點估計。掌握如何評價一個統(tǒng)計量的好壞。一個好的統(tǒng)計量要具體的特征是：無偏性（unbiasedness）和有效性（efficiency），其中有效是指統(tǒng)計量抽樣分布的波動小。
區(qū)間估計

區(qū)間估計中，首先要掌握置信水平的含義。置信水平95%是指，在多次重復抽樣下針對多個樣本構建的置信區(qū)間中，95%的置信區(qū)間包含總體參數(shù)值，5%不包含總體參數(shù)值。
總體均值 u 的區(qū)間估計。掌握總體標準差未知時u的區(qū)間估計
總體比例 p 的區(qū)間估計。
總體比例差的區(qū)間估計。
總體均值差的區(qū)間估計。掌握總體標準差未知時的區(qū)間估計：總體均值差的區(qū)間估計（配對樣本）。
回歸直線回歸系數(shù)的區(qū)間估計。