AP統(tǒng)計(jì)學(xué)備考四大要點(diǎn)總結(jié)
在當(dāng)今社會(huì)發(fā)展中,數(shù)據(jù)統(tǒng)計(jì)越來越重要,不少專業(yè)領(lǐng)域?qū)τ趯W(xué)生統(tǒng)計(jì)學(xué)知識(shí)的掌握也愈發(fā)看重,今天A加未來小編就帶大家一起來解析一下在AP統(tǒng)計(jì)學(xué)備考中的一些要點(diǎn)和公式,一起來了解一下吧!
一. Exploring Data
探索性數(shù)據(jù)分析部分包括分類變量的描述分析和數(shù)值型變量的描述分析兩部分。
分類變量包含兩部分:單變量分類變量部分要了解頻數(shù)分布表(frequency distribution table),條形圖(bar chart)以及餅圖(pie chart);雙變量分類變量部分要掌握列聯(lián)表(two-way table)的圖形展示方法即對比條形圖,如何求列聯(lián)表中某一個(gè)cell對應(yīng)的expected number
。
頻數(shù)分布表 (frequency distribution table),點(diǎn)圖(dot plot),條形圖(stem plot),直方圖(histogram)。
分布的三種形狀:對稱分布(symmetric distribution)、左偏分布(skew to the left)、右偏分布(skew to the right)
分布中可以體現(xiàn)出的特征:集群和缺口(cluster and gap),異常值(outlier):指與數(shù)據(jù)中的其他部分有顯著不同的數(shù)據(jù)點(diǎn)。
衡量分布的中心(center of distribution):均值(mean),中位數(shù)(median),眾數(shù)(mode),其中中位數(shù)和眾數(shù)不受outlier的影響。一個(gè)mode的數(shù)據(jù)為unimodal,兩個(gè)mode的數(shù)據(jù)為bimodal。
衡量分布的波動(dòng)(variation of distribution):極差(range)、標(biāo)準(zhǔn)差(standard deviation)以及四分?jǐn)?shù)差(interquartile range)。其中四分位差不受異常值的影響.
衡量分布的位置(position of distribution):四分位數(shù)(quartiles)、百分位數(shù)(percentiles)以及標(biāo)準(zhǔn)計(jì)分(z-score)。
箱線圖(boxplot),掌握如何繪制箱線圖,并讀取箱線圖的數(shù)據(jù)。
對隨機(jī)變量X進(jìn)行變換(add or multiple)后,變換后新隨機(jī)變量的均值,中位數(shù),標(biāo)準(zhǔn)差,四分位數(shù),極差,四分位差等的變換。
散點(diǎn)圖(scatterplot),散點(diǎn)圖可以反映出:變量之間是否有關(guān)系,正關(guān)系還是負(fù)關(guān)系,關(guān)系強(qiáng)弱程度。
相關(guān)系數(shù)(Correlation)是衡量兩個(gè)變量之間相關(guān)程度大小的量,取值范圍為[-1,1]。改變變量的計(jì)量單位對變量間相關(guān)系數(shù)的大小沒有影響。
最小二乘回歸線 (least square regression line),,掌握截距項(xiàng)(intercept)和斜率(slope)兩個(gè)系數(shù)的含義,殘差(residual)的定義,判定系數(shù)(Coefficient of determination)的含義,殘差圖(residual plot)及斜率的區(qū)間估計(jì)和假設(shè)檢驗(yàn)。
單變量數(shù)值型變量 (univariate metric variable) 部分要掌握的主要內(nèi)容包括:
雙變量數(shù)值型變量(bivariate metric variable)部分要掌握的主要內(nèi)容包括:
二. 抽樣和實(shí)驗(yàn)設(shè)計(jì)(sampling and experiment)
抽樣和實(shí)驗(yàn)設(shè)計(jì)部分需要掌握的主要內(nèi)容包括:
數(shù)據(jù)獲取的方式主要包括四種:普查、抽樣調(diào)查、觀測研究和實(shí)驗(yàn)設(shè)計(jì)
抽樣方法主要包含兩種:隨機(jī)抽樣(random sampling)和有偏抽樣(biased sampling)。隨機(jī)抽樣主要包括:簡單隨機(jī)抽樣(simple random sampling),分層隨機(jī)抽樣(stratified random sampling)、系統(tǒng)抽樣(systematic sampling)以及整群抽樣(cluster sampling)。有偏抽樣主要包括:判斷抽樣(judgmental sampling)、方便抽樣(convenience sampling)以及自愿樣本(volunteer sampling)。
抽樣中可能存在的誤差或偏差。抽樣誤差(Sampling error)是指由于抽樣這一動(dòng)作所帶來的誤差,所以不可消除,只能通過一定的手段降低。涵蓋不全偏差(undercoverage bias)、無回答偏差(nonresponse bias)以及回答偏差(response bias)等。
實(shí)驗(yàn)設(shè)計(jì)的基本概念
自變量、因變量
混淆變量(confounding):既不是自變量,又不是因變量,但對因變量有影響的變量。
因子(factor):可以簡單地當(dāng)做自變量來理解。水平(Level):因子下的取值個(gè)數(shù)。處理(Treatment):施加給實(shí)驗(yàn)單位的具體處理
控制組(control group),安慰劑(placebo)以及安慰劑組(placebo group)
實(shí)驗(yàn)設(shè)計(jì)的三要素:隨機(jī)化、控制、實(shí)驗(yàn)的可重復(fù)性
幾種常見的實(shí)驗(yàn)設(shè)計(jì):
完全隨機(jī)化設(shè)計(jì)(completely randomized design)
隨機(jī)區(qū)組設(shè)計(jì)(randomized block design)
配對設(shè)計(jì)(matched pairs design)
三. 抽樣和實(shí)驗(yàn)設(shè)計(jì)(sampling and experiment)
概率部分要掌握的知識(shí)點(diǎn)主要包括:
概率的兩個(gè)基本準(zhǔn)則
互補(bǔ)事件 P(A)+P(A')=1
互斥事件
交集
并集 P(A orB)=P(A)+P(B)-P(A and B)
條件概率 P(A|B)=[P(A and B)]/P(B)
獨(dú)立的概念 P(A|B)=P(A), P(A and B)=P(A)*P(B)
概率分布部分要掌握的知識(shí)點(diǎn)主要包括:
離散型隨機(jī)變量的概率分布,其中主要涉及均值,標(biāo)準(zhǔn)差的計(jì)算。
常見的離散分布:二項(xiàng)分布,如何求概率,以及均值、標(biāo)準(zhǔn)差的計(jì)算公式。
常見的離散分布:幾何分布,如何求概率。
連續(xù)型隨機(jī)變量的概率分布,掌握對于連續(xù)型隨機(jī)變量的概率分布,概率等于曲線下方所涵蓋的面積。
常見的連續(xù)型隨機(jī)變量的概率分布:正態(tài)分布(AP統(tǒng)計(jì)學(xué)中最重要的分布)
如何通過標(biāo)準(zhǔn)化變換得到z-score,
。
統(tǒng)計(jì)量及其抽樣分布
這部分需要掌握的主要內(nèi)容包括:
總體參數(shù)以及所對應(yīng)的樣本統(tǒng)計(jì)量,如:總體均值對應(yīng)樣本均值,總體方差對應(yīng)樣本方差,總體標(biāo)準(zhǔn)差對應(yīng)樣本標(biāo)準(zhǔn)差,總體比例對應(yīng)樣本比例,總體均值差對應(yīng)樣本均值差,總體比例差對應(yīng)樣本均值差。
樣本均值的抽樣分布,樣本均值如何實(shí)現(xiàn)正態(tài)分布:
獨(dú)立樣本均值差的抽樣分布,樣本均值差如何實(shí)現(xiàn)正態(tài)分布:
樣本比例的抽樣分布,樣本比例如何實(shí)現(xiàn)正態(tài)分布:
獨(dú)立樣本比例差的抽樣分布,樣本比例差如何實(shí)現(xiàn)正態(tài)分布:
四. 統(tǒng)計(jì)推斷 (statistical inference)
統(tǒng)計(jì)推斷包含參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分。
參數(shù)估計(jì)需要掌握的主要內(nèi)容包括:
點(diǎn)估計(jì)。掌握如何評價(jià)一個(gè)統(tǒng)計(jì)量的好壞。一個(gè)好的統(tǒng)計(jì)量要具體的特征是:無偏性(unbiasedness)和有效性(efficiency),其中有效是指統(tǒng)計(jì)量抽樣分布的波動(dòng)小。
區(qū)間估計(jì)
區(qū)間估計(jì)中,首先要掌握置信水平的含義。置信水平95%是指,在多次重復(fù)抽樣下針對多個(gè)樣本構(gòu)建的置信區(qū)間中,95%的置信區(qū)間包含總體參數(shù)值,5%不包含總體參數(shù)值。
總體均值 u 的區(qū)間估計(jì)。掌握總體標(biāo)準(zhǔn)差未知時(shí)u的區(qū)間估計(jì)
總體比例 p 的區(qū)間估計(jì)。
總體比例差
的區(qū)間估計(jì)。
總體均值差
的區(qū)間估計(jì)。掌握總體標(biāo)準(zhǔn)差未知時(shí)
的區(qū)間估計(jì):
總體均值差
的區(qū)間估計(jì)(配對樣本)。
回歸直線回歸系數(shù)
的區(qū)間估計(jì)。
如何確定樣本量 n
估計(jì)總體均值 u 的情況,利用不等式
求解。
估計(jì)總體均值 p 的情況,利用不等式
求解。
如何提出零假設(shè)
和備擇假設(shè)
。其中
是搜集樣本想要拒絕的假設(shè);而
是搜集樣本想要支持的假設(shè)。
掌握假設(shè)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量就是對應(yīng)統(tǒng)計(jì)量的標(biāo)準(zhǔn)化。
掌握 p-value 的含義。掌握
時(shí),拒絕
。
總體均值 u 的假設(shè)檢驗(yàn)。掌握總體標(biāo)準(zhǔn)差未知時(shí) u 的假設(shè)檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為:
總體比例 p 的假設(shè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為:
總體比例差
的假設(shè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為:
總體均值差
的假設(shè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為:
回歸直線回歸系數(shù)
的假設(shè)檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為:
單變量分類變量的假設(shè)檢驗(yàn)(卡方擬合優(yōu)度檢驗(yàn)),檢驗(yàn)統(tǒng)計(jì)量為:
雙變量分類變量的假設(shè)檢驗(yàn),卡方獨(dú)立性檢驗(yàn)和比例同質(zhì)性檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為:
當(dāng)給定邊際誤差最大值時(shí),求至少要保證樣本量達(dá)到多大才會(huì)實(shí)現(xiàn)對邊際誤差的控制。
假設(shè)檢驗(yàn)需要掌握的主要內(nèi)容包括:
假設(shè)檢驗(yàn)
以上就是A加未來小編關(guān)于AP統(tǒng)計(jì)學(xué)備考中的要點(diǎn)內(nèi)容總結(jié),希望能夠?qū)Υ蠹铱荚嚨臏?zhǔn)備帶來一些幫助和參考。更多AP學(xué)習(xí)問題,歡迎隨時(shí)咨詢我們喲!

最新文章 More
-
2020-10-16
-
2019年alevel中文考試介紹和考試資料以及考試時(shí)間
2019-06-03
-
2019-12-19
相關(guān)推薦

猜你喜歡 More

2020-08-24
對比英美高考,alevel和sat哪個(gè)難?
2019-09-09
igcse課程有什么用,為什么要學(xué)習(xí)IGCSE課程
2019-08-28
ib課程都有哪些科目?