高考导航
考试要求重难点击命题展望
1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.
2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、茎叶图,理解它们各自的特点,理解样本数据标准差的意义和作用,会计算数据标准差,能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想,会用随机抽样的基本方法和样本估计总体 的思想解决一些简单的实际问题.
3.会作两个有关联变量的散点图,会利用散点图认识变量间的相关关系,了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解回归的基本思想、方法及其简单应用.
4.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. 本章重点:1.三种抽样方法的区别、联系及操作步骤.2.样本频率分布直方图和茎叶图.3.用样本估计总体的思想.
本章难点:回归直线方程与独立性检验. 统计多数以选择题和填空题形式考查,大题只在个别省的考题中出现过.难度属于基础 题和中档题.考点往往集中体现在抽样方法、频率分布图表这两个方面.另外,应注意统计题反映出来的综合性与应用性,如与数列、概率等的综合,用统计方法提供决策、制定方案等,以此考查学生搜集处理信息及分析解决问题的能力.
知识网络
13.1 抽样方法与用样本估计总体
典例精析
题型一 抽样方法
【例1】某校有教师200人,男学生1 200人,女学生1 000人,用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知女学生抽取的人数为80人,则n的值为 .
【解析】根据分层抽样的意义,
n200+1 200+1 000=801 000,解得n=192.
【点拨】现实中正确的分层抽样一般有三个步骤:首先,辨明突出的统计特征和分类.其次,确定每个分层在总体上的比例.利用这个比例,可计算出样本中每组(层)应抽取的人数.最后,必须从每层中抽取独立简单随机样本.
【变式训练1】从某厂生产的802辆轿车中随机抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
【解析】第一步,将802辆轿车用随机方式编号.
第二步,从总体中剔除2辆(剔除方法可用随机数表法),将剩余的800辆轿车重新编号(分别为001,002,003,…,800),并分成80段.
第三步,在第一段001,002,…,010这十个编号中用简单随机抽样抽出一个(如005)作为起始号码.
第四步,将编号为005,015,025,…,795的个体抽出,组成样本.
题型二 频率分布直方图
【例2】(2 010湖南)如图是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.
(1)求直方图中x的值;
(2)若将频率视为概率,从这个城市随机抽取3位居民(看作有放回的抽样),求月均用水量在3至4吨的居民数X的分布列和数学期望.
【解析】(1)依题意及频率分布直方图知0 .02+0.1+x+0.37+0.39=1,解得x=0.12.
(2)由题意知X~B(3,0.1),因此
P(X=0)=C03×0.93=0.729,
P(X=1)=C13×0.1×0.92=0.243,
P(X=2)=C23×0.12×0.9 =0.027,
P(X=3)=C33×0.13=0.001,
故随机变量X的分布列为
X0123
P0.7290.2430.0270. 001
X的数学期望为E(X)=3×0.1=0.3.
(或E(X)=1×0.243+2×0.027+3×0.001=0.3)
【点拨】从频率分布直方图读取数据时,要特别重视组距,纵坐标是频率除以组距,故长方形的面积之和为1.
【变式训练2】如图是容量为100的样本的频率分布直方图,试根据数据填空:
(1)样本数据落在[10,14)内的频数为 ;
(2)样本数据落在[6,10)内的频率为 ;
(3)总体落在[2,6)内的频率为 .
【解析】(1)样本落在[10,14)内的频数为0.09×4×100=36.
(2)样本落在[6,10)内的频率为0.08×4=0.32.
(3)样本落在[2,6)内的频率为0.02×4=0.08,所以总体落在[2,6)内的频率约为0.08.
题型三 平均数、方差的计算
【例3】甲、乙两人在相同条件下各射靶10次,每次命中环数如下:
甲 4 7 10 9 5 6 8 6 8 8
乙 7 8 6 8 6 7 8 7 5 9
试 问谁10次射靶的情况较稳定?
【解析】本题要计算两样本的方差,当样本平均数不是整数,且样本数据不大时,可用简化公式计算方差.
=110(4+7+…+8)=7.1,
=110(7+8+…+9)=7.1,
s2甲=110(42+72+…+82-10×7.12)=3.09,
s2乙=110(72+82+…+92-10×7.12)=1.29,
因为s2甲>s2乙,所以乙10次射靶比甲10次射靶情况稳定.
【点拨】平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据的离散程度就越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
【变式训练3】(2010北京市东城区)在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如右图.
(1)计算此样本的平均成绩及方差;
(2)现从此样本中随机抽出2名学生的成绩,设抽出分数为90分以上的人数为X,求随机变量X的分布列和均值.
【解析】(1)样本的平均成绩 =80;
方差为s2=110[(92-80)2+(98-80)2+(98-80)2+(85-80)2+(85-80)2+(74-80)2+(74-80)2+(74-80)2 +(60-80)2+(60-80)2]=175.
(2)由题意,随机变量X=0,1,2.
P(X=0)=C27C210=715,P(X=1)=C13C17C210=715,P(X=2)=115.
随机变量X的分布列为
X012
P
E(X)=0×715+1×715+2×115=35.
总结提高
1.统计的基本思想是用样本估计总体.这就 要求样本具有很好的代表性,而样本良好客观的代表性,则完全依赖抽样方法.
2.三种抽样方法中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,它们的共同点都是等概率抽样.适用范围不同,要根据总体的具体情况 选用不同的方法.
3.对于总体分布,总是用样本的频率分布对它进行估计.
4.用样本估计总体,一般分成以下几个步骤:
先求样本数据中的最大值和最小值(称为极值),再确定合适的组数和组距,确定分点(每个分点只属于一组,故一般采用半开半闭区间),然后列出频率分布表(准确,查数据容易),画频率 分布直方图.
13.2 两变量间的相关性、回归分析和独立性检验
典例精析
题型一 求回归直线方程
【例1】下表是关于某设备的使用年限(年)和所需要的维修费用(万元)的几组统计数据:
x23456
y2.23.85.56.57.0
(1)若y对x呈线性相关关系,求出y关于x的线性回归方程y= x+ ;
(2)估计使用年限为10年时,维修费用为多少?
【解析】(1)因为 xiyi=112.3, x2i=4+9+16+25+36=90,且 =4, =5,n=5,
所以 =112.3-5×4×590-5×16=12.310=1.23, =5-1.23×4=0.08,
所以回归直线方程为y=1.23x+0.08.
(2)当x=10时,y=1.23×10+0.08=12.38,
所以估计当使用10年时,维修费用约为12.38万元.
【点拨】当x与y呈线性相关关系时,可直接求出回归直线方程,再利用回归直线方程进行计算和预测.
【变式训练1】某工厂经过技术改造后,生产某种产品的产量(吨)与相应的生产能耗(吨标准煤)有如下几组样本数据.
x3456
y2.5344.5
据相关性检验,y与x具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,那么y关于x的回归直线方程是 .
【解析】先求得 =4.5, =3.5,由 =0.7x+a过点( , ),则a=0.35,所以回归直线方程是 =0.7x+0.35.
题型二 独立性检验
【例2】研究小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:
种子灭菌种子未灭菌合计
黑穗病26184210
无黑穗病50200250
合计76384460
试按照原试验目的作统计分析推断.
【解析】由列联表得:
a=26,b=1 84,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.
所以K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=460×(26×200-184×50)2210×250×76×384≈4.804,
由于K2≈4.804>3.841,
所以有95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.
【变式训练2】(2010东北三 省三校模拟)某 研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有 %的把握认为该学校15至16周岁的男生的身高和体重之间有关系.
超重不超重合计
偏高415
不偏高31215
合计71320
附:独立性检验临界值表
P(K2≥k0)0.0250.0100.0050.001
k05.0246.6357.87910.828
(独立性检验随机变量K2值的计算公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d))
【解析】由表可得a+b=5,c+d=1 5,a+c=7,b+d=13,ad=48,bc=3,n=20,运用独立性检验随机变量K2值的计算公式得K2=20×(48-3)25×15×7×13=54091≈5.934,
由于K2≈5.934>5.024,所以有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.
总结提高
1.在研究两个变量之间是否存在某种关系时,必须从散点图入手.
本文来自:逍遥右脑记忆 https://www.jiyifa.com/gaosan/76065.html
相关阅读: