登录 / 注册
首页>高考复习>高考课件>数学课件

免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件

以下为幻灯片页面截图,请点击左边“我要下载”按钮免费下载无水印完整文件
免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件免费下载数学高考专题总复习统计、统计案例、算法初步ppt课件
统计、统计案例、算法初步
第一节 随机抽样
第二节 用样本估计总体
第三节 变量间的相关关系 统计案例
第四节 算法初步
目 录
统计、统计案例、算法初步
[知识能否忆起]
一、简单随机抽样
1.简单随机抽样的概念:
设一个总体含有N个个体,从中逐个 地抽取n个个体作为样本 ,如果每次抽取时总体内的各个个体被抽到的机会 ,就把这种抽样方法叫做简单随机抽样.
不放回
(n≤N)
都相等
2.最常用的简单随机抽样方法有两种——______
和 .
二、系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本:
(1)先将总体的N个个体 ;
分段间隔k
(3)在第1段用 确定第一个个体编号l(l≤k);
抽签法
随机数法
编号
简单随机抽样
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号 ,再加k得到第3个个体编号 ,依次进行下去,直到获取整个样本.
三、分层抽样
1.分层抽样的概念:
在抽样时,将总体 ,然后按照____
,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
2.当总体是由 组成时,往往选用分层抽样的方法.
3.分层抽样时,每个个体被抽到的机会是 的.
l+k
l+2k
分成互不交叉的层
一定
的比例
差异明显的几个部分
均等
1.(教材习题改编)在某班的50名学生中,依次抽取学号为
5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是 (  )
A.随机抽样        B.分层抽样
C.系统抽样 D.以上都不是
解析:由系统抽样的特点可知C正确.
[小题能否全取]
答案:C
2.为了了解一批零件的长度,抽测了其中200个零件的长
度,在这个问题中,200个零件的长度是 (  )
A.总体 B.个体是每一个零件
C.总体的一个样本 D.样本容量
解析: 200个零件的长度是总体的一个样本.
答案:C
3.某工厂生产A,B,C三种不同型号的产品,产品的
数量之比依次为3∶4∶7,现在用分层抽样的方法抽出容量为n的样本,样本中A型产品有15件,那么样本容量n为 (  )
A.50 B.60
C.70 D.80
答案:C
4.(2012·金华模拟)某学院有A,B,C三个专业共1 200
名学生.现采用分层抽样的方法抽取一个容量为120的样本,已知A专业有420名学生,B专业有380名学生,则在C专业应抽取________名学生.
答案:40
5.将某班的60名学生编号为:01,02,…,60,采用系统
抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.
解析:依据系统抽样方法的定义知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、…、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).
答案:16,28,40,52
三种抽样方法的异同点:
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的机会均等
从总体中逐个抽取
总体中的个体数较少
系统
抽样
将总体均匀分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
简单随机抽样
[例1] 下面的抽样方法是简单随机抽样的是(  )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
[答案] D
[自主解答] A、B是系统抽样,因为抽取的个体间的间隔是固定的;C是分层抽样,因为总体的个体有明显的层次;D是简单随机抽样.
1.简单随机抽样需满足:(1)抽取的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.
2.简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
1.(2012·宁波月考)在简单随机抽样中,某一个个体被
抽到的可能性 (  )
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等
D.与第几次抽样无关,与样本容量无关
解析:由随机抽样的特点知某个体被抽到的可能性与第几次抽样无关,每一次抽到的可能性相等.
答案:C
系 统 抽 样
[例2]  (2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为 (  )
A.7           B.9
C.10 D.15
答案:C
1. 系统抽样适用的条件是总体容量较大,样本容量也较大.
2. 使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体.
2.(2012·武夷模拟)用系统抽样法从160名学生中抽取
容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.
答案: 6
解析:设第1组抽取的号码为b,则第n组抽取的号码为8(n-1)+b,∴8×(16-1)+b=126,∴b=6,故第1组抽取的号码为6.
[例3]  (1)(2012·福建高考)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.
(2)(2012·天津高考)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.
分 层 抽 样
[答案]  (1)12 (2)18 9
本例(2)中条件变为“某地区有小学、中学、大学若干所,现采用分层抽样的方法从这些学校中抽取30所学校,其中从150所小学中抽取18所”试求该地区共有多少所学校.
进行分层抽样时应注意以下几点
(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
3.(2012·惠州二调)某工厂的一、二、三车间在12月份共
生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a、b、c,且a、b、c构成等差数列,则二车间生产的产品数为 (  )
A.800           B.1 000
C.1 200 D.1 500
答案: C
[典例] (2012·四川高考)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,
43,则这四个社区驾驶员的总人数N为 (  )
A.101          B.808
C.1 212 D.2 012

[答案] B
1.因忽视了分层抽样中各层的抽样比相同而导致本题不会列出比例关系式求解.
某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为________.
答案: 15,2,3
1.(2012·抚顺模拟)某商场有四类食品,其中粮
食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 (  )
教师备选题(给有能力的学生加餐)
A.4 B.5
C.6 D.7
答案: C
2.某工厂生产A、B、C三种不同型号的产品,其相应产
品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n=________.
答案:80
[知识能否忆起]
一、作频率分布直方图的步骤
1.求极差(即一组数据中 与 的差).
2.确定 与 .
3.将数据 .
4.列 .
5.画 .
最大值
最小值
组距
组数
分组
频率分布表
频率分布直方图
二、频率分布折线图和总体密度曲线
1.频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得频率分布折线图.
2.总体密度曲线:随着 的增加,作图时
增加, 减小,相应的频率折线图会越来越接近于 ,即总体密度曲线.
中点
样本容量
所分的组数
组距
一条光滑曲线
三、样本的数字特征
最多
最中间
平均数
相等
四、茎叶图
茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.
[小题能否全取]
1.(教材习题改编)在如图所示的茎叶图
表示的数据中,众数和中位数分别是
(  )
A.23与26   B.31与26
C.24与30 D.26与30
答案:B
解析:观察茎叶图可知,这组数据的众数是31,中位数是26.
2.(教材习题改编)把样本容量为20的数据分组,分组区
间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是 (  )
A.0.05          B.0.25
C.0.5 D.0.7
答案:D
3.(2012·长春模拟)从某小学随机抽取100名同学,将他们
的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为 (  )
A.20 B.25
C.30 D.35
答案:C
解析:由题意知a×10+0.35+0.2+0.1+0.05=1,
则a=0.03,故学生人数为0.3×100=30.
4.(教材习题改编)甲、乙两人比赛射击,两人所得的平均
环数相同,其中甲所得环数的方差为5,乙所得环数如下:5、6、9、10、5,那么这两人中成绩较稳定的是________.
答案:乙
5.(2012·山西大同)将容量为n的样本中的数据分为6组,
绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=________.
答案:60
1.在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标.
2.注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率/组距.
3.方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
[例1] (2012·广东高考)
某校100名学生期中考
试语文成绩的频率分布直方
图如图所示,其中成绩分组
区间是:[50,60),[60,70),
[70,80),[80,90),[90,100].
用样本的频率分布估计总体分布
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
[自主解答] (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
在本例条件下估计样本数据的众数.
解:众数应为最高矩形的中点对应的横坐标,故约为65.
解决频率分布直方图问题时要抓住
(1)直方图中各小长方形的面积之和为1.

(3)直方图中每组样本的频数为频率×总体数.
1.(2012·深圳调研)某中学组
织了“迎新杯”知识竞赛,
从参加考试的学生中抽出
若干名学生,并将其成绩
绘制成频率分布直方图(如
图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80),[80,90),[90,100],已知样本中成绩小于70分的个数是36,则样本中成绩在[60,90)内的学生人数为________.
答案:90
茎叶图的应用
[答案] B
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁.
2.(2012·淮北模考)如图所示的茎叶图记录了一组数据,
关于这组数据,其中说法正确的序号是________.
①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.
答案: ①②
样本的数字特征
A.nm
C.n=m D.不能确定
(2)(2012·山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是 (  )
A.众数 B.平均数
C.中位数 D.标准差
(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.
[答案] (1)A (2)D
(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征.
(2)中位数是样本数据居中的数.
(3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散,标准差、方差越小,数据越集中.
3.(2012·淄博一检)一农场在同一块稻田中种植一种水稻,
其连续8年的产量(单位:kg)如下:450,430,460,440,450,
440,470,460,则该组数据的方差为 (  )
A.120 B.80
C.15 D.150
答案:D

[典例] (2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.
[尝试解题] 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.
[答案] 9
1.忽视频率分布直方图中纵轴的含义为频率/组距,误认为是每组相应的频率值,导致失误.
2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求.
3.不理解由直方图求样本平均值的方法误用每组的频率乘以每组的端点值,而导致失误.
对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h的电子元件的数量与使用寿命在300~600 h的电子元件的数量的比是 (  )
答案: C
1.(2012·陕西高考)对某商店一个月内每天
的顾客人数进行了统计,得到样本的茎
叶图(如图所示),则该样本的中位数、
众数、极差分别是 (  )
A.46,45,56
B.46,45,53
C.47,45,56
D.45,47,53
教师备选题(给有能力的学生加餐)
答案: A
2.(2012·济南调研)如图是2012年在某大
学自主招生面试环节中,七位评委为
某考生打出的分数的茎叶统计图,去
掉一个最高分和一个最低分后,所剩
数据的平均数和方差分别为(  )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
答案:390
[知识能否忆起]
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种 关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为 ,点分布在左上角到右下角的区域内,两个变量的相关关系为 .
非确定性
正相关
负相关
二、两个变量的线性相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有 ,这条直线叫 .
线性相关关系
回归直线
当r>0时,表明两个变量 ;
当r<0时,表明两个变量 .
r的绝对值越接近于1,表明两个变量的线性相关性 .r的绝对值越接近于0时,表明两个变量之间
.通常|r|大于 时,认为两个变量有很强的线性相关性.
正相关
负相关
越强
几乎不存在线性相关关系
0.75
三、独立性检验
1.2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
a+b+c+d
b+d
a+c
总计
c+d
d
c
x2
a+b
b
a
x1
合计
y2
y1
2.用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.
3.当K2>3.841时,则有95%的把握说事件A与B有关;
当K2>6.635时,则有99%的把握说事件A与B有关;
当K2>2.706时,则有90%的把握说事件A与B有关.
[小题能否全取]
1.(教材习题改编)观察下列各图形
其中两个变量x、y具有相关关系的图是(  )
A.①②         B.①④
C.③④ D.②③
解析:由散点图知③④具有相关关系.
答案:C
A.2 B.1
C.-2 D.-1
答案:A
3.在一次对性别与说谎是否相关的调查中,得到如下数
据:
30
16
14
合计
17
9
8

13
7
6

合计
不说谎
说谎
根据表中数据,得到如下结论中正确的一项是(  )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
答案:D
答案:83%
5.已知x,y之间的数据如表所示,则回归直线过点_____.
3.8
3.2
2.5
1.8
1.2
y
5
4
3
2
1
x
答案:(3,2.5)
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.
2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.
3.使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.
[自主解答] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
[答案] D
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.
3.由相关系数r判断时|r|越趋近于1相关性越强.
1.已知变量x,y之间具有线性相关关系,其散点图如图所
示,则其回归方程可能为 (  )
答案:B
[例2] (2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
68
75
80
83
84
90
销量y(件)
9
8.8
8.6
8.4
8.2
8
单价x(元)
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)

------【以上为无格式内容概要,如需完整内容请下载】------