《用样本频率估计总体频率》教案
- 资源简介:
约3350字。
2.2.1 用样本频率估计总体频率(教案)
陈巴尔
引入:
我们本章学习的内容是统计学,我们运用统计学解决一个具体问题,要分几个步骤?
首先是数据的收集,然后是数据的分析。
我们之前的课程已经学习了怎么收集数据,今天我们要开始学习怎么分析我们得到的数据,来解决一个实际问题。
(看问题,图片)
面对这样一个现状,我们该如何节约用水?
政府部门提了这么一个设想:(看问题)
问题的提出:
该如何确定a呢?
能不能太高?——失去节约用水的意义。(由学生回答)
能不能太低?——影响居民的正常生活。(由学生回答)
所以,我们希望大部分的居民用水量应该低于a,而小部分的居民用水量高于a,这样即不影响居民正常生活,又能达到节水的效果。
既然要求大部分居民的用水量在a以下,小部分在a以上,我们就需要了解本市居民的用水量情况,更准确地说,我们要知道用水量在哪些范围内较多,哪些范围内较少,或者说大部分集中在哪些范围内。即了解居民用水的整体“分布”。这类似于我们考完试,分析班级的成绩分布。
那我们可以通过什么方法来了解用水情况?——抽样(若学生提出普查则加以说明)
数据的处理:
我们通过合理的抽样方法,获得了100位居民某年的月平均用水量。(得到用水量表格)
刚才我们说过要了解用水的整体分布吧,就是在哪些范围内较多,哪些范围内较少?如果就给你一个表格,这么多数据一放,你能看清吗?(由学生回答,发现只能大致看出最大值,最小值,以及1点几和2点几的用水量都“比较多”,但具体就不清楚了。)
看不清,就要对表格的数据进行整理与分析,你们初中有没有学过拿到这么一大堆数据可以怎么处理,分析?
(学生回答频数分布表)
回顾初中熟悉的——频数分布表。初中的频数分布表是如何制作的?
数据的处理过程:
(由学生回答,让一名学生起来回答,如果忘记了,可以让他参考书本中的过程在一一说出。)
过程:(将6个处理数据的步骤完整得留在黑板上。)
步骤1、找出最大最小值(过大或过小的区间都没有意义)
步骤2、确定组距与组数
(1) 起始区间是不是一定要从0.2开始?(留给学生一定的思考时间,可以提问学生回答!)——可以从0开始,一是为了方便,二是实际意义。当然最后一组的右端点也不一定是4.3。所以如果我们设组数为n,组距为r,则n*r大于等于4.1,而且是略大于等于。
(2) 由上面的式子我们就可以知道组数和组距是有联系的,确定其中一个就可以近似确定另外一个,那我们应该先确定组距还是先确定组数?(为了制图方便,通常希望组距“取整”,所以可以先确定组距再求组数,并可以和经验公式做比较)
(3) 现在我们取0.5为组距,则可以得到组数应该为8.2,即可以取组数为9组。
(4) (若学生此时提出组距和组数大小如何选择,则举较极端的例子,如分1组、2组,与组距0.1,0.05等例子说明分组太少则信息表达过少,数据分析不够细致,而分组过多,则由于样本容量的限制与数据采集方法等影响,使得原始数据本身不够精细,从而会导致失真的后果。如图片放大率与像素值的关系。若学生没有提出,则此问题在画完直方图后讲解。)
步骤3、将数据分组统计(通过划正统计)
步骤4、得到初中我们熟悉的是频数分布表。
频数分布表的讨论:
我们通过处理数据得到频数分布表,与原始数据相比,能获得哪些有关数据分布的进一步信息?
学生:大部分集中在区间.....上,(或最多,次多集中在区间......上),越往中间数据越多,越往两边数据越少。
频数的好处在于知道落在每个区间内数据的多少。如果我想知道落在每个区间内的数据占全部的比例是多少的时候,该怎么办?——用频数除以样本容量,就得到了比例,我们称这个比例为频率。我们把频率这一列加在我们刚才的表格中,就得到了频率分布表。
步骤5、得到频率分布表
频率分布表的讨论:
那我们为什么要引入频率,用频数不是已经能很好得看出各个区间里面的数据多少吗?
(若学生不能回答就直接说出!)频率与频数相比,更容易看清这个区间内的数据个数占全部样本的比例是多少,我们研究样本的目的是什么?(学生——估计总体!)所以引入频率的话,在我们估计总体的时候特别有效,比如我们知道总体是一万户,那么根据我们的频率分布表,我们如何估计总体中落在区间....中的个数?(学生:用样本的频率来估计总体的频率,将总体乘以样本的频率即可)
(这里可以举一个具体的例子计算一遍)
资源评论
共有 0位用户发表了评论 查看完整内容我要评价此资源