专题4统计与概率(文)考点要求层次ABC统计随机抽样简单随机抽样√分层抽样和系统抽样√用样本估计总体频率分布表、直方图、折线图、茎叶图√样本数据的基本数字特征(如平均数、标准差)√用样本的频率分布表估计总体分步,用样本的基本数字特征估计总体的基本数字特征√变量的相关性线性回归方程√统计案例独立性检验独立性检验(只要求2x2列联表)的基本思想、方法及其简单应用。√回归分析回归分析的基本思想、方法及其简单应用。√概率事件与概率随机事件的概率√随机事件的运算√两个互斥事件的概率加法公式√古典概型古典概型√几何概型几何概型√说明:A.了解B.理解C.掌握概率与统计部分高考中选填题以考查概率计算,统计图表,样本数字特征等为中低档题。解答题应用问题为载体,考查统计与概率综合或统计案例.具体解题时,除了熟练古典概型与几何概型求解,抽样方法及统计图表、样本数字特征计算,线性回归方程及独立性检验等,同时让学生感悟解题中所蕴含建模思想,随机思想,阅读能力及数据处理能力。复习教学中提出以下建议;16\n教学中应注意“四化”,知识理解“深化”、考试题型“类化”、通性通法“强化”、解题思维“优化”。高考复习内容四查:查考纲把握方向、查考题明辨重点、查课本回归基础、查学情对症下药。数学教学与高考复习要求四通:对学生点,心有灵犀一点通;让学生悟,融会贯通;让学生做,触类旁通;让学生考,无师自通。★★★通过研究近4年全国高考试卷,高考中概率与统计试题主要以中档题出现,通过研究近几年全国高考试卷,题目设置上,会有1--2个选填题;分值为5—10分。解答题为12分。○○○○概率与统计部分在高考中占据重要的地位,通过分析近几年的高考情况,考查特点如下表:考什么怎么考题型与难度1.概率模型与计算①考查利用古典概型计算概率;②考查利用几何概型计算概率;题型:三种题型均可出现难度:基础题或中档题2.统计图与样本数字特征①考查平率分布直方图;②考查平均数,方差、中位数及众数的计算;题型:三种题型均可出现难度:基础题或中档题3.统计案例①线性回归方程的计算与运用;②独立性检验;题型:解答题难度:中档题2022-2022年全国高考解三角形(文科)试题分布表年份题型考查角度分值难度2022年Ⅰ卷选择题第2题样本特征数选择题第4题几何概型解答题第19题相关系数,方差均值计算12中等16\n2022年Ⅱ卷选择题第11题古典概型12中等解答题第19题频率分布直方图与独立性检验2022年Ⅲ卷选择题第3题折线图解答题第18题古典概型概率12中等2022年Ⅰ卷选择题第5题古典概型12中等解答题第18题函数解析式、概率与统计2022年Ⅱ卷选择题第3题柱形图5中等选择题第7题几何概型.解答题第18题样本的频率、平均值的计算2022年Ⅲ卷选择题第4题平均数;统计图.5中等选择题第8题古典概型解答题第18题线性回归方程2022年Ⅰ卷选择题第4题古典概型12中等解答题第19题线性回归方程2022年Ⅱ卷选择第3题柱形图12中等解答题第18题频率分布直方图及概率估计.2022年Ⅰ卷填空题第13题古典概率的计算5中等解答题第18题频率分布直方图;平均数与方差的计算2022年Ⅱ卷填空题第13题古典概率的计算5容易解答题第18题.茎叶图;古典概率;众数、中位数、平均数.统计的主要问题是:简单随机抽样和用样本估计总体;概率的主要问题是:随机现象与概率模型.在本专题中,研究的基本思维模式是:对于统计问题,构建“随机抽样→收集数据→整理分析数据→提取信息→用信息去说明问题”的框架.在统计问题中,数据的获得是至关重要的.如果从总体中抽取的样本不均匀,不具备随机性,那么后期对样本的数据分析就变得苍白无力,因此无论是在学习统计问题的时候,还是在进行复习的时候,都要帮助学生遵循“随机获取、均匀抽样”的原则;另外,在数据处理之后,要养成运用数据说明问题的习惯,不能把统计题目只看成对数据进行计算.因此,统计学的核心思想就是抽样思想,基本思维模式:首先确定研究的客观存在的总体,其次是抽取总体中的一个随机样本;最后是依据样本得出的数据信息(特征)来推测总体的某些数字信息(特征).16\n对于概率问题,构建“认清随机事件,科学使用枚举法计数,并合理使用概率模型(古典概型、独立与互斥事件、超几何分布、二项分布)解题”的思维模式,最终帮助学生形成能用概率来解释生活中的一些随机现象的能力.概率与统计知识问题解决所需的核心技能与核心思想方法(1).核心思想:随机思想(2).核心技能:阅读技能(从文字语言、图表语言、数据中获取准确信息)、运算技能典例【2022课标II文19】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较。附:P(K2≥k)0.0500.0100.001k3.8416.63510.828【答案】(1)0.62.(2)有把握(3)新养殖法优于旧养殖法【解析】(1)旧养殖法的箱产量低于50kg的频率为;(0.012+0.014+0.024+0.034+0.040)×5=0.62因此,事件A的概率估计值为0.62.16\n【精准解读】本道概率与统计解答题,延续了高考中对概率统计部分的传统。以实际背景为载体,综合考察概率,统计图表及样本数字特征和统计案例相关内容。对阅读能力要求高,知识运用的综合性强。基本知识的掌握要牢固,但难度不大。1.【2022课标3文18】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率。(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出的所有可能值,并估计大于零的概率.【答案】(1);(2)【解析】(1)需求量不超过300瓶,即最高气温不高于,从表中可知有54天,∴所求概率为.(2)的可能值列表如下:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)16\n300900900900低于:;:;不低于:∴大于0的概率为.【精准解读】本题以酸奶销售为载体,内容贴近学生生活实际。第(1)问通过频率分布表来计算概率,只要阅读理解准确易答。第(2)问联系到利润,可建立函数解析式,然后求出概率。需要一定的分析能力。2.【2022高考新课标2文数】某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数01234保费随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:出险次数01234频数605030302010(Ⅰ)记A为事件:“一续保人本年度的保费不高于基本保费”.求的估计值;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求的估计值;(III)求续保人本年度的平均保费估计值.【答案】(Ⅰ)由求的估计值;(Ⅱ)由求的估计值;(III)根据平均值得计算公式求解.(Ⅲ)由题所求分布列为:保费0.85aa1.25a1.5a1.75a2a频率0.300.250.150.150.100.05调查200名续保人的平均保费为16\n,因此,续保人本年度平均保费估计值为1.1925a.【精准解读】本题以保险收费为背景,以年度的保费与其上年度出险次数关系,出险次数与频数表格为条件,计算概率及均值。考查了学生的数据读取能力,应用意识及运算能力。3.【2022高考新课标1文数】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数.(I)若=19,求y与x的函数解析式;(II)若要求“需更换的易损零件数不大于”的频率不小于0.5,求的最小值;(III)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?【答案】(I)(II)19(III)19【解析】(Ⅰ)当时,;当时,,所以与的函数解析式为.(Ⅱ)由柱状图知,需更换的零件数不大于18的概率为0.46,不大于19的概率为0.7,故的最小值为19.(Ⅲ)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为.16\n比较两个平均数可知,购买1台机器的同时应购买19个易损零件.【精准解读】本题把统计与函数结合在一起进行考查。需要通过条形统计图及题目条件,建立函数关系式。有综合性但难度不大,求解关键是读懂题意,重视数学中的阅读理解能力培养.【实战演练】(共100分)一、选择题(共4题,每题5分)1.【2022课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数【答案】B2,【2022课标3文3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2022年1月至2022年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】A16\n【解析】由折线图,,8月份后月接待游客量减少,A错误;年接待游客量逐年增加;各年的月接待游客量高峰期大致在7,8月;各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳。所以选A.3.【2022课标2文11】从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.B.C.D.【答案】D【解析】如下表所示,表中的点横坐标表示第一次取到的数,纵坐标表示第二次取到的数总计有25种情况,满足条件的有10种,所以所求概率为4.【2022高考新课标2文7】某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()A.B.C.D.【答案】B【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为,故选B.二、填空题(共6题,每题5分)5.【2022上海模拟】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.【答案】168【解析】由题意,这批米内夹谷约为1524×≈168石,故答案为:168.6.【2022郑州模拟】16\n200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方式,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为23,第9组抽取号码为 ;若采用分层抽样,40﹣50岁年龄段应抽取 人.【答案】43;127.【2022北京东城区二模】如图茎叶图记录了甲,乙两班各六名同学一周的课外阅读时间(单位:小时),已知甲班数据的平均数为13,乙班数据的中位数为17,那么x的位置应填 ;y的位置应填 .【答案】3;8【解析】根据茎叶图中的数据,得:∵甲班的平均数为13,∴=13,解得x=3;又乙班的中位数是17,∴=17,解得y=8;综上,x、y的值分别为3、8.故答案为:38.8.【2022银川模拟】随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100),若该校的学生总人数为3000,则成绩不超过60分的学生人数大约为 .16\n【答案】900【解析】:由频率分布直方图得成绩不超过60分的学生的频率为:(0.005+0.01)×20=0.3,∴成绩不超过60分的学生人数大约为:3000×0.3=900.9.【2022成都模拟】在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未污损,即9,10,11,,那么这组数据的方差S2可能的最大值是 .【答案】10.【2022福建莆田模拟】把一颗骰子投掷2次,观察出现的点数,记第一次出现的点数为a,第二次出现的点数为b,则方程组只有一个解的概率为 .【答案】【解析】骰子投掷2次所有的结果有6×6=36由得(b﹣2a)y=3﹣2a,当b﹣2a≠0时,方程组有唯一解当b=2a时包含的结果有:当a=1时,b=2当a=2时,b=4当a=3时,b=6共三个所以方程组只有一个解包含的基本结果有36﹣3=33由古典概型的概率公式得,故答案为:三、解答题(共5题,每题10分)11.【2022高考陕西文19】随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:16\n日期123456789101112131415天气晴雨阴阴阴雨阴晴晴晴阴晴晴晴晴日期161718192021222324252627282930天气晴阴雨阴阴晴阴晴晴晴阴晴晴晴雨(I)在4月份任取一天,估计西安市在该天不下雨的概率;(II)西安市某学校拟从4月份的一个晴天开始举行连续两天的运动会,估计运动会期间不下雨的概率.【答案】(I);(II).【解析】(I)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率是.(II)称相邻两个日期为“互邻日期对”(如1日与2日,2日与3日等)这样在4月份中,前一天为晴天的互邻日期对有16对,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为,以频率估计概率,运动会期间不下雨的概率为.12.【2022长沙模拟】某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖,抽奖方法是:从装有2个红球和1个白球的甲箱与装有2个红球和2个白球的乙箱中,各随机摸出1个球,若摸出的2个球都是红球则中奖,否则不中奖。(I)用球的标号列出所有可能的摸出结果;(II)有人认为:两个箱子中的红球比白球多,所以中奖的概率大于不中奖的概率,你认为正确吗?请说明理由。【答案】(I)(II)说法不正确;【解析】(I)所有可能的摸出结果是:(II)不正确,理由如下:由(I)知,所有可能的摸出结果共12种,其中摸出的2个球都是红球的结果为共4种,所以中奖的概率为,不中奖的概率为16\n,故这种说法不正确。13.【2022高考北京文数】某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(I)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(II)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.【答案】(Ⅰ)3;(Ⅱ)10.5元.(II)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组频率根据题意,该市居民该月的人均水费估计为:(元).16\n14.【2022衡水金卷】某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(Ⅰ)应收集多少位女生样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:.估计该校学生每周平均体育运动时间超过4个小时的概率.(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:0.100.050.0100.0052.7063.8416.6357.879【答案】(I)90;(2)0.75;(3)有的把握认为“该校学生的每周平均体育运动时间与性别有关”.【解析】(I),所以应收集90位女生的样本数据.(II)由频率分布直方图得,该校学生每周平均体育运动时间超过4个小时的概率为.(III)由(II)知,300位学生中有人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计2109030016\n结合列联表可算得.有的把握认为“该校学生的每周平均体育运动时间与性别有关”.15.【2022高考新课标1文19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.46.656.36.8289.81.61469108.8表中=,=(I)根据散点图判断,与,哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);(II)根据(I)的判断结果及表中数据,建立y关于x的回归方程;(III)已知这种产品的年利润z与x,y的关系为,根据(II)的结果回答下列问题:(i)当年宣传费时,年销售量及年利润的预报值时多少?(ii)当年宣传费为何值时,年利润的预报值最大?附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:,【答案】(Ⅰ)适合作为年销售关于年宣传费用的回归方程类型(Ⅱ)(Ⅲ)46.24【解析】(Ⅰ)由散点图可以判断,适合作为年销售关于年宣传费用的回归方程类型.16\n(Ⅱ)令,先建立关于的线性回归方程,由于=,∴=563-68×6.8=100.6.∴关于的线性回归方程为,∴关于的回归方程为.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________16