专题4概率与统计考试内容要求层次ABC统计随机抽样简单随机抽样√分层抽样和系统抽样√用样本估计总体频率分布表、直方图、折线图、茎叶图√样本数据的基本数字特征(如平均数、标准差)√用样本的频率分布表估计总体分步,用样本的基本数字特征估计总体的基本数字特征√变量的相关性线性回归方程√统计案例独立性检验独立性检验(只要求2x2列联表)的基本思想、方法及其简单应用。√回归分析回归分析的基本思想、方法及其简单应用。√概率事件与概率随机事件的概率√随机事件的运算√两个互斥事件的概率加法公式√古典概型古典概型√几何概型几何概型√概率取有限值的离散型随机变量及其分布列√超几何分步√条件概率√事件的独立性√n次独立重复试验与二项分布√取有限值的离散型随机变量的均值、方差√正态分布√19\n说明:A.了解B.理解C.掌握概率与统计是高考必考重点内容之一,理科高考考查的主要内容有:抽样方法、统计图表,统计数据的数字特征,变量间的相关关系、随机事件的概率(古典概型、几何概型),离散型随机变量及其分布列,回归分析及独立性检验。学习中要让学生感悟解题中所蕴含建模思想,随机思想,形成阅读能力及数据处理能力。复习教学中提出以下建议;教学中应注意“四化”,知识理解“深化”、考试题型“类化”、通性通法“强化”、解题思维“优化”。高考复习内容四查:查考纲把握方向、查考题明辨重点、查课本回归基础、查学情对症下药。数学教学与高考复习要求四通:对学生点,心有灵犀一点通;让学生悟,融会贯通;让学生做,触类旁通;让学生考,无师自通。★★★通过研究近4年全国高考试卷,高考中概率与统计试题主要以中档题出现,通过研究近几年全国高考试卷,题目设置上,会有1个选填题;分值为5分。解答题1道为12分。○○○○概率与统计部分在高考中占据重要的地位,通过分析近几年的高考情况,考查特点如下表:考什么怎么考题型与难度1.概率模型与计算①考查利用古典概型计算概率;②考查利用几何概型计算概率;③考查随机变量分布列(二项分布,超几何分布);题型:三种题型均可出现难度:基础题或中档题2.统计图与样本数字特征①考查频率分布直方图,茎叶图;②考查平均数(期望),方差、中位数及众数的计算;题型:三种题型均可出现难度:基础题或中档题3.统计案例①线性回归方程的计算与运用;②独立性检验;题型:解答题难度:中档题19\n2022-2022年全国高考解三角形(理科)试题分布表年份题型考查角度分值难度2022年Ⅰ卷选择题第2题几何概型5容易解答题第19题正态分布及期望和方差12中等2022年Ⅱ卷填空题第13题二项分布的方差5容易解答题第18题频率分布直方图,中位数,概率与独立性检验12中等2022年Ⅲ卷选择题第3题折线统计图5容易解答题第18题随机变量的分布列,期望及函数12中等2022年Ⅰ卷选择题第4题几何概型5容易解答题第19题离散型随机变量的分布列与期望、频率分布直方图12中等2022年Ⅱ卷选择题第10题几何概型5中等解答题第18题互斥事件的概率、条件概率、离散型随机变量的分布列与期望12中等2022年Ⅲ卷选择题第4题平均数、统计的应用5容易解答题第18题线性相关关系与线性回归方程12中等2022年Ⅰ卷选择题第4题独立重复试验的有关概率5容易解答题第19题散点图、线性回归方程12中等2022年Ⅱ卷选择题第3题统计图表,正、负相关性5容易解答题第18题茎叶图、互斥事件、相互独立事件12中等2022年Ⅰ卷选择题第5题古典概型5容易解答题第18题频率分布直方图、平均数及方差、正态分布12中等2022年Ⅱ卷选择题第5题相互独立事件的概率乘法公式5容易解答题第19题线性回归方程12中等19\n统计的主要问题是:简单随机抽样和用样本估计总体;概率的主要问题是:随机现象与概率模型.在本专题中,研究的基本思维模式是:对于统计问题,构建“随机抽样→收集数据→整理分析数据→提取信息→用信息去说明问题”的框架.在统计问题中,数据的获得是至关重要的.如果从总体中抽取的样本不均匀,不具备随机性,那么后期对样本的数据分析就变得苍白无力,因此无论是在学习统计问题的时候,还是在进行复习的时候,都要帮助学生遵循“随机获取、均匀抽样”的原则;另外,在数据处理之后,要养成运用数据说明问题的习惯,不能把统计题目只看成对数据进行计算.因此,统计学的核心思想就是抽样思想,基本思维模式:首先确定研究的客观存在的总体,其次是抽取总体中的一个随机样本;最后是依据样本得出的数据信息(特征)来推测总体的某些数字信息(特征).对于概率问题,构建“认清随机事件,科学使用枚举法计数,并合理使用概率模型(古典概型、独立与互斥事件、超几何分布、二项分布)解题”的思维模式,最终帮助学生形成能用概率来解释生活中的一些随机现象的能力.概率与统计知识问题解决所需的核心技能与核心思想方法(1).核心思想:随机思想(2).核心技能:阅读技能(从文字语言、图表语言、数据中获取准确信息)、运算技能概率与统计知识体系框图19\n典例.【2022课标II理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附:【答案】(1);(2)有的把握认为箱产量与养殖方法有关;(3)。19\n(2)根据箱产量的频率分布直方图得列联表箱产量箱产量旧养殖法6238新养殖法3466由于,故有的把握认为箱产量与养殖方法有关。(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于的直方图面积为,箱产量低于的直方图面积为,故新养殖法箱产量的中位数的估计值为。【精准解读】本道概率与统计解答题,延续了高考中对概率统计部分的传统。以实际背景为载体,综合考察概率,统计图表及样本数字特征和统计案例相关内容。对阅读能力要求高,知识运用的综合性强。基本知识的掌握要牢固,但难度不大。1.19\n【2022课标3理18】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?【答案】(1)分布列略;(2)n=300时,Y的数学期望达到最大值,最大值为520元.当时,若最高气温不低于25,则,若最高气温位于区间,则;若最高气温低于20,则;因此.当时,若最高气温不低于20,则;若最高气温低于20,则;因此.所以n=300时,Y的数学期望达到最大值,最大值为520元.【考点】离散型随机变量的分布列;数学期望;【精准解读】本题以酸奶销售为载体,内容贴近学生生活实际。第(1)问通过频率分布表来制作随机变量分布列,易答。第(2)问联系到利润,可分情况建立关于期望的关系式,然后求出期望的最值。需要一定的分析能力。19\n2.【2022高考新课标2理18】某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数012345保费0.851.251.51.752设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数012345概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;(Ⅲ)求续保人本年度的平均保费与基本保费的比值.【答案】(Ⅰ)0.55;(Ⅱ);(Ⅲ).(Ⅲ)记续保人本年度的保费为,则的分布列为因此续保人本年度的平均保费与基本保费的比值为【精准解读】本题以保险收费为背景,以年度的保费与其上年度出险次数关系,出险次数与频数表格为条件,计算互斥事件及条件概率,关于保费的随机变量分布列及其均值。考查了学生的数据读取能力,应用意识及运算能力。3.【2022高考新课标1理18】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:19\n以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记表示2台机器三年内共需更换的易损零件数,表示购买2台机器的同时购买的易损零件数.(I)求的分布列;(II)若要求,确定的最小值;(III)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个?【答案】(I)见解析(II)19(III)【解析】(Ⅰ)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而;;;;;;.所以的分布列为16171819202122(Ⅱ)由(Ⅰ)知,,故的最小值为19.(Ⅲ)记表示2台机器在购买易损零件上所需的费用(单位:元).当时,.当时,.可知当时所需费用的期望值小于时所需费用的期望值,故应选.19\n【精准解读】本题把统计与函数结合在一起进行考查。第(1)问可由条形统计图得出概率,然后由相互独立事件的概率公式,求出分布列。第(2)问由分布列易得,第(3)问可借助期望值进行判断,从而做出决策。本题有综合性,对常见概率模型,及期望的概念理解要求较高,学习中应重视数学概念的理解及阅读理解能力培养.【实战演练】(共100分)一、选择题(共4题,每题5分)1.【2022佛山模拟】已知某地区中小学生人数和近视情况分别如图1和如图2所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.,B.,C.,D.,【答案】A【解析】由题意知,样本容量为,其中高中生人数为,高中生的近视人数为,故选A.2.【2022课标1理】如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A.B.C.D.【答案】B19\n3.【2022兰州模拟】某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是()A.0.8B.0.75C.0.6D.0.45【答案】A【解析】设A=“某一天的空气质量为优良”,B=“随后一天的空气质量为优良”,则,故选A.4.【2022江西九江联考】设样本数据的均值和方差分别为1和4,若(为非零常数,),则的均值和方差分别为()A.B.C.D.【答案】【解析】由题得:;的均值和方差分别为:均值方差19\n故选二、填空题(共6题,每题5分)5.【2022绍兴模拟】随机变量的取值为0,1,2,若,,则________.【答案】【解析】设时的概率为,则,解得,故6.【2022广州模拟】如图所示茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则乙的平均成绩超过甲的概率为 .【答案】【解析】由图示可知,甲的平均成绩为(88+89+90+91+92)=90,设被污损的数字为x,则乙的平均成绩为90+(﹣7﹣7﹣3+9+x)>90,即x﹣8>0,解得x>8.即x=9,故所求概率为.7.【2022银川模拟】从区间随机抽取个数,,…,,,,…,,构成n个数对,,…,,其中两数的平方和小于1的数对共有个,则用随机模拟的方法得到的圆周率的近似值为________.【答案】【解析】利用几何概型,圆形的面积和正方形的面积比为,所以.选C.8.19\n【2022贵阳模拟】如图,表示3种开关,设在某段时间内它们正常工作的概率分别是0.9,0.8,0.7,至少有1个开关正常工作时系统能正常工作,那么该系统正常工作的概率是 .【答案】0.9949.【2022郑州模拟】我校在高三11月月考中约有1000名理科学生参加考试,数学考试成绩ξ~N(100,a2)(a>0,满分150分),统计结果显示数学考试成绩在80分到120分之间的人数约为总人数的60%,则此次月考中数学成绩不低于120分的学生约有 人.【答案】200【解析】∵成绩ξ~N(100,a2),∴其正态曲线关于直线x=100对称,又∵成绩在80分到120分之间的人数约为总人数的60%,由对称性知:成绩在120分以上的人数约为总人数的=0.2,∴此次数学考试成绩不低于120分的学生约有:0.2×1000=200.10.【2022长春模拟】假定某篮球运动员每次投篮命中率均为p(0<p<1),现有4次投篮机会,并规定连续两次投篮均不中即停止投篮.已知该运动员不放弃任何一次投篮机会,且恰用完4次投篮机会的概率是,则p的值是 .【答案】【解析】∵某篮球运动员每次投篮命中率均为p(0<p<1),现有4次投篮机会,并规定连续两次投篮均不中即停止投篮.该运动员不放弃任何一次投篮机会,且恰用完4次投篮机会的概率是,∴﹣2p2(1﹣p)2+p(1﹣p)3=,解得p=.三、解答题(共5题,每题10分)11.【2022山东理18】在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者A1,A2,A3,A4,A5,A619\n和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I)求接受甲种心理暗示的志愿者中包含A1但不包含的频率。(II)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与数学期望EX.【答案】(I)(II)X的分布列为X01234PX的数学期望是.【解析】(I)记接受甲种心理暗示的志愿者中包含但不包含的事件为M,则(II)由题意知X可取的值为:.则因此X的分布列为;X01234PX的数学期望是;=12.【2022武汉模拟】一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示:19\n将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个的概率;(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望及方差.【答案】(Ⅰ)0.108;(Ⅱ)详见解析.【解析】(Ⅰ)设表示事件“日销售量不低于100个”,表示事件“日销售量低于50个”,B表示事件“在未来连续3天里有连续2天日销售量不低于100个且另一天的日销售量低于50个”.因此...(Ⅱ)X的可能取值为0,1,2,3.相应的概率为;,,,,分布列为;X0123P0.0640.2880.4320.216因为X~B(3,0.6),所以期望为E(X)=3×0.6=1.8,方差D(X)=3×0.6×(1-0.6)=0.7213.【2022高考新课标3理18】下图是我国2022年至2022年生活垃圾无害化处理量(单位:亿吨)的折线图19\n(I)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;(II)建立关于的回归方程(系数精确到0.01),预测2022年我国生活垃圾无害化处理量.附注:参考数据:,,,≈2.646.参考公式:相关系数回归方程中斜率和截距的最小二乘估计公式分别为:.【答案】(Ⅰ)理由见解析;(Ⅱ)1.82亿吨.19\n(Ⅱ)由及(Ⅰ)得,,所以,关于的回归方程为:.将2022年对应的代入回归方程得:,所以预测2022年我国生活垃圾无害化处理量将约1.82亿吨.14.【2022福建模拟】近年来我国电子商务行业迎来篷布发展的新机遇,2022年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.(1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关?(2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X:①求对商品和服务全好评的次数X的分布列(概率用组合数算式表示);②求X的数学期望和方差.P(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(,其中n=a+b+c+d)【答案】见解析【解析】(1)由题意可得关于商品和服务评价的2×2列联表为:对服务好评对服务不满意合计对商品好评8040120对商品不满意701080合计15050200计算观测值,对照数表知,在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关;(2)每次购物时,对商品和服务都好评的概率为,且X的取值可以是0,1,2,3,4,5;19\n其中;;;;;;所以X的分布列为:X012345P由于X~B(5,),则;.15.【2022课标1理19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求及的数学期望;(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得,,其中为抽取的第个零件的尺寸,.用样本平均数作为的估计值,用样本标准差作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计和(精确到0.01).附:若随机变量服从正态分布,则,,.【解析】(1)抽取的一个零件的尺寸在之内的概率为0.9974,从而零件的尺寸在之外的概率为0.0026,故.因此19\n.的数学期望为.(ii)由,得的估计值为,的估计值为,由样本数据可以看出有一个零件的尺寸在之外,因此需对当天的生产过程进行检查.剔除之外的数据9.22,剩下数据的平均数为,因此的估计值为10.02.,剔除之外的数据9.22,剩下数据的样本方差为,因此的估计值为.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________19