【数学建模 matlab 实验报告9】数据的统计分析与描述
上一篇【数学建模 matlab 实验报告8】回归分析目录实验报告实验心得实验报告作业1有一大批糖果现从中随机地取16袋称得重量以克计如下506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布试计算总体均值μ和总体标准差σ置信水平为0.95的置信区间。截图代码data [506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496]; n length(data); sample_mean mean(data); sample_std std(data); df n - 1; alpha 0.05; t_critical tinv(1 - alpha / 2, df); CI_upper sample_mean t_critical * sample_std / sqrt(n); CI_lower sample_mean - t_critical * sample_std / sqrt(n); fprintf(总体均值的置信区间为[%.2f, %.2f]\n, CI_lower, CI_upper);作业2水泥厂用自动包装机包装水泥每袋额定重量是50kg. 某日开工后随机抽取了9袋称得重量如下49.649.350.150.049.249.249.949.851.050.2设每袋重量服从正态分布问包装机工作是否正常显著性水平为截图代码data [49.6, 49.3, 50.1, 50.0, 49.2, 49.2, 49.9, 49.8, 51.0, 50.2]; n length(data); sample_mean mean(data); sample_std std(data); population_mean 50; alpha 0.05; t_value (sample_mean - population_mean) / (sample_std / sqrt(n)); t_critical tinv(1 - alpha / 2, n - 1); if abs(t_value) t_critical fprintf(在%.2f的显著性水平下包装机工作不正常。\n, alpha); else fprintf(在%.2f的显著性水平下无法拒绝包装机工作正常的原假设。\n, alpha); end作业3一公司声称某种类型的电池的平均寿命至少为21.5小时. 有一实验室检验了该公司制造的6套电池得到入校的寿命小时数191822201625. 试问这些结果是否表明这种类型的电池低于该公司所声称的寿命显著性水平为截图代码data [19, 18, 22, 20, 16, 25]; n length(data); sample_mean mean(data); population_mean 21.5; sample_std std(data); alpha 0.05; t_value (sample_mean - population_mean) / (sample_std / sqrt(n)); t_critical tinv(1 - alpha / 2, n - 1); if t_value -t_critical fprintf(在%.2f的显著性水平下这些结果表明电池低于公司所声称的寿命。\n, alpha); else fprintf(在%.2f的显著性水平下这些结果无法表明电池低于公司所声称的寿命。\n, alpha); end作业4某工厂生产金属丝产品指标为折断力. 折断力的方差被用作工厂生产精度的表征. 方差越小表明精度越高. 以往工厂一直把该方差保持在64及以下. 最近从一批产品中抽取10根做折断力试验测得的结果单位为千克如下578572570568572570572596584570. 为此厂方怀疑金属丝折断力的方差变大了. 如确实增大了表明生产精度不如以前了于是就需对生产流程做一番检验以发现生产环节中存在的问题. 试在显著性水平情况下检验厂方的怀疑截图代码data [578, 572, 570, 568, 572, 570, 572, 596, 584, 570]; n length(data); sample_mean mean(data); hypothesized_variance 64; alpha 0.05; chi_squared (n - 1) * var(data) / hypothesized_variance; chi_critical chi2inv(1 - alpha, n - 1); if chi_squared chi_critical fprintf(在%.2f的显著性水平下金属丝折断力的方差增大了。\n, alpha); else fprintf(在%.2f的显著性水平下无法拒绝金属丝折断力的方差未增大的原假设。\n, alpha); end作业5据现在的推测矮个子的人比高个子的人寿命要长一些. 下面给出了某国31个自然死亡的总统的寿命将他们分为矮个子与高个子两类数据如下矮个子总统8579679080.高个子总统6853637088746466606078716790737177725778675663648365.假设两总体服从方差相同的正态分布. 试问这些数据是否符合上述推测显著性水平截图代码data_short [85, 79, 67, 90, 80]; data_tall [68, 53, 63, 70, 88, 74, 64, 66, 60, 60, 78, 71, 67, 90, 73, 71, 77, 72, 57, 78, 67, 56, 63, 64, 83, 65]; alpha 0.05; [h, p, ci, stats] ttest2(data_short, data_tall, Vartype, equal); if h 1 fprintf(在%.2f的显著性水平下这些数据表明矮个子的人寿命比高个子的人长。\n, alpha); else fprintf(在%.2f的显著性水平下这些数据无法表明矮个子的人寿命比高个子的人长。\n, alpha); end作业6为比较甲乙两种安眠药的药效将20名患者分成两组每组10人如服药后延长的睡眠时间分别服从正态分布其数据为单位小时男生5.54.64.43.41.91.61.10.80.1-0.1.女生3.73.42.02.00.80.70-0.1-0.2-1.6.试问两种药的药效有无显著差别显著性水平截图代码data_male [5.5, 4.6, 4.4, 3.4, 1.9, 1.6, 1.1, 0.8, 0.1, -0.1]; data_female [3.7, 3.4, 2.0, 2.0, 0.8, 0.7, 0, -0.1, -0.2, -1.6]; alpha 0.05; [h, p, ci, stats] ttest2(data_male, data_female, Vartype, equal); if h 1 fprintf(在%.2f的显著性水平下这些数据表明两种安眠药的药效有显著差别。\n, alpha); else fprintf(在%.2f的显著性水平下这些数据无法表明两种安眠药的药效有显著差别。\n, alpha); end作业7以下是100次刀具故障记录即故障出现时该刀具完成的零件数。分析这批数据是否服从正态分布并求其均值和均方差。注意由于记录失误其中可能有些数据是错误的要对此进行适当处理。459,362,624,542,509,584,433,748,815,505,612,452,434,982,640782,742,565,706,593,680,926,653,164,487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697,515,628,954,771,609,2,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,339,280,246,687,539,790,581,621,724,531,512,577,496,468,499,544,645,764,558,378,765,666,763,217,715,310,851.截图代码data [459, 362, 624, 542, 509, 584, 433, 748, 815, 505, 612, 452, 434, 982, 640, 782, 742, 565, 706, 593, ... 680, 926, 653, 164, 487, 734, 608, 428, 1153, 593, 844, 527, 552, 513, 781, 474, 388, 824, 538, ... 862, 659, 775, 859, 755, 649, 697, 515, 628, 954, 771, 609, 2, 960, 885, 610, 292, 837, 473, ... 677, 358, 638, 699, 634, 555, 570, 84, 416, 606, 1062, 484, 120, 447, 654, 564, 339, 280, ... 246, 687, 539, 790, 581, 621, 724, 531, 512, 577, 496, 468, 499, 544, 645, 764, 558, 378, ... 765, 666, 763, 217, 715, 310, 851]; data_cleaned data(data 100 data 2000); [h, p] adtest(data_cleaned); if h 0 fprintf(数据服从正态分布。\n); else fprintf(数据不服从正态分布。\n); end mean_value mean(data_cleaned); variance_value var(data_cleaned); fprintf(均值为%.2f\n, mean_value); fprintf(均方差为%.2f\n, variance_value);实验心得通过本次数据统计分析与描述实验我系统完成了正态总体参数置信区间计算、单样本 t 检验、卡方检验、双样本 t 检验以及正态性检验等多项统计分析任务不仅熟练掌握了 MATLAB 在统计分析中的基本操作更深刻理解了数理统计理论在实际问题中的应用逻辑对数据分析的严谨性和实用性有了全新的认识。实验涵盖了置信区间估计、假设检验、方差分析、分布拟合检验等核心内容。在糖果重量均值置信区间计算中我体会到正态分布假设是小样本统计推断的关键t 分布的应用让总体均值估计更贴合实际抽样场景水泥包装机工作检验与电池寿命假设检验让我明确了双侧检验与单侧检验的区别理解了原假设与备择假设的设定逻辑以及显著性水平对检验结论的影响。金属丝折断力方差检验则让我掌握了卡方分布在方差推断中的作用认识到方差作为衡量生产稳定性指标的重要意义。而双样本 t 检验对比高矮个子总统寿命、两种安眠药药效差异更让我感受到统计方法在对比分析、科学决策中的实用价值。在数据处理环节刀具故障数据的异常值处理给我留下深刻印象。实际数据常因记录失误存在异常值若直接分析会导致结果失真因此合理筛选、清洗数据是保证分析可靠的前提。通过正态性检验判断数据分布规律再计算均值与均方差让我明白统计分析并非单纯套用公式而是结合数据特征灵活处理的过程。本次实验也让我意识到理论与实践结合的重要性。课堂上抽象的统计分布、假设检验步骤在编写代码、代入数据计算后变得直观易懂。MATLAB 的统计函数让复杂计算变得高效但只有理解函数背后的统计原理才能正确设置参数、解读结果。同时我也认识到统计结论并非绝对判断而是基于概率的推断显著性水平、置信水平的选择会直接影响结论实际应用中需结合问题背景合理确定。此外实验培养了我严谨细致的数据分析习惯。从数据录入、格式整理到代码编写、结果验证任何细微错误都会导致结果偏差。面对异常数据、检验结果不显著等情况需要冷静分析原因判断是数据问题还是方法选择不当这极大提升了我的逻辑思维与问题解决能力。总体而言本次实验不仅巩固了数理统计知识提升了 MATLAB 编程与数据处理能力更让我掌握了从实际问题中提取统计模型、完成分析推断的完整流程。在今后的学习和工作中我将把本次实验所学灵活运用以科学严谨的统计思维分析问题、解决问题充分发挥统计分析在数据决策中的重要作用。