摘要
食品,对于人类来说是必不可少,正所谓“民以食为天”,而近些年来食品安全问题一直是中国人民热烈讨论的话题之一。大家对目前社会上的食品安全状况充满了担忧,而造成这一局面有两个原因,一方面是商家一心赚钱,为了经济利益方面的考虑置广大消费者的生命安全于不顾,用一些劣质原材料降低生产成本,另外还使用各种添加剂进行对食品外观的修饰,他们对食品生产的环境,保存的地点也都很随意,如此导致生产出来的食品充满各种各样的危险;另一方面,是中国有关部门自己监管不力,监督失误,在位者尸位素餐,玩忽职守,对食品质量安全的检查十分不严格,对不合格生产制造商的打击也不严厉,这才导致有很多漏网之鱼的存在。而深圳市走在中国食品质量安全检测的前沿,利用网络平台建立起公正透明的监管体系,定期发布对于食品的抽查报告,让普通民众看得到,放宽心。而我们此次想要通过这些检查的数据分析出一些规律,希望可以利用这些规律提高食品质量安全监测的效率,因为食品安全监测都只能抽样调查,为了能够使漏网之鱼更少,我们必须利用得到的规律,比如说,可以在某些季节加大对某种类型食品的检测,或者对于某些容易出食品安全问题的地点加大采样样本已获得更全面的数据。我们只有通过挖掘庞大数据背后潜藏的规律,才能更好的为以后的制度建设提供理论性的依据与指导,这也是此次采用数学建模手段研究问题的意义所在。
一、问题重述
“民以食为天”,食品安全关系到千家万户的生活与健康。随着人们对生活质量的追求和安全意思的提高,食品安全已成为社会关注的热点,也是政府民生工程的一个主题。城市食品的来源越来越广泛,人们消费加工好的食品的比例也越来越高,因此除食材的生产收获外,食品的运输、加工、包装、贮存、销售以及餐饮等每一个环节皆可能影响食品的质量与安全。另一方面,食品质量与安全又是一个专业性很强的问题,其标准的制定和抽样检测及
评价都需要科学有效的方法。深圳是食品抽检、监督最统一、最规范、最公开的城市之一。根据2010年、2011年和2012年深圳市的食品抽检数据来讨论:
1. 如何评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的
变化趋势;
2. 从这些数据中能否找出某些规律性的东西:如食品产地与食品质量的关系;食品销
售地点(即抽检地点)与食品质量的关系;季节因素等等;
3. 能否改进食品抽检的办法,使之更科学更有效地反映食品质量状况且不过分增加监
管成本(食品抽检是需要费用的),例如对于抽检结果稳定且抽检频次过高的食品领域该作怎样的调整?
二、问题分析
首先,我们看到分析这三年来的数据十分庞大。并且深圳市的数据采集手段似乎每年一变,这导致对这个问题中数据提取的困难。比如这三年所列的关于食品检查合格率的数据,2010年的是根据生产环节,流通环节,餐饮消费环节三个部分给出的;而2011年的数据部分又没有提到食品监察部门到底是从那一个具体的环节中给出来的,感觉比较笼统;而到了2012年,数据也没有说是从哪个环节得到的,并且相较于2011年其数据更为琐碎,每一期的报道都是将十几个品种的食品进行逐类计算合格率的,在统计时既不好细分也不便于笼统的划分。这种每年一变的数据叙述风格对于统计来说带来了几大的不方便。而且或许是为了方便,食品监察部门总是在某个时间段只检查某一类的食品,在所给数据中能够很清晰的反应这一点,比方检查饮用水,它的数据只会在一年众多报告中的某一其中出现,这是否意味着不良商贩可以抓住这种制度上的漏洞而根据不同的时期进行“灵活”的生产食品以逃避监管部门的检查与打击。其问题的复杂性就是在于如何从纷乱的数据中提取一些值得研究的,或者是感觉能够找到一些规律的项目进行适当的处理从而期望可以得到一些比较普适的结论。
其次,问题中给出了我们提示。对于第一问,研究食品安全不合格的因素,从数据中也可以反映出来食品安全不过关主要是微生物的过量繁殖,重金属的残留以及食品添加剂的滥用,其次还有一些其他所占比重较轻的因素。对于这个问题,有一份关于食品检验的资料,如下: 食品检验内容十分丰富,包括食品营养成分分析,食品中污染物
质分析,食品辅助材料及食品添加剂分析,食品感官鉴定等。狭义的食品检验通常是指食品检验机构依据《中华人民共和国食品卫生法》规定的卫生标准,对食品质量所进行的检验,包括对食品的外包装、内包装、标志、唛头和商品体外观的特性、理化指标以及其它一些卫生指标所进行的检验。检方法主要有感官检验法和理化检验法。
科标化工分析检测中心(SCT)提供以下食品检测检验试验测试需求: 理化项目:
水分,灰分,酸价,过氧化值,挥发性盐基氮,三甲胺氮,咖啡因,脂肪酸,丙二醛,氨基酸态氮,总酸,酸度,明矾,总碱度,L-羟脯胺酸,黄曲霉毒素B1,苯并[a]芘,丙酸钙,丙酸钠,脲酶,米酵菌酸,溶剂残留量,羰基价,甲醛,次硫酸氢钠甲醛,过氧化苯甲酰,亚硝酸盐,甲醇,乙醇,总脂,酒精度,杂醇油,二氧化硫,相对密度,pH值,比旋光度,折光率,粒度,细度,折射率,熔点,净含量,新鲜度,完整率,干粒重,干燥物,可溶性固形物,总固形物,非脂乳固体,全乳固体
重金属及微量元素:
铅,砷,无机砷,汞,甲基汞,铜,镁,锌,锡,钙,铬,镉,磷,氟,碘,硒,钾,钠,铝,铁,锰等
食品添加剂:
防腐剂:山梨酸,苯甲酸;
着色剂:胭脂红,苋菜红,柠檬黄,日落黄,诱惑红,亮蓝 甜味剂:糖精钠,甜蜜素
抗氧化剂:叔丁基羟基茴香醚,二叔丁基对甲酚,植酸,TBHQ 漂白剂:亚硫酸盐,二氧化硫 护色剂:硝酸盐,亚硝酸盐 面粉处理剂:过氧化苯甲酰 水分保持剂:磷酸盐等 食品农药残留测试:
有机磷、有机氯、拟除虫菊酯类、氨基甲酸酯类等400余种测试 食品兽药残留测试:
氯霉素、土霉素、金霉素、四环素、硝基呋喃、磺胺类、盐酸克伦特罗等 微生物检测:
细菌总数、大肠菌群、霉菌和酵母菌、大肠杆菌、志贺氏菌、金黄色葡萄球菌、沙
门氏菌、致病菌等
所以对第一个问题,只需要依据这些关键字找到其相关数据再分析其变化情况应该就可以。但是还应该注意到有些食品是对于某些安全因素特别敏感,比如说小食品容易发霉发烂,就容易受到微生物这一因素的影响。还比如说平时所见的馒头或者油条需要发酵处理,就很可能膨松剂添(主要是含铝元素)加过多而导致铝元素过量,所以我们需要根据具体的食品来讨论这些安全因素的变化趋势,而非一概而论。
对于第二个问题,题干给糊了一些思考的方向,大体上也是根据相关关键因素去寻求关于那个因素的一些变化趋势,比如按照常理来讲食物在夏天易受温度,湿度的影响,会加速腐坏,而在冬天就变得容易保存一些,而又这个表观现象所揭示的内在缘由是在夏天微生物繁殖加快由于食品上或多或少会附有微生物,在季节影响下可能会加速其繁殖,而这个时候如果食品保存不谨慎的话实际容易受到勿扰从而变得不安全的。同样地地点因素也会影响事物的安全性,比如有些地方处在交通要道,整天车来车往,空气污染很严重,周围有有大量工厂,很可能水源也会受到污染,在这种环境下生产出来的事物就很可能“来路不正”,比如周围的工厂向附近水域中排放工业污水,里面带有大量重金属元素,而制作食品时商家或许没有考虑到这个因素,用这种水源去生产事物,这样生产出来的食物很可能就被检测出来重金属元素超标。上面是对食品生产地点的一些分析,对于食品的销售地点也是一样的,有些零售商贩为了仓库空间的利用率,很可能把食品堆放到那种空气混浊,条件极为简陋的小房子里,这种条件很容易滋生出一些生物,那些生物携带各种传染疾病就很容易是存放的食物收到重大污染,很可能就会被检测出在微生物这个指标上超出正常所能容忍的范围。这都是一些生活上的常识。但我们还是要依靠数据来说话,用数据显现出潜藏的规律。
对于第三个问题呢,是为了提高食品安全监测中的效率。或许有些数据就是冗余的,也就是说在实际的检测中都没有必要进行检测(虽然说会有风险让一些漏网之鱼逃脱掉了),但是只要我们能够制定一种更为简洁的方案使得可能安全不达标的产品未能被检测到的概率降到很低就行了。这种优化的问题真的很难,一是作为一个极为重要的部门,必然其背后已经有相关专家为其设计了很优化的办法,我们再从如此严密的体系中去找到一种更好的方法应该是很困难的,另外是这些数据所属分类也相当繁复,需要通过很敏锐的视角找到某个因素再从这个因素出发观察是否某些数据关于这个因素是否会有堆积,从而为了减少这种堆积(也就是冗余量),我们便可以以这个寻找到的因素设计出一种可能会更好的办法(所谓可能,是因为控制住了单个因素而设计出的改良方法可能会影响其他因素,从而从整体上会降低整个抽样体系完备性上的缺失)。这个问题,还有个难点就是,如何评估一种抽样方法,
应该从哪些角度出发进行描述,由于数据是有限的,我们也不可能用假设的方法实时地进行评估模拟(因为几乎无法判断这样得出的数据真实性是否很强)。对于抽样方法的描述,主要看其样本空间大小选取是否合适,而食品种类也是个不小的数字,这种对比使得我们很难去把控衡量样本空间的大小,这种大小的选取也直接决定了食品检测过程中的执行效率与经济成本。而这种评估远远不是通过某个因素就能单方面决定的。我们必须做一些让步,看是否可以提取某些因素,建立起一个大致的评估框架,从而得到比较粗略的评估,然后根据这个评估法则来优化原有的方案。
三、问题假设
1.假设食品能且分为四大类, 其他没有被分类的食品对食品安全性所造成的影 响忽略不计。
2.假设影响食品安全性的因素能且分为四大类, 其他没有被分类的因素对食品 安全性所造成的影响忽略不计。
3.假设调查样本在一定的范围内是均一的。 4.假设所有食品生产厂商的信誉度均相同。 5.假设抽检不受国家相关政策的影响。
6.假设检测不同环节、不同因素的成本和工时相同。
四、问题求解
对于第一个问题,这里给出为不合格的不同类型食物的具体统计数据:
以上四个表是针对四种不同食物和四种不安全因素来源的一个统计。左图是按不合格食品数量做出的。其中x轴表示时间项,y轴表示了被检测出的不合格食品数量。可以发现其实这个走势是有点不正常的,原因是在2010年尾的时候监察部门来了一次范围非常广的食品安全抽查工作,这应该是当时在国家发生若干期食品事故之后上级部门所严厉要求的一次活动。由于其样本大小的不确定性是的问题分析很麻烦,又在右边作出了相应的安全因素所占百分比的图。意即在每一次的检测中,绘制出某一安全因素导致的不合格食品数量所占那一次所有被检测出不合格食品数量的百分比,这样的话就可以忽略所采样本的大小从而更真实的反映出所要研究的几个安全因素的走势图。
下面根据图形进行走势分析,首先是蔬菜水果类食品,这类食品的主要安全因素问题与
的确与时间有关,在微生物滋生的季节中可以发现这是占据食物安全不合格的主要因素,而在另一些时间段里,就是其他因素了,因为对于蔬菜水果,一般是不会发生重金属残留的,
而他本身也是自然型的东西,而为了保存方便,商贩们对蔬菜水果使用添加剂。对于禽畜肉类情况与蔬菜水果类似,也是容易在细菌滋生的高发季节沾染上微生物,导致其安全不合格。鱼类也有这样的特点,因为前三样食品都是可以未经过加工的,收到重金属与添加剂影响而变得安全不合格的情况较少(因为使用这些东西商贩们也得拿出很多钱,而这是不必要的,如果只是对这些食品做简单保存的话)。再看第四种食品,大概说来,这一类可被称为加工后食品,容易受到各个方面安全因素的影响。并且可以从图中看出他们所受到的影响来源还是比较均衡的。而仔细比对四张图,发现最受季节影响的要数微生物这个因素了,因为微生物的繁殖生活是和季节条件息息相关的。而其他几种因素所占百分比可以说都是因为微生物这个因素变化而变化的,另几个因素化学结构稳定,不容易受到外界条件的影响。 下面这个图表是2010年与2011年的各个环节食品合格率的统计,未收录2012年数据的原因是当年的数据报道方式发生改变,是每一期报道都按照各种不同的极为具体的食品进行分类抽查,统计起来十分不方便,故未考虑收用。图中X轴前半段是根据2010年的具体时间给出的,后半段是根据2011年通报的期数来进行统计的。
从图中我们可以看出合格率的变化是相当平稳的,只有偶然的情况才会使得它的变化发生突变,图中突变点为2011年第四期通报处,再看具体数据,此次共检验696批次,检验合格501批次,产品抽样批次合格率为72.0%。已经相当低了,这种检测数据不算是偶然,一方面,与时间有些关系,从上表中可以看出来,在春夏季的时候,食品合格率偏低,再结合每期通报上的叙述可以知道多半都是由于微生物的污染导致的,而那些合格率非常高的食品
检测时间段常在秋冬季节。有个有趣的事实,是在节假日的时候,食品的不合格率会略有增加,这个时候那些商贩更像是铤而走险,顶风作案,为了一点经济利益至人民的生命安全于不顾。
对于第二个问题,我自己采集的数据只有根据时间划分的类型,而没有将地点标记为一个因素(主要原因是有些食品来源只说了具体的厂家名称为没有加上它所在的区域),但是在具体的数据采集中,还是留意到食品的产地可以分为深圳本地与外地,而深圳本地有六个区域,根据网络资料与自己数据统计信息的一点了解,大体情况是深圳外地的视频不合格率情况高于本地产品,这可能说明了深圳市的的确确走在食品检测的前沿上,力度大,信息公开透明,而一些外地的区域似乎没有深圳市管制的这么严厉。还有就是经济发达地区的食品不合格率要低于经济发达地区的视频不合格率,这可能也是因为经济发达地区的制度要健全一些,这种状况只能带来好的更好,坏的更坏的结果,食品检测背后可能有一些经济规律在里边,而这个结论也只是建立在这么一点点数据的基础上,很可能不值得相信。这里详细分析一下这种猜测:由于经济发达,食品制造商或许不用担心销量问题,也就是不用担心自己卖东西的利润,他们也许更想保住自己的牌子,因为一块好的招牌可以为他们带来良性循环,只有有持续的销售量,他们就稳赚不赔,而由于食品安全出问题而砸了这块招牌的话,第一,是再也不会有顾客进行购买;第二,食品制造商也会因此而付出沉重的经济赔偿;第三,他们还极有可能会因此而受到法律的制裁。可以说,就是因为经济发达而留住了他们,而由于利益因素导致他们不得不生产安全食品,因为一方面造伪造假节约生产成本而得到的钱财有可能根本比不上多销售几件产品的成本;另一方面是为了稳定,因为流程化的食品生产必然会增加效率从这个方面减少开支。而对于经济欠发达地区或是地理位置不优的地区,更多的食品商都是些小商小贩,他们流动性强,制作规模小,不带考虑自身制造食品的口头影响力,这样想来,他们节约下来的生产成本就很可能是他们利润中不小的一个份额,这种情况下他们会选择铤而走险,他们流动性强,还有他们规模小,导致他们可以采取“打一枪换个地方”的移动生产模式,一方面逃避制裁,另一方面重新寻求销售途径,这就是食品安全问题背后的经济因素。同样的,地理因素也和经济因素相勾连,因为食品制造厂的选址背后牵扯到的是一堆经济问题,要好地方就得花钱,经济发达地区的地皮当然是相当昂贵,规模小的厂商不敢选用,他们也只好跑到经济欠发达的地方(最多的就是乡镇,或者是城中村,郊区这类地方),而这类地方生活条件不好,环境可能也不好,而且这种地方周围或多或少会有一些企业工厂,若是在这些地方生产食品,就很可能在生产过程中以及保存过程还有运输过程中收到污染。另一是经济欠发达地区会向经济发达地区运输所生产的食品,因为经济发达地区
消费水平高,人口流动大,自然是理想的销售地,而如果生产食品的地方就选在经济发达地区,那么必然会少掉中间的运输过程以及节约了保存过程;而对于经济欠发达地区的食品生产商贩,他们既要增加运输成本又要增加存放成本,从而很可能会在生产过程中大打折扣,而且在这两个过程中又极可能会增加食品安全性的下降,所以综上所述,食品不合格率是和食品生产地区有一定关系的。这个结论也可以适量的解释为什么外来食品的不合格率会略低于深圳市本地区的食品不合格率。
对于第三个问题而言,检测部门应该平均每次检测食品的数量,而不是在某些时间段搞得很集中,就比如说,上面几个图中在某些期的数据就明显比其他时间段的数据来的更多,这种情况不应该因为节假日的原因就这样莫名其妙的增加多于平时若干倍的检测数量。而通过深圳市食品检测的报告也可以看到这一点他们在进步,就是在2012年的数据统计中,就是采用每一期抽查大量品种的食品类型而把食品抽查的样本数适当降低,也就是一种类似于“多次少取”的办法,这样做的好处是:第一,铺开了食品检测面,这种灵活的品种选取会非常有效果的防备那些食品生产商那种侥幸心理,对某个食品类型检测的次数多了会带个生产者一种感觉,就是自己无时无刻不是在收到控制之中,从而起到一个约束作用;第二,由于选取的样本数量变少,可以节约食品检测所花费的成本,还有这样可以防止冗余数据,就是某一期中数据量会变得非常大那种情况,其实那时没有必要的,还不如把检测量变得更平均,这样加大了检测的密度(无论是品种上,还是时间上),换来的是检测效率的提高。比方说,对于一家不合格的食品制造商,去检查一次他可能逃过了,这是他逃避掉的概率是和样本容量选区有关,是一次的,而若果多次抽查,虽然说看单次,他逃避掉的概率会上升,但注意到这种概率会以几何级数做下降(概率始终小于1),所以,这种“多次少取”绝对是一个极为有效的办法,从这也可以看出深圳市检测技术的提升。从反面来看待,对于抽查频次过高的食品就应该相对减少一些,因为检测成本有限,对某类食品的检测成本花费过高必然使得对其他食品类型检测的不力,由于食品无处不在,类型丰富,我们不是为了“求精”。而是务必“求全”,从整体效用上提高检测水平,而非在单方面的提高某类食品的监管。毕竟人手,资金有限,可定时要根据食品类型所占多少而对检测的样本数进行均匀分配的。这一点应该没有问题,目的就是为了更平均的检测各个品类的食品(从统计角度而言,就是使它的方差尽可能低,对于此处,就是该食品类型占所有食品类型的比重与抽查所选样本数量的关系)。
五、问题总结
这个问题最难的就是进行合理的数据分类,体重所需处理的数据所具有的属性非常的多,并且数据给出的格式也因为年度变化而发生变化,这就给问题的分析带来巨大的麻烦。在解决问题中大量的时间都是投入到数据的手工统计中了,并且纷乱的数据量根本让我想不到有什么可以操作的模型,于是也是有想到通过图表的手段直接清晰明了的表现问题,将数据作适当的分类,把干扰要素通过适当的分类降到最低。但是食品统计过程中抽查的视频来源十分复杂,比如说水果蔬菜类就有可能是天然的类型,也有可能是餐馆里边的水果沙拉或是凉菜;肉类产品也一样,既有可能是来自于生产环节上的(即那些屠宰场或养殖场),也肯能是出现在流通环节上的,比如说超市出售的肉类产品,更有可能是经过加工的,有些来源于卤肉店或者就是即开即食的包装产品;这些非常细致的分类导致问题处理起来极为不便。
一个原因是由于时间过于仓促,导致我想不出来什么好的模型能够去描述这个抽查过程;另一个是由于技术手段的落后,大量数据都是靠人工进行筛选与统计。所以我也只能借助图表和WPS下的小工具进行纯人工的数据分析。希望以后能够在完善对于这个题目的处理
附件:
时间 2010 2-28
检测样本数 1791
合格数 1666
生产环节
检测
合格
样本
率
数 93%
139
检测时间
流通环节 餐饮消费环节
检测
合格合格合格合格
样本
数 率 数 率
数
98.70
139 100% 150 2
%
2010 4-29 1483 1415 95.40% 2010 5-27 112 107 95.60% 2010 6-10 18
16
88.90% 2010 6-28(粽
子) 2010 7-2(凉 茶) 2010 7-2(冷 饮) 2010 7-2(谷 物) 2010 7-2(肉 制品) 2010 7-2(水 产品) 2010 7-7(饮 料) 2010 7-7(水 产品) 2010 7-7(鲜 榨饮料) 2010
302 294 219 212 84
84
48 48 50 50 165 165 139 134
34 6
80 80 50 50 97.40% 79 96.80% 100%
49
248 100% 100% 100% 96.40%
82.40%
100% 60 200 100% 79 100% 48
98% 242
97.60%
58
96.70%
198 99%
7-15(谷物) 2010 7-23(水 产品) 2010 7-23(罐 头) 2010 7-28(凉 菜) 2010 8-03(西 餐菜肴) 2010 8-20(饮 用水) 2010 8-20(餐 具) 2010 8-20(固 体饮料) 2010 8-20(保 鲜膜) 2010 8-20(洗 涤剂) 2010 8-31 (沙
60 59
31 29
133 131
40 38 14 14 161 98.30%
182 251 93.50%
98.50%
95% 32 18 100% 160
99.40%
181
99.50%
244
97.20%
30
93.70%
16 88.9
拉酱) 2010 9-1(啤11 酒) 2010 9-1(含17 乳饮料) 2010 9-1(酱22 油) 2010 9-10(月128 饼) 2010 9-17 195 2010 9-17(大78 米) 2010 9-30(食 材) 2010 10-19(小 麦粉) 2010 12-23(豆85 制品) 2011 1-1 1599 2011 1 419
2011 2(速冻食 品)
11 100% 17 100% 20
90.90%
127
99.20% 191 97.90% 77 98.70%
73
85.90% 1541 96.40% 410
97.90%
198 198 845 820 469 454 1262
1208
202 198 100% 51 91.90% 1436
181 268 50 96.8 515 95.70% 2180
98%
51 100% 1375
95.80% 181
100%
258
96.30%
50 100%
549 96.90% 2085
95.60%
2011 3 2011 4 2011 5 2011 6
2011 7(乳制品, 蜂糖) 2011 8 2011 9 2011 10 2011 11 2011 12 2012 13 2012 14 2012 15 2011 16 2011 17 2011 18 2011 19
1556 1374 696 501 540 507 295
256
92 88 331 328 1195 1150 234 218 316 309 280 278 1088 1035 691 679 913 813 362 340 1559 1511 972 819 1060
1036
88% 72% 94% 86.80%
96%
99.10% 96.20% 93.20% 97.80% 99.30% 95.10% 98.30% 89.00% 93.90% 96.90% 93.90% 92.90%
因篇幅问题不能全部显示,请点此查看更多更全内容