国家烟草专卖局
综合技术
国家烟草专卖局总机
010-63605000
新闻投稿热线:
010-63606453
010-63605947
cx-out@tobacco.gov.cn
站内搜索:
当前位置 >>服务信息>>烟农>>实用技术>>综合技术     查看:减小字体 增大字体
基于NIRS信息对中国烤烟烟叶进行模式识别

2006-10-24

1 前言

我国目前对烟叶的质量评价和管理主要依赖色泽、尺寸、脉络等外观因素及一些人类成分的化学指标(如总糖、总氮、尼古丁、还原糖等)。根据外观直观的评价、分类操作简单,不需要复杂的样品前处理,但不同人员评价结果可能不同。化学指标的测试耗时、费力,其在烟叶质量评价方面可起到比较重要的作用[1],但用于描述烟叶、卷烟风格特征却存在较大偏差[2]:采用湄潭烟叶替代津巴布韦烟叶时,虽然化学成分与评吸给分很接近,而内在质量,特别是香味、余味上尚有差距,还不能替代。这从工业实践说明了烟草的主要化学成份对质量有影响,但还不能完全用化学成份的含量来表示烟草在“吃味”、“香气”方面的特性。烟叶因产地造成的特有风味是因为其内在化学成分的比例不同造成的,不同产地烟叶中所含物质是相同的,不同的是其组成。烟叶中目前已经知道的组分就有3800种[3],从理论上讲,如果我们能检测出烟叶中所有化学成分的含量,然后对其进行因子分析,采用若干主因子应能良好表征烟叶的质量与特征,但在实际上无法完成如此庞大的化学组分测试。

近红外光谱(nirs)技术自上个世纪70年代以来,由于其测试简便,无须复杂的样品前处理,环境友好,可快速提供分析结果等优点,在食品、医药、石油等领域得到了广泛应用[4,5]。近红外光谱可反映样品中含量大于0.1%的组分在结构与组成方面的信息,对样品的破坏小,损失的样品信息也远小于其它检测方法。因此nirs所反映的信息比单纯的化学指标、色谱数据更全面、准确,应能更好地体现不同产地烟叶的风格、特征及烟叶质量水平。本文在前期方法学验证考察的基础上[6],以近红外信息为基础对不同年份、产地的烟叶,同一产地不同部位、同一部位不同等级的烟叶进行模式识别,并与实际结果进行对比。

2 样本来源及测试方法

将烤烟烟叶磨成粉,过60目筛后放入样品杯中,近红外仪分辨率设定为8cm-1,扫描次数64。采用美国nicolet公司antaris、德国brukervector22/n与mpa三台近红外仪测定相关烟叶的光谱数据。共有三批烤烟样品的近红外光谱及相应的样本产地、部位,等级等信息。

第一批:为2002年烤烟,含有79个样本,分别采自云南(12)、四川(21)、贵州(12)、湖南(10)、福建(24)等5个产地,该批样本除有近红外光谱数据外,还含总糖、还原糖、总氮、总氯、尼古丁、钾等6个化学指标。采用不同仪器和样品杯测试样本,得到如下三组近红外光谱集(set of nir spectra,简称snirs):snirs79n:其中79表示样本个数,n表示nicolet公司antaris近红外仪(以下含义同此)1.8ml玻璃样品杯测试。snirs79nr:r表示旋转样品杯测试。snirs79bv:bv代表bruke公司vector22/n近红外仪,旋转样品杯测试。

第二批:为2003年烤烟,共有153个样本,分别来自云南(17)、陕西(17)、山东(32)、黑龙江(24)、重庆(35)、安徽(11)、湖南(6)、湖北(11)等产地,从中选取样本较多的5个产地(云南、陕西、山东、黑龙江、重庆)的125个烤烟样品进行分析。其近红外光谱集记为snirsl25n。

第三批:为2003年国家烟草专卖局收集的烤烟标样,共627个,分别来自湖南(56)、湖北(49个)、云南(90个)、贵州(99)、四川(59)、重庆(35)、广东(8)、河南(50)、安徽(11)、福建(44)、陕西(17)、黑龙江(41)、山东(32)、古林(12)、辽宁(24)等15个省市。从中选取样本数在50以上的5个产地(湖南、河南、云南、贵州、四川)样本共354个构成样品近红外光谱集snirs354bm(采用bruker公司mpa近红外仪,旋转样品杯测试)与snirs354bv。从中选取30个样本以上10个产地的样本共555个构成样品近红外光谱集snirs555bm与snirs555bv。从中选取湖北、云南、福建、黑龙江、山东等互不邻接并且相隔较远的5个产地共256个样本构成snirs256bm与snirs256bv。

3 结果与分析

在matlab 6.5.1平台上,编写相应的分析程序,采用文献[6]所提出的mdts方法分别对上述近红外光谱集进行产地识别。对每一个样品集随机选取1/4~1/5样本作为预测集,余下部分作为建模集,构造4~5个不同的建模与预测样本集合进行烟叶产地、部位和等级的识别。

3.1 光谱区间的选择

三台近红外测试的烤烟样品的原始近红外光谱如图1所示,由此图可知,不同产地烟叶近红外光谱形状十分相似。

光谱区间的选择对模式识别结果有着重要影响,区间选择不合理,会引入不必要的噪声信息和仪器误差。取一烟叶样品,在上述三台近红外仪上进行连续多次重复性测试,保存其光谱并求得这些谱图之标准差图谱如图2所示。图2左为全图(图2右)的局部放大图,该图反映了仪器的噪声与误差水平。由图1可知,bruker两台仪器测试烟叶时,在3750cm-1以下部分的吸收大于0.8,达到1.5左右,超出beer定律的线性范围,不宜采用。且从图2可知,bruker近红外仪重复测定同一烟叶的标准差在3700cm-1以下部分远大于其它部分,如参与计算,使得re严重偏大:而其10000波数以上样本重复性检测的标准差开始增大,故综合图1与图2,对于bruker近红外光谱,取3750cm-1~10000cm-1,进行分析。nicolet的antaris近红外仪光谱在整个波长区间的重复性测试方差均很稳定,故取全光谱进行分析。

3.2 产地的识别

表1给出了分别根据6个化学指标与不同的近红外光谱集对第一批79个烟叶样本进行产地识别的结果。其中平均预测准确率为在不同样本集合下预测正确的样本数的平均值与预测集样本数之比,整体平均准确率为在不同样本集合下建模与预测集中判别正确的样本之和与总样本数之比。该表结果表明近红外光谱信息能够很好地反映烟叶样本由于产地不同所带来的差异,因此在模式识别时能够给出理想的判别结果。而根据化学指标对烟叶产地识别的整体判别准确率只有61%左右,预测准确率只有43%,表明根据几个化学指标很难全面反映烟叶的产地风格特征。表1的结果还说明对于同样的烟叶样本,由于仪器的差异导致近红外光谱存在细微的不同,这些光谱差异对模式识别的结果也产生一定的影响。





(据云南烟叶信息网)