干燥与发酵过程的近红外光谱检测建模与应用
【摘要】:近红外(near-infrared.缩写NIR)光谱技术由于具有无损检测、分析速度快、以及不需要对样本预处理等优点,近年来越来越多地应用于工业批次生产工艺如颗粒物干燥和生物发酵过程等。然而现有的NIR光谱分析方法主要基于采集样本做离线检测,不能用于在线检测或会产生较大的测量误差,亦不能用于在线质量监测。本文以批次颗粒流化床干燥(fluidized bed drying,缩写FBD)过程和葡萄糖发酵过程为检测对象,对于采用原位NIR光谱技术在线测量批次干燥过程颗粒含水量、葡萄糖发酵过程主要组分含量的标定建模和在线监测方面开展研究工作,主要研究内容和贡献如下:(1)针对采用NIR光谱检测干燥过程的颗粒含水量受到操作条件影响的问题,提出一种结合工况条件的光谱标定建模方法,以保证实时在线测量的准确性。通过将两个重要的操作条件,即FBD内膛温度和加热量,与原位实时采集的近红外光谱一起与作为光谱标定的建模变量,给出一种偏最小二乘(partial least squares,缩写PLS)回归建模方法。为了消除实际检测中出现测量异常值带来的不利影响,提出一个中位数绝对百分比误差(median-absolute-percentage-error,缩写MdAPE)指标以确定PLS模型的最佳潜变量数。由此建立的光谱标定模型能对在不同操作条件下的颗粒含水量达到较好的拟合和预测效果。通过在相似和不同操作条件下的批次硅胶颗粒FBD过程检测实验,验证该方法的有效性和相对于现有离线检测方法的优点。(2)针对一些批次颗粒FBD过程难以采集充足标签样本进行NIR光谱标定建模的问题,提出一种基于变分推断的半监督PLS标定建模方法。其突出优点是将实时测量中采集的全部光谱数据(包括有对应采样做离线检测的数据,称为标签光谱,反之称为无标签光谱)基于概率密度分析用于建立NIR光谱标定模型。为处理高维NIR光谱输入变量相对于标签数据量的冗余问题,将伽玛分布引入光谱输入变量以实现自动变量选择。通过一个数值案例和批次硅胶颗粒FBD过程检测实验,验证该方法不但可以显著提高在线检测精度,而且能明显提高训练模型的可信度。(3)针对一些批次生物发酵过程采样做离线检测经常存在不准确结果、以及样本数据不足难以建立NIR标定模型的问题,提出一种基于阶梯网络的NIR光谱标定建模方法。首先提出一种逐层训练策略,通过最小化验证集的损失函数来确定最优的阶梯网络模型结构和参数。然后采用一个监督的阶梯网络模型筛除对应于不准确标签样本的NIR光谱数据,进而基于预选后的准确标签光谱数据和大量无标签光谱数据,建立一个基于半监督阶梯网络的NIR光谱标定模型。通过一个数值例子和批次葡萄糖发酵过程实验,验证该方法不但可以有效地去除不准确的标签光谱数据,而且能显著提高实时测量的准确性。(4)对于采用NIR光谱实时监测批次干燥过程终点的工程问题,提出一种切换模型的NIR检测方法来实时监测颗粒FBD过程终点。首先建立一个全局模型应用于实时监测干燥过程的前期,然后构建即时局部模型用于实时监测干燥过程的后期和确定干燥终点,从而不仅克服采用一个全局模型在线监测干燥过程终点难以保证精确性的问题,又能避免采用即时局部模型实时监测全过程会导致计算代价过大的问题。此外,引入一个t分布式随机邻域嵌入(t-distributed random neighborhood embedding,缩写 t-SNE)方法以降低高维NIR光谱的输入变量维度,以便在低维空间中选择相似的光谱样本进行标定建模。通过实时检测硅胶颗粒FBD过程的实验,验证该方法可以在相似或不同操作条件下准确地监测干燥过程终点。