化學(xué)計量學(xué)是復(fù)雜化學(xué)體系(例如食品)光譜分析的強(qiáng)有力工具。這篇文章主要通過簡單的介紹化學(xué)計量學(xué),并且講解如何使用化學(xué)計量學(xué)進(jìn)行反射數(shù)據(jù)的計算進(jìn)行蘋果的質(zhì)量控制。從糖分的檢測到種類的辨別,化學(xué)計量學(xué)都能幫助到您!
比爾-朗伯特(Beer-Lambert)定律的局限
光譜作為有效的化學(xué)分析工具已經(jīng)擁有很悠久的歷史。尤其是在計算溶液中微量物質(zhì)的濃度應(yīng)用中,光譜分析方法發(fā)揮著重要作用。根據(jù)比爾-朗伯特定律,化學(xué)工作者可以使用光譜的方法建立物質(zhì)在特定波長下標(biāo)準(zhǔn)曲線,然后計算溶液中該物質(zhì)的未知濃度。然而,我們很難判定該物質(zhì)的最低或最準(zhǔn)確檢出限。對于那些有發(fā)散或者發(fā)射光的樣品,或者對于存在濃度守恒的樣品,或者不均一介質(zhì),或者光譜分辨率太低時,比爾-朗伯特定律不再適用。另外,由于反射的深度有限及發(fā)散光的影響,我們同樣很難通過簡單的反射模型測試來進(jìn)行樣品測量。
當(dāng)比爾-朗伯特定律在特定波長的濃度計算已經(jīng)不能完成物質(zhì)濃度計算,我們就需要通過該吸收光譜提取其他成分來判定物質(zhì)信息。在復(fù)雜的測試體系中,很多精確復(fù)雜的數(shù)學(xué)方法已經(jīng)被用來計算未知物質(zhì)濃度 — 比如化學(xué)計量學(xué)。化學(xué)計量學(xué)在近些年越來越被大家熟知,得力于它的強(qiáng)大計算能力和各領(lǐng)域的大范圍應(yīng)用。
化學(xué)計量學(xué)的需求
如今食物渠道全球化,水果不能是太成熟的或者在運(yùn)輸過程中不能被催熟,而且必須保證水果在運(yùn)輸過程中完好,甚至還有一些水果必須從這一季儲存到另一季進(jìn)行銷售。為了好售賣,外觀往往比質(zhì)量重要,以至于消費(fèi)者和零售商都要在購買時猜測水果的成熟度。然而,化學(xué)計量學(xué)的出現(xiàn),可以通過紅外反射光譜計算的方法預(yù)測水果的甜度和營養(yǎng)價值,而不需要切開水果一探究竟。
在傳統(tǒng)光譜分析失敗的領(lǐng)域,化學(xué)計量學(xué)發(fā)揮重要作用,就比如說計算測量蘋果的近紅外反射光譜數(shù)據(jù)。為什么比爾-朗伯特定律在這個應(yīng)用中不能發(fā)揮作用?首先,反射光譜存在很多不確定因素,比如:測試的方法;測試水果的內(nèi)在散射的顆粒大??;蘋果表面的狀態(tài)等等。第二,近紅外吸收光譜對于-OH,-NH,和-CH基團(tuán)震動比較敏感。大多數(shù)有機(jī)化合物的吸收都在近紅外這個波段,由于無數(shù)吸收光譜帶的疊加,導(dǎo)致這個波段的近紅外光譜無法計算。
近紅外吸收光譜,不像其他近紅外信息,不能簡單地獲得單個化合鍵的信息,因此類似于該領(lǐng)域的電磁譜已經(jīng)被遺忘近十年。然而,化學(xué)計量學(xué)的發(fā)展已經(jīng)打開了光譜信息的寶庫,而該光譜信息可以通過光學(xué)光譜儀和光源簡單的獲得。
什么是真正的化學(xué)計量學(xué)?
化學(xué)計量學(xué)是通過強(qiáng)大的軟件計算工具進(jìn)行數(shù)理統(tǒng)計并科學(xué)計算,從而得到定性定量分析結(jié)果。我們將著重于化學(xué)計量學(xué)在光學(xué)光譜測量技術(shù)中應(yīng)用及重要性。
圖1. 化學(xué)計量學(xué)在不同應(yīng)用中的不同應(yīng)用形式
圖1中的化學(xué)計量學(xué)形式,通常會被問到3個問題:
化學(xué)計量學(xué)的三步走
就像朗伯比爾定律要求制定標(biāo)準(zhǔn)曲線一樣,化學(xué)計量學(xué)需要制定它自身的標(biāo)準(zhǔn),那就是 使用大量的光譜數(shù)據(jù)來分析濃度(定量計算中)或者大量的數(shù)據(jù)采集進(jìn)行組別分析(產(chǎn)品分類或者辨別)?;瘜W(xué)計量學(xué)的軟件集成了儀器先學(xué)習(xí)數(shù)學(xué)方法到模型開發(fā),再到含量確定或者組別確定,因此校準(zhǔn)過程通常稱作為“訓(xùn)練/培訓(xùn)”。化學(xué)計量學(xué)模型的定制通常需要參數(shù)的優(yōu)化來實現(xiàn)分析。這個步驟通常稱作交叉比對,通過光譜從原始數(shù)據(jù)的篩選獲取測試樣品的光譜數(shù)據(jù)進(jìn)行。
通過使用“測試集”與原始的“校正集”完全分離開的測量方法,對額外的已知樣品光譜對模型進(jìn)行有效性評估也是非常重要的。如果測量值的預(yù)測偏差在需求偏差和準(zhǔn)確度范圍內(nèi),那么該模型就可以用來測試新樣品,從而獲得感興趣的數(shù)據(jù)結(jié)果(包括濃度或者組成員鑒別)。當(dāng)我們使用一個完整建立好的化學(xué)計量學(xué)模型時,比如,一個蘋果的簡單NIR反射光譜,我們就可以用來評估測量樣品的綜合質(zhì)量,比如蘋果的甜度等等。
然而建立模型似乎是一個非常耗時的過程,排除對寄送樣品所需的時間成本和昂貴的實驗室測量成本,就其快速性,非破壞性,簡單的預(yù)估等特點(diǎn)使得化學(xué)計量學(xué)還是有高的回報率的。NIR反射光譜是非常迅速的測量手段,比如說無需樣品準(zhǔn)備等等。
計量學(xué)背后的數(shù)學(xué)
化學(xué)計量學(xué)是借用多樣的數(shù)理統(tǒng)計手段,使用多種可測量的樣品來判斷那些未知樣品的未知參數(shù)的科學(xué)方法。在光譜中,可測量的數(shù)據(jù)比如有不同波長段的吸光度,但還可能包括其他的測量,比如溫度等等。數(shù)學(xué)計算,類似于線性擬合算法,可以通過測量出的X值,計算出Y值。然而,至于多樣性的數(shù)理統(tǒng)計,不僅僅是一個單獨(dú)的x變量,它可能有更多的變量。但是無需驚慌,線性代數(shù)在這類計算中發(fā)揮重要作用。
那如何來精確計算呢?相對于單一值的算法(比如簡單的線性擬合),我們現(xiàn)在必須選擇使用整個數(shù)組的方法:PLS,SVM,PCA等等。幸運(yùn)的是,我們在使用這些方法的時候,我們無需了解這些方法的具體細(xì)節(jié)及原理。事實上,即使這些方法看上去非常不一樣,但是所獲得的結(jié)果卻很類似。
現(xiàn)在被大家認(rèn)可的,且最常使用的定量方法是偏最小二乘法(PLS),它可以通過光譜數(shù)據(jù)(反映的“物質(zhì)”)來最有效的分析解釋物質(zhì)的多樣性及差別。另一個被普遍使用的分類方法叫支持向量機(jī)(SVM),而另一種用來將分析物與標(biāo)準(zhǔn)物進(jìn)行區(qū)別的方法叫主成分分析方法(PCA)。
軟件工具
就像計量方法一樣,數(shù)學(xué)分析方法作為一種軟件處理工具,適用于對模型的開發(fā)。除了化學(xué)計量學(xué)整套程序軟件(像數(shù)理統(tǒng)計軟件“R”),或者M(jìn)ATLAB工具包,還有一些商業(yè)性質(zhì)的化學(xué)計量學(xué)軟件,比如Analyze IQ,GRAMS(Thermo Fisher),Unscrambler(Camo)or Pirouette(Infometrix)等等。這些軟件為我們提供了數(shù)據(jù)建立,優(yōu)化和測試化學(xué)計量學(xué)模型,再將這些數(shù)據(jù)捆綁到一起建立決定樹狀圖,通過這些可以開發(fā)出更復(fù)雜的分析方法。
案例介紹:辨別蘋果的甜度
水果的含糖量(主要是:果糖,葡萄糖和蔗糖)在壓榨形果汁中是通過可溶性固形物(SSC)的測定來評判,最后以波美度(°Bx)或者蔗糖等量度/100mL的形式反映甜度。10°Bx 到 16°Bx的糖度比較典型,根據(jù)蘋果的品種不同,同一品種未成熟的和已經(jīng)成熟的蘋果糖度偏差大概在4°Bx左右。
波美度的測試非常耗時并且需要對每批的樣品進(jìn)行拆包,然后送到實驗室進(jìn)行檢驗。化學(xué)計量學(xué)的方法使用近紅外反射光譜對其進(jìn)行檢測和計算,為客戶提供快速、非破壞性測試等選擇方案。在這個案例中,我們會展示化學(xué)計量學(xué)開發(fā)使用的大概步驟,并使用復(fù)雜分析方法測試并計算一個模型,比如:波美度。
圖2.(a)實驗搭建;(b)紅外反射光譜;(c)使用SNV對采樣模型進(jìn)行校正后的光譜;(d)校正后光譜和平均光譜間的差異
圖2(a)為漫反射測量搭建形式并使用Flame-NIR(950-1650nm)光譜儀和鹵鎢燈光源采集76個姜黃色蘋果紅外反射光譜。使用的蘋果包括成熟的和未成熟的,同時他們的波美度已經(jīng)在實驗室通過其他測量方法確定了。采集每個蘋果上中軸線附近5個位置的光譜(圖2b)。由于蘋果外形的差異,使得測量過程中存在測量位置的差異,從而導(dǎo)致測量數(shù)據(jù)存在偏差,所以使用SNV(標(biāo)準(zhǔn)變量變換)的方法對其測量值進(jìn)行前處理校正(圖2c)。比如只有光譜數(shù)據(jù)之間的差異性才包含了測量物之間不同甜度的信息,所以我們用測量光譜減去所有光譜的平均值(這個過程叫做平均中心化,查看圖2d),從而獲得一組數(shù)據(jù)信息。
圖3. 蘋果真實甜度的對比圖(使用實驗室測量的波美度標(biāo)記),并且根據(jù)紅外反射光譜預(yù)測波美度
隨機(jī)挑選1/3樣品作為測試集,剩余2/3樣品作為校正集,通過交叉驗證方法建立甜度(波美度)指標(biāo)的模型。盡管校正集訓(xùn)練結(jié)果良好,但是通過交叉驗證方法可以提高模型對未知樣品的預(yù)測精度,從而防止“過擬合”現(xiàn)象的發(fā)生。在此次模型建立過程中,當(dāng)主成分?jǐn)?shù)為5時模型性能最佳。模型的線性情況可以參考圖3,在圖中顯示了校正集和預(yù)測集的糖度實測值和NIR預(yù)測值的散點(diǎn)圖。兩者數(shù)據(jù)間的偏差用預(yù)測標(biāo)準(zhǔn)偏差(SEP)來表示,如果偏差值小于0.3°Bx,我們就可以判斷該模型準(zhǔn)確有效。
案例分析:蘋果品種鑒定
同樣使用圖2中的搭建裝置,測量出蘋果表面的反射光譜,再利用化學(xué)計量學(xué)計算工具對蘋果的品種進(jìn)行鑒定。唯一不同點(diǎn)就是,我們使用可見光波段的Flame光譜儀,測量480-920nm波段的反射光譜,以此獲得蘋果中化合物成分信息,比如類胡蘿卜素(420-500nm),花青素(540-550nm),葉綠素(600-700nm)等等。
測量數(shù)據(jù)同樣使用之前提出的數(shù)據(jù)前處理方式:使用SNV和平均-中心的比例尺,將共性和獨(dú)特個性區(qū)分開。為了能辨清差異性,我們選擇典型物質(zhì)成分分析—通過數(shù)學(xué)分析方法來辨別光譜里的有效信息,而這類光譜能很好地展示不同品種蘋果之間的差異。
正如數(shù)學(xué)結(jié)果所示,典型物質(zhì)成分分布在所有波長定義的多維空間。該案例中,我們將蘋果皮中主要成分光譜結(jié)合起來,包括類胡蘿卜素(橙色),花青素(紅色)和葉綠素a和b(600-700nm)。這些主成分信息能讓我們根據(jù)重要維度獲得更高維度數(shù)據(jù),從而將有用信息從無用的噪音圖譜中區(qū)分開。
針對目前的數(shù)據(jù),不同光譜間的97%多樣性可以通過兩個主成分來解釋分析。不同的蘋果具有不同的“分?jǐn)?shù)”,比如就像圖4所示,將這兩種典型物質(zhì)結(jié)合后,就可以將光譜表達(dá)成不同維度的數(shù)據(jù)。同時,我們可以很輕松地將蘋果分成三組:綠蘋果,紅蘋果和黃-綠蘋果。有了這個圖表,我們可以以同樣的方式測試未知樣品的圖譜,獲得已知典型物質(zhì)的分?jǐn)?shù),然后按照該表格將該蘋果進(jìn)行分類。
圖4. 使用不同品種蘋果可見光波段的反射圖譜進(jìn)行主成分分析。其中g(shù)g=姜黃蘋果,gd=金黃蘋果,gs=斯密斯奶奶蘋果,ff=富士蘋果,hc=蜂蜜松脆蘋果,mc=麥金托什蘋果
基于可見光波段的反射圖譜可以將蘋果分為黃蘋果,綠蘋果或者紅蘋果,并且可以作為分類工作的主要方法?!爸С窒蛄繖C(jī)”(SVM)作為常用的數(shù)學(xué)計算分析模型,經(jīng)常被用于樣品分類,即使在一些不明確分類的應(yīng)用中,我們也可以使用。為了展示該方法,我們隨機(jī)將我們的數(shù)據(jù)組分開,并將80%的可見光光譜(總共576個光譜)使用SVM分類模型將其分類。再進(jìn)行交叉比對,并對最終模型中20%的數(shù)據(jù)進(jìn)行結(jié)果認(rèn)證,然后獲得兩模型參數(shù)的最佳值。那模型結(jié)果如何?在交叉比對中,分類錯誤率為0.3%,而在144個光譜的分開測試中,模型沒有出現(xiàn)任何錯誤差值。
結(jié)論
通過化學(xué)計量學(xué)與模型光譜的結(jié)合,我們可以實現(xiàn)對食品或者其他樣品快速和實時分類與檢測。從對復(fù)雜體系進(jìn)行快速和高性價比檢測,到樣品分類的強(qiáng)大能力或者在線質(zhì)量控制等等,這種結(jié)合的可行性是無止境的?,F(xiàn)代化學(xué)計量學(xué)軟件使得這些工具更具可用性,而且可能是您一直尋找的有效工具。
蘋果反射光譜測量的裝置搭建
| HL-2000 | 鹵鎢燈光源,360-2400nm的連續(xù)輸出 |
| QR200-12-MIXED | 同時覆蓋UV-VIS和VIS-NIR波段的反射探頭 |
| CSH | 針對坑洼表面測量的反射探頭支架 |
| Flame-S-VIS-NIR | 350-1000nm的VIS-NIR光譜儀 |
| Flame-NIR | 950-1700nm的檢測器非制冷的近紅外光譜儀 |