改進的遞推主元分析及遞推主元回歸算法
程龍,王桂增
(清華大學自動化系,北京100084)
摘 要:為了加速模型在線更新的速度以更好地適應實際工業過程的動態變化,通過在已有遞推主元分析(PCA)算法的基礎上簡化了自相關矩陣的遞推公式,從而改進了基于秩1更新的遞推PCA算法,把原來需要進行2次秩1更新的步驟簡化為僅僅需要進行一次秩1更新,并在此基礎上提出了遞推主元回歸算法。仿真結果表明,改進后的基于秩1更新的遞推PCA算法比原來的基于秩l曼新的遞推PCA算法縮短了近一半的運算時間,而新的遞推主元回歸算法,不但能夠適應工業過程的動態變化,并且比批處理的方式節約了存儲空間與計算時間。
關鍵詞:遞推主元分析;自相關陣;秩1更新;遞稚主元回歸
中圖分類號:TP 27 文獻標識碼:A
Improved Recursive PCA a nd Recursive PCR Algorithms
CHENG Long,WANG Gui-zeng
(Department ofAutomation.Tsinghua University,Beringl00084,China)
Abstract.To accelerate the model 0n-line modificatlon a nd accommodate the industrial process change,an efficient recursive PCA al-gorithm using rank-one modification a nd a novel recursive PCR algorithm are proposed by improving the approach of updating correlationmatrix Simulation resuits show that the improved recursive PCA based on rank-one modification shotren the computational time in con-trast with the existing recursive PCA algorithm Moreover.the recursive PCR algorithm Call adapt process changes a nd need less corn-puting time a nd memm?usage than batch PCR algorithm
Key words:reellisive PCA;coneiation matrix;rank-one modification;recursive PCR
1引言
主元分析(PCA)是一種將多個相關變量轉化為少數幾個相互獨立變量的統計分析方法。
主元分析由Pearson[1]最早提出,后經Hoteling[2]加以改進。主元分析可以將很多相關過程變量壓縮為少數獨立的變量,因此被廣泛應用于過程監控[3],故障診斷[4]等領域。
實際的工業過程通常表現出時變特性,用主元分析法建立的模型隨著時間的推移將出現明顯的偏差,為此,需及時對模型進行更新,而如果采用將新數據和舊數據結合重新進行主元分析,計算量很大。針對上述情況,Wold提出了指數加權平均主元分析的方法[5],Rigopoulos等提出了滑動窗結合主元分析的方法[6],而Liw H等提出了遞推PCA算法[7],對數據矩陣的均值、標準差進行遞推更新,從而遞推求出規范化后的數據矩陣,進而得出自相關陣的更新公式,最后利用秩1更新得出負荷向量和得分向量。
本文針對Li WH等提出的遞推PCA算法,簡化了自相關陣的遞推公式,改進了基于秩1更新的遞推PCA算法,并給出了輸入輸出變量協方差矩陣的遞推公式,提出了一種新的主元回歸遞推算法(PCR),仿真實驗證明了方法的有效性。
2改進的遞推PCA遞推算法
1)基于秩1更薪的遞推PCA算法定義全部k個原始輸入數據塊組成的矩陣為
其中,每一行代表一個樣本,每一列代表一個輸入變量。
全部(k+1)個原始數據塊組成的矩陣為Xok+1形式與Xok相同。若前K個數據塊長度為Mk,考慮每采樣一次進行一次遞推,則包括新來數據的所有(k+1)個數據塊的長度為Nk+1=Nk+1。Weihua Li H指出[7],每當新數據x0k+1來時。可以遞推計算出原始輸入數據矩陣中各變量的均值、標準差和規范化后的輸人數據矩陣,進而得出自相關陣的遞推公式。
均值向量的遞推式為
|