公布日:2024.03.19
申請日:2023.12.08
分類號:G06Q10/0639(2023.01)I;G06F18/213(2023.01)I;G06F18/24(2023.01)I;G06N20/10(2019.01)I
摘要
一種污水水質異常波動檢測方法及系統,包括:對目標區域的歷史數據進行數據清洗,進行數據清洗時,保留離群值;歷史數據包括時間滯后性水質指標、實時水質指標、水量指標和氣象指標;將預處理后的實時水質指標、水量指標和氣象指標按時間順序輸入水質模型,時間滯后性水質指標作為水質模型的輸出,對水質模型進行訓練,得到訓練好的水質模型;水質模型包括級聯的維度注意力層、GRU神經網絡層、時間注意力層、全連接層和分類層。與現有技術相比,本發明在確保數據質量的同時保留了反映水質異常波動的異常值,還可以從海量數據中識別并掌握對應于水質異常波動的數據特征,進而實現對污水水質異常波動的快速、準確檢測。
權利要求書
1.一種污水水質異常波動檢測方法,包括如下步驟:對目標區域的歷史數據進行預處理;所述歷史數據包括時間滯后性水質指標、實時水質指標、水量指標和氣象指標;所述預處理包括以具有相同時間戳的一組數據為最小單位執行數據清洗,進行數據清洗時,保留離群值;將預處理后的實時水質指標、水量指標和氣象指標按時間順序輸入水質模型,時間滯后性水質指標作為水質模型的輸出,對水質模型進行訓練,得到訓練好的水質模型;所述水質模型包括級聯的維度注意力層、GRU神經網絡層、時間注意力層、全連接層和分類層。
2.根據權利要求1所述的污水水質異常波動檢測方法,其特征在于,還包括對訓練好的水質模型進行微調以使模型的準確率、召回率、F1分數和F2分數達到精度閾值的步驟。
3.根據權利要求1或2所述的污水水質異常波動檢測方法,其特征在于,還包括利用訓練好的水質模型進行預測的步驟:將當前時刻的實時水質指標、水量指標和氣象指標輸入到訓練好的水質模型中,輸出得到預測的時間滯后性水質指標,根據預設閾值判斷預測的時間滯后性水質指標是否異常。
4.根據權利要求1或2所述的污水水質異常波動檢測方法,其特征在于:所述GRU神經網絡層的輸出Yt的表達式為Yt=σ(Htwo+bo);其中,更新門:Rt=σ(Xtwxr+Ht-1whr+br);重置門:Zt=σ(Xtwxz+Ht-1Whz+bz);隱含層(t-1):H′t=tanh(Xtwxh+(Rt*Ht-1)whh+bh);隱含層(t):Ht=Zt*Ht-1+(1-Zt)*H′t;式中,σ和tanh分別表示Sigmoid激活函數和tanh激活函數,*表示兩個向量的標量積,Xt表示t時刻的輸入,Ht-1表示t-1時刻的隱藏狀態,w、wxh、whh、wxr、whr、wxz、whz表示權重參數,b0、bh、br、bz表示偏置參數。
5.根據權利要求1或2所述的污水水質異常波動檢測方法,其特征在于:所述維度注意力層為自注意力結構,所述時間注意力層是由多個自注意力結構并行構成的多頭注意力結構。
6.一種污水水質異常波動檢測系統,其特征在于,包括:第一水質數據采集器,用于采集時間滯后性水質指標;第二水質數據采集器,用于采集實時水質指標;水量數據采集器,用于采集水量指標;氣象數據采集器,用于采集氣象指標;預處理模塊,用于對目標區域的歷史數據進行預處理;所述歷史數據包括時間滯后性水質指標、實時水質指標、水量指標和氣象指標;所述預處理包括以具有相同時間戳的一組數據為最小單位執行數據清洗,進行數據清洗時,保留離群值;數據處理模塊,其內存儲有訓練好的水質模型,所述水質模型的輸入為預處理后的實時水質指標、水量指標和氣象指標,輸入時按時間順序輸入水質模型,水質模型的輸出為時間滯后性水質指標;所述水質模型包括級聯的維度注意力層、GRU神經網絡層、時間注意力層、全連接層和分類層。
7.根據權利要求6所述的污水水質異常波動檢測系統,其特征在于:還包括微調模塊,用于對訓練好的水質模型進行微調以使模型的準確率、召回率、F1分數和F2分數達到精度閾值。
8.根據權利要求6或7所述的污水水質異常波動檢測系統,其特征在于:還包括預測模塊,用于利用訓練好的水質模型進行預測:將當前時刻的實時水質指標、水量指標和氣象指標輸入到訓練好的水質模型中,輸出得到預測的時間滯后性水質指標,根據預設閾值判斷預測的時間滯后性水質指標是否異常。
9.根據權利要求6或7所述的污水水質異常波動檢測系統,其特征在于:所述GRU神經網絡層的輸出Yt的表達式為Yt=σ(Htwo+bo);其中,更新門:Rt=σ(Xtwxr+Ht-1whr+br);重置門:Zt=σ(Xtwxz+Ht-1whz+bz);隱含層(t-1):H′t=tanh(Xtwxh+(Rt*Ht-1)whh+bh);隱含層(t):Ht=Zt*Ht-1+(1-Zt)*H′t;式中,σ表示Sigmoid激活函數,tanh表示tanh激活函數,*表示兩個向量的標量積,Xt表示t時刻的輸入,Ht-1表示t-1時刻的隱藏狀態,w、wxh、whh、wxr、whr、wxz、whz表示權重參數,b0、bh、br、bz表示偏置參數。
10.根據權利要求6或7所述的污水水質異常波動檢測系統,其特征在于:所述維度注意力層為自注意力結構,所述時間注意力層是由多個自注意力結構并行構成的多頭注意力結構。
發明內容
本申請的發明目的在于提供一種污水水質異常波動檢測方法及系統,通過設計高效的預處理確保數據質量的同時保留了反映水質異常波動的異常值,通過建立基于雙重注意力機制的神經網絡模型,使得模型可以從海量數據中識別并掌握對應于水質異常波動的數據特征,進而實現對污水水質異常波動的快速、準確檢測。
為達到上述目的,本申請采用如下技術方案。
一方面,提供一種污水水質異常波動檢測方法,包括如下步驟:
對目標區域的歷史數據進行預處理;所述歷史數據包括時間滯后性水質指標、實時水質指標、水量指標和氣象指標;所述預處理包括以具有相同時間戳的一組數據為最小單位執行數據清洗,進行數據清洗時,保留離群值;
將預處理后的實時水質指標、水量指標和氣象指標按時間順序輸入水質模型,時間滯后性水質指標作為水質模型的輸出,對水質模型進行訓練,得到訓練好的水質模型;所述水質模型包括級聯的維度注意力層、GRU神經網絡層、時間注意力層、全連接層和分類層。
上述方案中,通過在預處理的數據清洗步驟中保留離群值,在確保數據質量的同時保留了反映水質異常波動的異常值。通過建立基于雙重注意力(維度注意力和時間注意力)機制的神經網絡模型,使得模型可以從海量數據中識別并掌握對應于水質異常波動的數據特征,進而實現對污水水質異常波動的快速、準確檢測。
在一些實施例中,還包括對訓練好的水質模型進行微調以使模型的準確率、召回率、F1分數和F2分數達到精度閾值的步驟。
在一些實施例中,還包括利用訓練好的水質模型進行預測的步驟:將當前時刻的實時水質指標、水量指標和氣象指標輸入到訓練好的水質模型中,輸出得到預測的時間滯后性水質指標,根據預設閾值判斷預測的時間滯后性水質指標是否異常。
在一些實施例中,所述GRU神經網絡層的輸出Yt的表達式為Yt=σ(Htwo+bo);其中,
更新門:Rt=σ(Xtwxr+Ht-1whr+br);
重置門:Zt=σ(Xtwxz+Ht-1whz+bz);
隱含層(t-1):H′t=tanh(Xtwxh+(Rt*Ht-1)whh+bh);
隱含層(t):Ht=Zt*Ht-1+(1-Zt)*H′t;
式中,σ和tanh分別表示Sigmoid激活函數和tanh激活函數,*表示兩個向量的標量積,Xt表示t時刻的輸入,Ht-1表示t-1時刻的隱藏狀態,w、wxh、whh、wxr、whr、wxz、whz表示權重參數,b0、bh、br、bz表示偏置參數。
在一些實施例中,所述維度注意力層為自注意力結構,所述時間注意力層是由多個自注意力結構并行構成的多頭注意力結構。
又一方面,提供一種污水水質異常波動檢測系統,其特征在于,包括:
第一水質數據采集器,用于采集時間滯后性水質指標;
第二水質數據采集器,用于采集實時水質指標;
水量數據采集器,用于采集水量指標;
氣象數據采集器,用于采集氣象指標;
預處理模塊,用于對目標區域的歷史數據進行預處理;所述歷史數據包括時間滯后性水質指標、實時水質指標、水量指標和氣象指標;所述預處理包括以具有相同時間戳的一組數據為最小單位執行數據清洗,進行數據清洗時,保留離群值;
數據處理模塊,其內存儲有訓練好的水質模型,所述水質模型的輸入為預處理后的實時水質指標、水量指標和氣象指標,輸入時按時間順序輸入水質模型,水質模型的輸出為時間滯后性水質指標;所述水質模型包括級聯的維度注意力層、GRU神經網絡層、時間注意力層、全連接層和分類層。
在一些實施例中,還包括微調模塊,用于對訓練好的水質模型進行微調以使模型的準確率、召回率、F1分數和F2分數達到精度閾值。
在一些實施例中,還包括預測模塊,用于利用訓練好的水質模型進行預測:將當前時刻的實時水質指標、水量指標和氣象指標輸入到訓練好的水質模型中,輸出得到預測的時間滯后性水質指標,根據預設閾值判斷預測的時間滯后性水質指標是否異常。
在一些實施例中,所述GRU神經網絡層的輸出Yt的表達式為Yt=σ(Htwo+bo);其中,
更新門:Rt=σ(Xtwxr+Ht-1whr+br);
重置門:Zt=σ(Xtwxz+Ht-1whz+bz);
隱含層(t-1):H′t=tanh(Xtwxh+(Rt*Ht-1)whh+bh);
隱含層(t):Ht=Zt*Ht-1+(1-Zt)*H′t;
式中,σ表示Sigmoid激活函數,tanh表示tanh激活函數,*表示兩個向量的標量積,Xt表示t時刻的輸入,Ht-1表示t-1時刻的隱藏狀態,w、wxh、whh、wxr、whr、wxz、whz表示權重參數,b0、bh、br、bz表示偏置參數。
在一些實施例中,所述維度注意力層為自注意力結構,所述時間注意力層是由多個自注意力結構并行構成的多頭注意力結構。
本申請至少具有如下技術效果或優點:
1、通過在預處理的數據清洗步驟中保留離群值,在確保數據質量的同時保留了反映水質異常波動的異常值。
2、通過建立基于雙重注意力機制的神經網絡模型,使得模型可以從海量數據中識別并掌握對應于水質異常波動的數據特征,進而實現對污水水質異常波動的快速、準確檢測。
(發明人:張怡拓;郭健;張羽;巫文昕;靳帥國;趙凌云;曹健;任亮)