① 價格預測模型有哪些
價格預測的方法(模型)主要有:
(1)回歸分析法。
價格預測要達到一定準確度,往往需要在一系列歷史數據的基礎上,充分考慮影響價格的相關因素,採用因果分析方法,建立實用的數學模型進行回歸分析。採用這種方法,需要佔有充分的歷史數據和價格影響因素資料,再加上預測人員良好的分析能力,才能得到比較理想的效果。
(2)比價法。
價格預測中可以採用比回價法,其原理是在市場經濟條件下,根據利益均衡原則,利用產成品價格與原材料價格、半成品價格之間,以及不同產品之間往往存在的一定比價關系進行預測。採用這種方法,需要大量數據資料的積累,還需注意剔除非正常因素的影響。
(3)城市基礎設施和服務的價格不完全取決於市場,也有的直接由政府定價,應根據政府的價格政策,消費者的支付意願和承受能力進行預測。
供參考。
② 數學建模中用於預測的模型有哪些
你可以看看這個http://wenku..com/view/a80dd235eefdc8d376ee322d.html
灰色預測模型
蛛網模型
層次分析法
熵權法
Leslie模型
標准化/歸一化
神經網路
蒙特卡洛演算法
01型整數規劃模型
遺傳演算法模板
③ 預測模型可分為哪幾類
1、趨勢外推預測方法
趨勢外推預測方法是根據事物的歷史和現實數據,尋求事物隨時間推移而發展變化的規律,從而推測其未來狀況的一種常用的預測方法。
趨勢外推法的假設條件是:
(1)假設事物發展過程沒有跳躍式變化,即事物的發展變化是漸進型的。
(2)假設所研究系統的結構、功能等基本保持不變,即假定根據過去資料建立的趨勢外推模型能適合未來,能代表未來趨勢變化的情況。
由以上兩個假設條件可知,趨勢外推預測法是事物發展漸進過程的一種統計預測方法。簡言之,就是運用一個數學模型,擬合一條趨勢線,然後用這個模型外推預測未來時期事物的發展。
2、回歸預測方法
回歸預測方法是根據自變數和因變數之間的相關關系進行預測的。自變數的個數可以一個或多個,根據自變數的個數可分為一元回歸預測和多元回歸預測。同時根據自變數和因變數的相關關系,分為線性回歸預測方法和非線性回歸方法。回歸問題的學習等價於函數擬合:選擇一條函數曲線使其很好的擬合已知數據且能很好的預測未知數據。
3、卡爾曼濾波預測模型
卡爾曼濾波是以最小均方誤差為估計的最佳准則,來尋求一套遞推估計的模型,其基本思想是: 採用信號與雜訊的狀態空間模型,利用前一時刻地估計值和現時刻的觀測值來更新對狀態變數的估計,求出現時刻的估計值。
它適合於實時處理和計算機運算。卡爾曼濾波器問題由預計步驟,估計步驟,前進步驟組成。 在預計步驟中, t時狀態的估計取決於所有到t-1 時的信息。在估算步驟中, 狀態更新後, 估計要於時間t的實際觀察比較。更新的狀態是較早的推算和新觀察的綜合。 置於每一個成分的權重由「 Kalmangain」(卡爾曼增益) 決定,它取決於雜訊 w 和 v。(雜訊越小,新的觀察的可信度越高,權重越大,反之亦然)。前進步驟意味著先前的「新」觀察在准備下一輪預計和估算時變成了「舊」 觀察。 在任何時間可以進行任何長度的預測(通過提前狀態轉換)。
4、組合預測模型
組合預測法是對同一個問題,採用多種預測方法。組合的主要目的是綜合利用各種方法所提供的信息,盡可能地提高預測精度。組合預測有 2 種基本形式,一是等權組合, 即各預測方法的預測值按相同的權數組合成新的預測值;二是不等權組合,即賦予不同預測方法的預測值不同的權數。 這 2 種形式的原理和運用方法完全相同,只是權數的取定有所區別。 根據經驗,採用不等權組合的組合預測法結果較為准確。
5、BP神經網路預測模型
BP網路(Back-ProPagation Network)又稱反向傳播神經網路, 通過樣本數據的訓練,不斷修正網路權值和閾值使誤差函數沿負梯度方向下降,逼近期望輸出。它是一種應用較為廣泛的神經網路模型,多用於函數逼近、模型識別分類、數據壓縮和時間序列預測等。點擊打開鏈接(BP神經網路預測實例)
④ 三種預測模型效果比較
唐益群(2007)提出的工程中常用的基坑降水造成沉降的經驗公式:
基坑降水工程的環境效應與評價方法
式中:ΔH——降水深度,為降水面和原地下水位面的深度差;
ΔP——降水產生的自重附加應力,ΔP=ΔH·γw/4;
E——降水深度范圍內土層的壓縮模量。
對於同樣5組實測數據應用三種不同方法預測地面沉降量的結果見表4-13。由表可見工程經驗估演算法結果的相對誤差大多大於40%,基於BP神經網路地面沉降預測模型預測誤差可控制在不大於20%,支持向量基地面沉降預測模型預測誤差可控制在不大於10%。可見無論是基於BP神經網路理論還是基於支持向量機理論的預測模型,其預測精度均好於傳統經驗公式。
表4.12 工程經驗估演算法誤差分析
表4.13 三種方法誤差對比
導致以上結果的原因如下:
(1)工程經驗法考慮的引發基坑周邊地面沉降的因素較少,且其推導過程很難准確反映真實的水土耦合作用過程。
(2)BP神經網路雖然理論上能夠得到較理想的預測結果,但其准確度高度依賴於樣本數量的多少和樣本質量,而在實際工程應用中,很難獲得大量高質量的工程監測數據作為訓練樣本,可能是此次項目研究中採用該方法沒能得到理想結果的原因。
(3)支持向量機能夠適應根據小樣本數據進行預測的情況,並且能夠從有限樣本中剔除低質量的較為離散的樣本數據,從而對於基坑降水引發的地面沉降的預測給出了較為理想的結果。
⑤ 預測模型流程
本書構建的預測模型具體步驟如圖5.1所示。首先,在對美國的儲量增長歷史進行階段劃分的基礎上,與中國的原油儲量增長歷史進行對比研究,明確中國目前的原油新增可采儲量分別所處的發展階段;從前文中美石油生產歷史對比的分析結果可知中國原油新增可采儲量目前處於穩定增長的階段。美國本土48州(不含深水區域)原油新增可采儲量的增長不僅已經經歷了這些增長階段,而且已經進入遞減階段。中國未來的原油新增可采儲量遞減階段的控制參數選擇可以以美國的情況作為參考。
圖5.1 中美原油儲量與產量類比流程
在獲取了階段控制參數後,即可根據公式5.1~5.3對中國的原油產量進行預測。在儲采比以一定的比例降至10之前,產量逐年增長;如果儲采比降至10,則令儲采比恆定為10,並在此基礎上根據式5.4對未來的產量進行預測。
在進行上述計算的同時,還需要對累計資源探明率進行計算,因為累計發現的油氣資源(累計產量與剩餘儲量之和)不可能超過最終可采資源量,即累計資源探明率不可能大於100%。如果在預測時間段中某一年度開始累計資源探明率達到100%,那麼其後的年度新增油氣儲量為0,即年資源探明率為0,而累計資源探明率恆定為100%,之後的產量仍然按照儲采比為10 進行預測。詳細的預測流程見圖5.2。
⑥ 預測模型建立
鬆散含水層含水量預測模型的建立,主要是將預測鬆散含水層含水量問題轉化為利用支持向量機求解的數學模型,主要包括如下4個步驟:
1)選取訓練集T={(x1,y1),…,(xl,yl)}∈(χ×y)l。
2)選擇適當的核函數K(x,x'),如線性核函數、徑向基核函數、多項式核函數和Sigmoid核函數。
3)確定支持向量機中的參數,如C,ε,γ等。
4)建立模型。
(一)訓練集的選取
1.預測基本輸入特徵量
選取合適的訓練集,對於建立鬆散含水層含水量預測模型是非常重要的,本課題對預測模型輸入特徵量的選取遵循以下原則:
1)現有物探儀器設備可測、或可轉換參數,具有實用性和可觀測性。
2)要與所研究地下含水層結構的綜合物探方法相配套,充分挖掘所獲觀測數據的信息資源。
3)優化組合,兼顧所利用的輸入特徵量間的互補性,避免或減少冗餘性。
4)保障預測模型具有廣泛的推廣能力。
建模時要把所有的數據分為訓練集和測試集,根據訓練集,求出決策函數,而用測試集測試所得決策函數的准確率。那麼選擇一個合適的訓練集,第一要滿足訓練集中的樣本點數量不能過多,也不能太少;第二訓練集中所含特徵向量不能太少,如果太少則不能夠反映實際情況,影響分類或者回歸的准確性,但也不能太多,否則會增加計算難度,甚至影響訓練速度和時間。除了樣本點多少的選擇以外,還要在數據中不能選擇過多的屬性。屬性選擇要達到以下3個目的:首先是確認哪些屬性與預測輸出特徵量相關的特性;其次是盡量降低輸入空間維數,縮小求解問題的規模;最後是提高准確率,得到更好的決策函數。
基於上述原則,將支持向量機預測模型的預測輸入基本特徵量選定為:反演電阻率值ρ、反演含水層厚度H,半衰時Th,衰減度D,視極化率ηs,縱波速度v等地面物探觀測參數作為基本輸入特徵量討論。
為了驗證上述輸入特徵量選擇原則的正確性,選擇了石家莊市西馬庄水源地現有電測深資料與單孔單位涌水量資料並進行了秩相關性分析,原始數據見表5-1所示。分析結果如表5-2所示。
表5-1 西馬庄原始數據
表5-2 西馬庄電性參數與涌水量相關分析
2.綜合性參數的引入
鑒於第四紀含水層一般呈高阻性,在電測深反演解釋過程中易產生Th等值現象的解釋誤差。依據含水層的富水性對應於一定的電阻率值,而單孔單位涌水量既與含水層富水性有關,又與其厚度有關。為了盡可能消除因等值現象導致解釋所產生的誤差,又能使輸入特徵量與預測量有更為密切的相關性,使預測模型具有良好的推廣能力,對此,將電測深反演後的含水層電阻率與其層厚度相乘作為一個輸入特徵量T',該特徵量T'與含水層單孔單位涌水量相關分析結果表明,二者有更為密切的相關性,見表5-3所示。
表5-3 綜合參數與涌水量相關分析
考慮到不同的地區地下水所含礦化度的不同,因其孔隙水的導電性不同,將會導致同類富水層電阻率有較大差別。為了消除孔隙水的導電性對預測精度的影響,突出含水層有效孔隙度特徵,基於ρ=αΦ-ms-nρw式,引入了相對綜合因子參數T″,其表達式為
含水層含水量預測綜合物探技術
式中:ρf為孔隙流體的電阻率;ρt為岩石的電阻率;H為含水層厚度。
從而將原基本輸入特徵量ρ和H組合為一個輸入特徵量T″。
3.激發比的引入
考慮到激發比可以放大激電異常,對第四系含水層有更為靈敏的反應。因此將激電模型里的極化率、衰減度參量用激發比參量代替,其表達式為J=ηsD。由表5-4和表5-5可知,激發比的引入,改善了模型預測精度。
表5-4 未引入激發比模型預測結果
表5-5 引入激發比模型預測結果
4.輸入特徵量的歸一化
由於各輸入特徵量的量度差異較大,在用支持向量回歸機進行建模訓練和使用時,有必要對輸入特徵量進行歸一化。歸一化是指將屬性數據按比例縮放,使之落入一個小的特定區域,如[-1,1]或[0,1]范圍內。
歸一化可以幫助防止具有較大初始值域的屬性與具有較小初始值域的屬性相比,權重差距過大。本次所建模型採用最小-最大規范化方法:將輸入特徵量歸一化到[0,1]范圍內。歸一化公式為
含水層含水量預測綜合物探技術
式中:x為某個輸入參數對應的值;xmin和xmax分別為該項特徵量的設置最小值和最大值;xs為該輸入參數的歸一化值。
5.預測輸入特徵量的優選
在基本預測輸入特徵量歸一化處理的基礎上,需要進一步研究特徵量組合結構的優化性問題,即確定預測模型最佳輸入特徵量的數量和成分。
通過電測深找水實踐證明:
第四紀地下含水層結構對應特定的電測深異常特徵,所獲取的地電參數與單孔涌水量均存在著一定的對應關系,但深入研究還表明:作為預測輸入量而言,每一參量與單孔涌水量間存在著不同的相關性,輸入量相互之間可能還存在著冗餘成分,為提高預測模型的預測精度和模型運算速度,探討上述地電參量與地下水單孔涌水量的相關性和輸入特徵量的最佳組合問題,揭示地電參數與地下含水層含水量的內在關聯是十分必要的,也是確定預測模型輸入特徵向量的基礎。
鑒於地電參數與地下含水層含水量間不存在明確的函數關系,在優化分析過程中,以石家莊市西馬庄水源地的已知8眼井孔的資料為基礎,將現有的已知特徵量參數:T″,Th,D,ηs及激發比J作為分析對象,利用高斯徑向基核函數,C=1024,ε=0.5,γ=1.0和ε-SVR模型進行7+1循環式訓練-預測方式。其分析結果如表5-6所示。
由表5-6所列預測精度可得到以下結論:
表5-6 特徵量的優化分析表 單位:%
第一,隨著特徵數量的增大,其預測精度得到提高,四個特徵量預測精度最好;
第二,若採用三個特徵量時,其中的T″,Th,D組合最佳,其次為T″,D,ηs。以上結論對建模時輸入特徵量的優化篩選提供了重要的參考依據。
6.預測模型輸入特徵量的確定
基於上述分析,針對研究對象的尺度及精度要求,建立了4種預測模式。對於不同的預測模型,分別確定了其輸入特徵量。
模型一:輸入特徵量為含水層的反演電阻率ρ、隔水層的反演電阻率ρ隔、含水層厚度h、含水層層數n和井孔孔徑。該模型主要用於對精度要求不高的區域水文地質調查。
模型二:輸入特徵量為含水層的反演電阻率ρ、隔水層的反演電阻率ρ隔、視極化率ηs、含水層的半衰時Th、含水層厚度h、含水層層數n和井孔孔徑。該模型主要用於專門性水文地質調查。
模型三:輸入特徵量為含水層的反演電阻率ρ、隔水層的反演電阻率ρ隔、視極化率ηs、半衰時Th、衰減度D、含水層厚度h、含水層層數n和井孔孔徑。該模型主要用於對精度要求較高但探測深度要求不高的地下水源評價與開發工作。
模型四:輸入特徵量為含水層的反演電阻率ρ、隔水層的反演電阻率ρ隔、視極化率ηs、縱波波速v、含水層厚度h、含水層層數n和井孔孔徑。該模型主要用於對精度要求較高,探測深度較深的地下水源評價與開發工作。
(二)核函數的選擇
在建立預測模型過程中,需要選擇函數K(·,·),即選擇一個映射Φ(·),把x所在的輸入空間χ映射到另一個空間H。H是一個Hilbert空間,即可以是有限維空間也可以是無窮維空間。因此核函數方法的核心內容就是採用非線性變換Φ將n維矢量空間中的隨機矢量x映射到高維特徵空間,在高維特徵空間中設相應的線性學習演算法,由於其中各坐標分量間的相互作用只限於內積,因此不需要知道非線性變換Φ的具體形式,只要利用滿足Mercer條件的核函數替換線性演算法中的內積,就能得到原輸入空間中對應的非線性演算法。
支持向量回歸機中的核函數對於預測模型的推廣能力產生直接的影響,在選取核函數時,通常採用的方法有:一是利用專家的先驗知識預先給定核函數;二是採用Cross-Validation方法,即在核函數選取時,分別試用不同的核函數,歸納預測誤差最小的核函數就是最好的核函數。在本課題中我們採用了第二種方法進行核函數的選擇。
為使確定的核函數具有最佳的預測效果,首先要對相應的核數的參數進行優化篩選。由(5-20),(5-22),(5-24)式可見,徑向基核函數需要確定1個核參數,即系數γ;Sigmoid核函數需要確定2個參數,分別為:系數γ和常數r;多項式核函數需要確定3個參數,分別為:階數d、系數γ和常數r。
在篩選過程中,將石家莊市西馬庄水源地的井旁電測深成果和抽水試驗數據作為研究基礎,具體數據詳見表5-1所示。
將其劃分為兩個子集,即一個訓練集和一個預測驗證集。由此對上述每一種核函數利用已確定的訓練集進行建模參數優化篩選。具體方法為:對於徑向基函數採取了交叉驗證和網格搜索的方法,多項式核函數和Sigmoid核函數採用了試湊法。
試驗一:徑向基核函數交叉驗證
對石家莊西馬庄水源地8眼井作試驗數據,選出7個作為訓練樣本,一個不參加訓練的樣本。再將選出的7個訓練樣本隨機分為3組,選擇其中兩組進行訓練,另外一組作為驗證,這樣一個接一個,進行3次。每次驗證時,嘗試所有的參數對,計算其交叉校驗的平均性能MSE,最後以模型在3次驗證數據上的性能平均值作為這一學習參數下的模型性能,然後循環8次,從而確定最佳參數值范圍。確定的搜索范圍分別為C(2-10,215),ε(2-10,23),γ(2-10,210)。為了增加搜索速度,我們步長選擇的是2的指數倍。最終確定參數C=1024,ε=0.5,γ=1。
試驗二:多項式核函數試湊法
借鑒試驗一的分析結果,選擇參數C=1024,ε=0.5。在選取核參數之前,我們需要對多項式核的階數d做出限定,選擇的階數不易過大,如階數太大,不僅增加了學習模型的復雜性,易出現「過擬合」現象,導致SVM的推廣性能降低。因此,規定d的取值不超過4。另外對γ和r做了初步篩選,圈定了其范圍分別為:γ∈[1,4];r∈[0.1,1]。然後採用階梯式搜索分別找出最優的階數d、系數γ和常數r;
首先進行階數d的選擇,設定參數γ=1,r=0.2;從8眼井中選出7個作為訓練樣本,d依次選擇1、2、3、4進行訓練,預測那個沒有參加訓練的樣本,循環8次然後將預測結果進行對比。本文採用兩個誤差指標來衡量模型的預測效果:均方誤差(MSE)和平均絕對百分比誤差(MAPE),其表達式分別為
含水層含水量預測綜合物探技術
式中: 為預測值;xi為實測值;N為試驗次數,這里N取8。
由表5-7可以看出:當d=3或d=4時,預測精度相近,但考慮到階數越大,學習模型的復雜性越大,因此選取d=3最佳參數。
表5-7 不同階數多項式核函數對預測結果影響統計表
然後進行系數γ選擇,設定參數d=3,r=0.2;γ依次選擇1、2、3、4進行訓練,然後將預測結果進行對比,可知γ=1為最佳參數(表5-8)。
表5-8 不同γ多項式核函數對預測結果影響統計表
最後進行常數r的選擇,設定參數d=3,γ=1.0;r依次選擇0.2、0.4、0.6、0.8和1進行訓練,然後將預測結果進行對比,可知r=0.8為最佳參數(表5-9)。
表5-9 不同r多項式核函數對預測結果影響統計表
最終確定參數d=3,γ=1,r=0。
試驗三:Sigmoid核函數試湊法
選取石家莊西馬庄水源地8眼井作試驗數據,仍借鑒試驗一的分析結果,選擇參數C=1024,ε=0.5。
對γ和r做了初步篩選後,確定γ為0.1;圈定r∈[0.01,1]。下邊對參數r進行精細選擇,設定r值分別為:0.01、0.1、0.2、0.4、0.8,從8眼井中選出7個作為訓練樣本,預測樣本不參加訓練集,經過8次循環,通過對預測結果的對比,從而確定r=0.01~0.1時預測效果最好。分析結果如表5-10所示。
表5-10 不同rSigmoid核函數對預測結果影響統計表
核函數的選擇通常採用Cross-Validation法,即在核函數選取時,分別試用不同的核函數,歸納預測誤差最小的核函數就是最好的核函數。
我們將石家莊西馬庄8眼井的資料與北京潮白河水源地7眼井的資料組合建立新的建模集,從中任意選出14個作為訓練集樣本,另外1個樣本組成預測集,這樣進行了8組試驗,通過圖5-3我們看到基於RBF核函數的預測模型預測精度最高。因此我們認為利用RBF核函數建立的含水層含水量預測模型預測效果最佳。
圖5-3 三種核函數預測精度對比
(三)參數確定
採用徑向基核函數所建立的模型需要確定的參數共有三個,分別為核函數參數γ,懲罰系數C和鬆弛變數ε。
懲罰因子C為正常數,懲罰因子C決定了對超出誤差ε的樣本懲罰程度。從結構風險的角度考慮,C值取得過大,問題傾向於經驗最小,忽略對結構復雜程度的考慮;反之則更多地考慮了問題的復雜程度,忽略了經驗數據的作用。因此可以說,C是支持向量機回歸和泛化能力的平衡參數。懲罰因子C取不同的常數值,對結果有不同的影響。
由表5-11可知當C值取1024和2048時預測精度相同,說明當C大於一定值時,其變化對分析結果產生的影響變小。
表5-11 不同C值對預測結果影響統計表
通過對比試驗,最終取值C=1024,ε=0.5,γ=1.0。
(四)模型建立
構造並求解最優化問題
含水層含水量預測綜合物探技術
得到最優解 每個支持值β=(a*i-ai)。
構造決策函數
含水層含水量預測綜合物探技術
其中
將所求得的核函數系數、β值及b值帶入5-44式,即為ε-SVR預測模型。
⑦ 預測模型都有哪些
預測學是一門研究預測理論,方法,評價及應用的新型科學,是軟體學中的重要分支。縱觀預測的思維方式,其基本理論主要有慣性原理,類推原理和相關原理。預測的核心問題是預測的技術方法,或者說是預測的數學模型。預測的方法種類繁多,例如灰色預測法,神經網路法等。本文將綜合數學模型使用的幾種基本的預測模型,並總結各模型的優缺點和適用范圍。
(1)自回歸AR(P)模型
(2)滑動平均MA(q)模型