導航:首頁 > 數據處理 > 殘差101有多少數據量

殘差101有多少數據量

發布時間:2022-05-05 17:02:12

A. 如何判別測量數據中是否有異常值

1、概述:一組測量數據中,如果個別數據偏離平均值很遠,那麼這個(這些)數據稱作「可疑值」。如果用統計方法—例如格拉布斯(Grubbs)法判斷,能將「可疑值」從此組測量數據中剔除而不參與平均值的計算,那麼該「可疑值」就稱作「異常值(粗大誤差)」。本文就是介紹如何用格拉布斯法判斷「可疑值」是否為「異常值」。

2、測量數據:例如測量10次(n=10),獲得以下數據:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

3、排列數據:將上述測量數據按從小到大的順序排列,得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。可以肯定,可疑值不是最小值就是最大值。

4、計算平均值x-和標准差s:x-=7.89;標准差s=2.704。計算時,必須將所有10個數據全部包含在內。

5、計算偏離值:平均值與最小值之差為7.89-4.7=3.19;最大值與平均值之差為14.0-7.89=6.11。

6、確定一個可疑值:比較起來,最大值與平均值之差6.11大於平均值與最小值之差3.19,因此認為最大值14.0是可疑值。

7、計算Gi值:Gi=(xi-x- )/s;其中i是可疑值的排列序號——10號;因此G10=( x10-x- )/s=(14.0-7.89)/2.704=2.260。由於 x10-x-是殘差,而s是標准差,因而可認為G10是殘差與標准差的比值。

8、下面要把計算值Gi與格拉布斯表給出的臨界值GP(n)比較,如果計算的Gi值大於表中的臨界值GP(n),則能判斷該測量數據是異常值,可以剔除。但是要提醒,臨界值GP(n)與兩個參數有關:檢出水平α (與置信概率P有關)和測量次數n (與自由度f有關)。

9、定檢出水平α:如果要求嚴格,檢出水平α可以定得小一些,例如定α=0.01,那麼置信概率P=1-α=0.99;如果要求不嚴格,α可以定得大一些,例如定α=0.10,即P=0.90;通常定α=0.05,P=0.95。

10、查格拉布斯表獲得臨界值:根據選定的P值(此處為0.95)和測量次數n(此處為10),查格拉布斯表,橫豎相交得臨界值G95(10)=2.176。

11、比較計算值Gi和臨界值G95(10):Gi=2.260,G95(10)=2.176,Gi>G95(10)。

12、判斷是否為異常值:因為Gi>G95(10),可以判斷測量值14.0為異常值,將它從10個測量數據中剔除。

13、餘下數據考慮:剩餘的9個數據再按以上步驟計算,如果計算的Gi>G95(9),仍然是異常值,剔除;如果Gi<G95(9),不是異常值,則不剔除。本例餘下的9個數據中沒有異常值。

B. 方差分析

單因素獨立樣本固定效應方差分析分析總結——效應量及其置信區間、Power、趨勢分析
數據文件:OA3.sav,R中為OA3
模擬數據:
R:
n1<-n2<-n3require(pwr);require(MBESS);require(multicomp);require(car)
1 假設檢驗:
Anova(lm(Happy~ Type,data=OA3,contrasts=list(Type=contr.sum)),type=」III」)
##要注意當TypeIII和TypeII兩者不一樣的時候,需要加入語句:contrasts=list(fcategory=contr.sum, partner.status=contr.sum) ##Coding,適用TypeIII方法
參考R幫助文件>example(Anova)
(註:Type II和Type III的區別:
在沒有交互作用,或不同組之間的被試數比例與總體比例相同時二者無區別;
Type II在有交互作用,且不同組之間的被試數比例與總體比例相同時適用;
Type III在有交互作用,總體為等比例但樣本為不等比例時適用。
亦可以回歸的方式來做:
lm.OA3<-lm(Happy~ Type,data=OA3)
summary(lm.OA3)
得到的結果中後面會用到的是:
R2=0.3719,F(2,90)=26.648
(註:回歸方法當中只報告回歸的一些參數,不報告SS,但是報告R2(SPSS中不報告),方便接下來計算f2(f2的求法列在下面))
2 效應量及其置信區間
①Cohen』s f2及其置信區間
f2=0.3719/(1-0.3719)
= 0.5921032
##Cohen』f2=R^2/(1-R^2 )(where R2 is the squared multiple correlation)
##參考
##Cohen』f2=ncp/N(N=n*k)
ci.ncp<-conf.limits.ncf(F.value=26.648,conf.level=0.95,df.1=2,df.2=90) ##求ncp置信區間
lambda <- c(ci.ncp$Lower.Limit,ci.ncp$Upper.Limit); ##以置信區間的形式顯示結果
因為f2=ncp/N (N=nK)
sqrt(ci.f2 <- lambda / N); (進行轉化)
#求非中心參數ncp的置信區間,然後根據ncp和f2的關系來求得f2的置信區間#
根據上面兩個式子可得:f2的置信區間是(0.5151149 0.9806293)

②求η2及其置信區間
η2= SSeffect / SStotal
在單因素方差分析當中,因為只有一個自變數,η2=R2,所以η2=0.3719
在SPSS當中用Analyze——General Linear Model——Univariate來進行單因素方差分析可以收集到ηp2、R2、校正R2等數據,而且可以進行更復雜的Contrast。
方差分析結果

由noncf.sav計算得到的結果(前四項手工輸入,最後三項為所需要的結果):

可知η2置信區間為: [0.20966,0.49021]
其實更簡單的方法是在R中直接根據f2與η2的代數關系換算出η2的置信區間(^_^)。
③求ω2
ω2 = (SSeffect - (dfeffect)(MSerror)) / (MSerror + SStotal)=(1280.416-2*24.025)/(24.025+3442.627)
= 0.3554917
當前沒有求總體ω2置信區間的統計技術
參考《Experimental Design Using ANOVA》:P114。
註:ω2置信區間和η2置信區間的文獻常見的問題是沒有定義總體值而直接談置信區間,這是範式上的錯誤。
④求ηp2(偏η2)
ηp2 = SSeffect / (SSeffect + SSerror)
=η2
=0.3719
置信區間為:[0.20966,0.49021]
兩者相等可以從他們的公式看出來:
η2= SSeffect / SStotal
ηp2 = SSeffect / (SSeffect + SSerror)
η2在分母當中包括了其他自變數的效應。而在單因素方差分析中只有一個自變數,所以兩者相等。
註:在多因素方差分析中,需要根據兩者的代數關系來求ηp2的置信區間。
如果自變數是隨機因素(Random Factor),還可以求效應量指標為。這里只給出計算公式:
 = (MSeffect - MSerror) / (MSeffect + (dfeffect)(MSerror))
其他的效應量還包括:Glass』sΔ、Hedges』 g等。
各效應量之間的比較:
η2和ηp2是對特定樣本效應量的描述統計量,是對效應量總體參數的有偏估計,而ω2是對作為總體參數的效應量的無偏點估計。因此η2和ηp2會高估效應量,所以ω2比η2和ηp2小一點。根據公式:
η2= SSeffect / SStotal
ηp2 = SSeffect / (SSeffect + SSerror)
可以看出η2會隨著自變數的變多而變小,無法准確體現一個自變數的「效應」,而ηp2則不會。根本原因是η2的的分母中是總和方SStotal,而ηp2的分母是效應變異和誤差變異的和(SSeffect+SSerror),因此ηp2不隨自變數的增多而變小。但也是正因為如此,各自變數的ηp2 之和不等於1。總的來說,η2的值描述的是在樣本當中自變數所產生的變異效果。對於自變數效應量的總體估計值是ω2。
3 Power
pwr.f2.test(u=2,v=90,f2=0.5921032,sig.level=0.05)
Power的主要作用是在研究開始前估計樣本量。但是在統計分析之後如果研究結果不顯著,可以通過求Power來看還需要多少樣本才能夠獲得顯著性結果。
4 Post Hoc
require(multcomp)
g<-glht(lm.OA3, linfct = mcp(Type =c(」Senior-Mid=0〃,」Senior-Youth=0〃,」Mid-Youth=0〃)))
註:必須將所有的差異都寫出來,不能一次只單獨求一個差值:
g<- glht(lm.OA3, linfct = mcp(Type =c(」Senior-Mid=0,」)))
註:這是單個Planned test(事前檢驗)的做法。如果是多個檢驗,根據所要做的比較的次數會有對α的校正,因此求出的置信區間會比不做校正的要大。事後檢驗在數學上與對應的多個事前檢驗結果一樣(比如:包括三次比較的時候檢驗與做了三個比較的事前檢驗結果是一樣的)。因為簡單主效應是事後檢驗,應該進行α的校正,所以在R中應該同時寫出三個比較(有幾個比較寫幾個比較)。
R中採用的是Turkey HSD的做法,結果與SPSS一致。如果在R中只進行一次比較,結果與SPSS中Post Hoc裡面的LSD方法相同,也就是說SPSS當中的LSD方法沒有對α進行校正。
summary(g) ##可以看顯著性檢驗的結果
confint(g) ##求老年人與中年人的簡單主效應的置信區間
## 關於事後檢驗的具體方法和優劣參考

求非標准化簡單主效應
非標准化簡單主效應就是指並非簡單的差值比較,而是較為復雜的多重比較:比如老年人和中年人的平均值與青年人的差值的顯著性檢驗。
g<- glht(lm.OA3, linfct = mcp(Type =c(」0.5*Senior + 0.5*Mid – Youth=0〃)))
##比較老年人和中年人的平均值與青年人的快樂指數
summary(g) ##顯著性檢驗結果
confint(g) ##求置信區間:
在SPSS中選擇Contrast,在Coefficients當中依次填入-1,0.5,0.5。結果與R一致。
註:這裡面要注意一點:指定的系數之和必須是0才能保證各組之間的變異是正交的。
另外在網上提供的做法當中填入的系數為-2,1,1,雖然最後的顯著性結果是一致的,但這個時候差值的點估計就不和題目相對應了,所以建議用第一種方法指定系數。)
SPSS做法

其中包括了SPSS的Syntax語句。
在進行Contrast比較的時候就涉及到Coding(指定各水平系數)和Orthogonality(正交性)的問題。首先在自變數、水平之間是獨立的假設成立的前提下,Coding要保證系數之和等於0,這樣就能保證水平之間是正交的。正交的好處在於將效應量完全獨立的分解,每次比較不會有重復的部分。如圖:
正交
當樣本量不一致時就很不能保證正交。
註:這里所提到的Coding指的是對各個啞變數的系數賦值的過程。
參考《Experimental Designs Using ANOVA》P124
事後檢驗方法
事前檢驗的效力比事後檢驗更高。只有在沒有條件進行事前檢驗、或者沒有明確的理論預期的時候才進行事後檢驗。
常用的Post Hoc有LSD、Scheffe、Turkey HSD、Bonferroni等。
LSD需要等組條件,並且沒有對α進行校正,在進行較多檢驗的時候會提高犯一類錯誤的可能。
Scheffe過於保守,損失大量的Power。但特別適用於不等組情況。
Turkey HSD要求等組。在SPSS中對α進行了校正。
5 趨勢分析(Trend Analysis):
在SPSS中的Contrast選項中選擇Polynomial。3個水平最多隻能是二次型(Quadratic)。
SPSS中趨勢分析結果為:
趨勢分析
線性趨勢結果顯著(F=51.083,p0.001),Quadratic趨勢不顯著(F=2.213,p>0.001)。這里的Deviation就相當於回歸分析當中的殘差。

去101學習輔導答疑網看看,那裡有專業的老師在線回答問題的!現在注冊還免費送金豆!

C. 用spss擬合出的公式計算出的數據與真實測量數據的殘差在什麼范圍可接受

這個沒有固定標準的,看你自己的要求就好了,看擬合好不好殘差,殘差平方和都只是一個方面指標,越小越好,但沒絕對參考標准,可以有相對標准,也就是不同模型預測殘差之間比較,另外就是用預測值和實際值求相關,相關系數越大越好

D. 實驗數據量的多少對數學模型的影響

建立數學模型的一般步驟是:
第一步:觀察並提出問題.要構建一個數學模型,首先我們要了解問題的實際背景,弄清楚對象的特徵.
第二步:提出合理的假設.合理提出假設是數學模型成立的前提條件,假設不同.所建立的數學模型也不相同.
第三步:建構模型.根據所作的假設分析對象的因果關系,利用對象的內在規律和適當的數學工具,構造各個量詞的等式關系.
第四步:對模型進行檢驗或修正.當數學公式這個模型構建出來後,可以進一步求算出各月的具體數值,再繪制出坐標曲線圖,曲線圖可以更直觀地反映出種群數量的增長趨勢.
故選:A.

E. 資料的選取、方法技術與反演結果

遠震層析所用數據應是高質量的,較大誤差將影響計算結果。遠震數據常常來自於短周期的檢波器,檢波器確定了信號的低頻限定值。遠震距離的衰減與限定值結合將產生約為1Hz的信號。

挑選到時的精度按震中距離的遠近分為兩個檔次,±0.05s(震中距為幾百千米);0.1s(震中距為1000km以上)。相對於平均地球模型的走時變化稱為走時殘差。

初始震源的參數取自IRIS(The Incorporated Research Institutions for Seismology),震相的提取精度均小於0.1s。另外,由於所用數據為不同時間段所提取的震相,為了保證計算的精度,又統一計算了相對走時殘差。反演時要求地震射線數多於5條。層析成像反演採用ACH技術。

5.2.1 走時殘差的概念

根據在地球表面的走時測量推斷地球內部的速度模型是地震學中的一個經典問題。對於一個三維地球模型來說,地震射線的走時是速度v(r)和幾何路徑的函數。我們的任務是根據地表的大量走時推導出地下介質的速度v(r)。速度與走時的關系為

中國西部岩石圈三維結構及演化

上式是個非常復雜的問題的表達,因為未知量v(r)隱含在射線路徑中。這就使得該反演問題具有高度的非線性特點,而非線性方程是很難求解的。因此,將上述問題線性化是進行數值求解的關鍵。由於射線路徑和介質的速度均是未知的,求解速度v(r)時要首先知道射線路徑。目前經典的作法是按照速度v(r)的模型以較高的精度計算出地球上任意兩點間的走時值,並且在給定初始地球模型的情況下,求出射線路徑。

研究工作中,在精確提取P、S震相到時後,將減去由參考地球模型的J-B表計算的理論走時,這樣,便得到所用的走時殘差數據。

利用費馬原理(射線路徑的幾何形狀並非任意,它總是使兩點間的走時取穩定值),在反演計算中,用初始模型中的射線路徑代替真實地球中(未知的)射線路徑,再根據地表觀測的實際走時t,便可求出介質速度v(r)。我們利用了費馬原理,用初始模型的射線路徑代替了真實地球中(未知的)射線路徑。在計算時差上所引入的誤碼差僅僅是二階小量。

5.2.2ACH反演與解析度的討論

ACH方法(K.Aki,1977;J.R.Evans et al.,1993)是地震波層析成像反演方法中應用最為有效的方法之一。它適用於所有「有限排列」地震層析問題,即震源在接收台站范圍之外的剖面布設方式。

地震層析反演需要地震射線的分布方向廣闊。通常使用的震相是P、PKP,P震相要求接收台站與震中的距離大於等於25°。

在討論ACH處理結果之前,需要通過解析度矩陣檢測反演的質量。解析度指的是區分兩個靠近目標的能力,即為

中國西部岩石圈三維結構及演化

其中: 為計算得到的真實解,m為理論解。R由下式給出:

中國西部岩石圈三維結構及演化

此處,W為權系數矩陣;θ2是阻尼參數。矩陣的每個對角線元素指示了所求參數的質量。一般情況下,如果對角線元素大於0.5,則認為解的情況是可靠的。對於水平層來說,在射線分布較少的邊緣地帶,解析度矩陣的則數值較低,所對應的P波速度擾動可靠性就較差。

5.2.3 剖面層析反演結果

在北緯27°~41°,東經84°~101°的區間,完成了如下4條剖面上的地震層析反演(見圖5.1.1)。

(1)格爾木-日喀則地震層析(A-A')剖面

該剖面位於研究區中部,是1992~1993年期間中法合作完成的一條天然地震探測剖面。作者在計算中加入了INDEPTH-Ⅲ的資料,對以往數據進行了重新處理。

剖面(彩圖7(a))自北向南穿越了昆侖斷裂帶、金沙江縫合帶、瀾滄江斷裂、班公錯-怒江縫合帶、崩措-嘉黎斷裂及雅魯藏布江縫合帶。近地表的地震波速度擾動分布與地表地質上定義的斷裂構造有一定的對應關系,高速擾動所對應的多為造山帶,如昆侖造山帶、唐古拉山、岡底斯山;低速擾動則分布在相對平坦的第四系覆蓋較厚的高原地區,即雁石坪以北的巴顏喀拉地體。

地殼部分:柴達木盆地為低速擾動覆蓋;東昆侖地體對應著高速擾動體;金沙縫合線在80km之上產狀陡立;在巴顏喀拉地體、羌塘地體的上地殼,分布著大面積的低速擾動體;瀾滄江斷裂所對應的低速體以大約30°的角度向南傾並進入下地殼;班公錯-怒江縫合線對應的位置,為大面積高速物質覆蓋,在下地殼約50km處出現一高低速擾動的分界面;崩措-嘉黎斷裂向北傾斜;雅魯藏布江斷裂帶向北插向拉薩地塊下方,在100km深度上被上地幔的高速物質所阻擋。

同一剖面的大地電磁反演結果(彩圖7(b))與地震層析的速度結構有很好的對應關系。如向北俯沖的高速高阻的東昆侖造山帶;陡傾的金沙江斷裂帶;羌塘地體之下的低速低阻體;淺部與山體對應的高速高阻異常。兩種方法對斷裂帶的描述也表現了某種相似性,都是在斷裂帶兩側出現速度或電性的差異。

地幔部分:剖面北部昆侖造山帶向北俯沖至柴達木盆地之下;柴達木盆地在50~150km之間的殼幔部分,分布著高速擾動物質(擾動值可達6.5%);金沙縫合帶北部的巴顏喀拉地體下方100km以下地段,對應著寬度約為150km的低速體,其南部與上方的低速體相連指表層;而在雁石坪至唐古拉之間(北緯33°左右)一強高速體阻止了南部高速物質的北上,該高速體以較大角度向北進入羌塘地體之下約200km深處;在雅江縫合帶以南有一高速擾動體斷續向北插,自地殼位置一直延伸到300km深處,直至被上述位於唐古拉山下方的高速體阻擋。

(2)德慶-龍尾錯地震層析(B-B')剖面(INDEPTH—Ⅲ)

該剖面自德慶至龍尾錯,剖面全長約400km,布設了49個寬頻地震台站。

彩圖8(a)為剖面的層析結果,圖中0~100km間,剖面南部的拉薩地塊內出現了一個子單元,位置在北緯32°南側,其南部是高速擾動體,北部分布著低速擾動值;在地質上的班公錯-怒江縫合線位置上(即北緯32°附近)沒有速度變化的顯示,分布著大范圍的低速體,一直延伸至羌塘地塊;向北進入羌塘地體後,又出現了一個子單元,自北緯33°以北到唐古拉斷裂以南的高速擾動體;在唐古拉斷裂以北,則存在有一定延伸的低速物質。

100km深度之下的層析圖中,班公錯-怒江縫合線北側的高速擾動體及羌塘地體中所出現的低速擾動體非常明顯;該高速體在班公錯-怒江縫合線北側產狀陡立,而在拉薩地塊下方100~200km深度范圍近水平狀分布。

彩圖8(b)為將B-B'剖面旋轉到與A-A'平行位置的結果。地幔部分的速度分布與A-A'剖面有相似之處,兩剖面中在北緯32°~33°之間200~300km深度范圍,都存在一高速體;而南部A-A'剖面出現的斷續向北插入的高速體,在B-B'剖面上於32°以南就發生了拆離。

PKP是穿過地核幾乎垂直入射的P波,它的走時變化主要是由於岩石圈內部垂向速度變化引起的。所以,可以更直接地從另一個方面了解地下物質的分布形態。圖5.2.1的走時殘差曲線反映出兩個問題:①羌塘地體內實際到時晚於理論到時,也可以說延遲,這可以理解為與羌塘地體的Sn波缺失有關。彩圖8(a)中在該位置低速擾動的分布也證明了這一現象。班公錯-怒江縫合線位置的兩側殘差早到,說明該處物質的傳播速度較快,地下應是存在硬度相對大一些的地質體,這與彩圖8(a)中存在大面積高速擾動體的位置相對應。②地體的邊界線及古露-嘉黎斷裂及唐古拉斷裂都有不同程度的顯示。

圖5.2.1 1998/11/01,07:48:12.9和1998/09/17,16:41:20.1發生在墨西哥西海岸的兩次大於5.0級地震所記錄的PKP震相沿B-B'剖面的走時殘差

(3)若羌-茫崖地震層析(C-C')剖面

該剖面幾乎近乎東西走向,切穿了位於青藏高原北緣的阿爾金斷裂,西端進入塔里木盆地東南緣,剖面東部伸入了柴達木盆地。

在剖面的東南部,幾乎在所有深度上都被負的速度擾動所控制,顯示出地殼和地幔的速度明顯慢於高原的北緣和柴達木盆地的南部。在阿爾金斷裂的西北部,整個深度上分布著正的速度擾動,反映出地殼和地幔內的平均速度傳播較快,這種特點與塔里木盆地下方古老的、冷的岩石圈一致。在剖面中部,一條負的速度擾動帶,沿著阿爾金斷裂帶深入其下方的地殼和地幔(彩圖9)。這可能反映了岩石圈內存在的(Strike-slipshear)走滑剪切活動(G.Wittlinger,1998)。

(4)花石峽-德令哈地震層析(D-D')剖面

該剖面自北西至南東穿過柴北緣斷裂、昆侖斷裂帶。層析剖面(彩圖10)西北部在70km之上分布著大面積的低速擾動物質且對應著柴達木盆地內較厚的覆蓋層;該處在220km之上有一較強的高速擾動體出現,這與盆地內硬、冷的地幔有關。剖面中部高低速度擾動分界線十分明顯,與柴北緣斷裂相對應;斷裂面以較大角度略向南傾。剖面南東部在整個深度上都大面積地分布著微弱的高速擾動物質。這些高速擾動體所對應的地質構造位置為昆侖斷裂帶。

5.2.4 地震層析各層的速度結構分布

平面的層析反演共9層,現分別敘述各層的主要特徵:

第一、二層(35km以上):速度分布與大地構造單元有一定的對應關系。研究區北部的柴達木盆地、共和盆地為低速擾動所覆蓋;柴達木盆地北部的高速體與地表分布的酸性岩漿岩有關;阿爾金山、昆侖造山帶及巴顏喀拉地體的中部為高速擾動分布;金沙江斷裂帶在東段玉樹兩側分布大面積的低速擾動體,在研究區中部兩側為高低速擾動分界帶;可可西里地區及唐古拉山-三江斷褶帶與高速擾動體相對應;拉薩地體的東部及雅江縫合線以南為低速擾動體。在藏南日喀則西北方向出現的呈南北方向條帶狀的高低速相間排列的速度異常帶,很可能與分布在該區的南北向斷陷盆地及地塹有關。另外,幾條深大斷裂在這個深度上的反映十分清晰,其中有阿爾金斷裂、柴北緣斷裂、東昆侖斷裂、金沙縫合線、瀾滄江斷裂、雅魯藏布江斷裂等(彩圖11)。

第三層(35~60km):這一層位相當於青藏高原中、下地殼深度。阿爾金斷裂兩側高低速界面分布十分清晰;柴達木盆地的低速區在逐步縮小,其東部出現了高速擾動區;東昆侖及巴顏喀拉地體仍為高速擾動所覆蓋;金沙縫合線兩側對應著高低速擾動體;瀾滄江斷裂十分清晰;唐古拉山對應著高速擾動體;可可西里逐步為低速擾動所覆蓋;拉薩地體的東部及雅江以南出現了小范圍的高速擾動值;雅江縫合現仍很清晰;當雄—墨竹工卡一帶有條十分醒目的北西向低速擾動帶。另外在日喀則西北,雅江及班公錯-怒江縫合線之間,深部的近南北向高低速擾動成條帶狀交錯分布的現象十分明顯(彩圖12)。

第四層(60~90km):這是相當於青藏高原莫霍面深度的層位。阿爾金斷裂及金沙縫合線依然十分清晰而且位置改變不大;柴達木盆地的低速物質被來自東昆侖和巴顏喀拉地體的高速體截為東西兩部分;可可西里地區對應著低速擾動體;雅江縫合線仍很明顯,其北側有微弱的高速異常出現;在拉薩的西部,有一條東西向的低速帶橫亘在拉薩地塊的中部。30~60km處出現在當雄—墨竹工卡的北西向的低速擾動帶依然存在;日喀則以北雅江及班公錯-怒江縫合線之間,深部的南北向分帶現象仍有顯示(彩圖13)。

第五層(90~130km):這一深度相當於青藏高原的上地幔,阿爾金斷裂帶在這個深度上仍十分明顯,阿爾金山體為高速擾動體所覆蓋;柴達木盆地東西兩側分布著低速擾動體,中部與北部與高速擾動相對應;金沙江縫合線兩側的高低速擾動體分界面很清晰;唐古拉山一帶、念青唐古拉山、拉薩地體東部有大面積的高速體出現;班公錯-怒江縫合線在研究區的西部尼瑪一帶有清晰的顯示;雅魯藏布江縫合線在這層深度上仍可變化;上述橫亘在拉薩地塊中部的低速帶依然存在;日喀則以北的雅江及班公錯-怒江縫合線之間,深部的南北分帶現象出現在尼瑪—昂仁之間(彩圖14)。

第六層(130~180km):這層除了阿爾金山、柴達木盆地東部、金沙江縫合線的北部、唐古拉山、念青唐古拉山的東部、岡底斯山及可可西里地區、拉薩地體的東部被高速體覆蓋,其餘區間均為低速擾動值(彩圖15)。

第七層(180~240km):這一層為青藏高原岩石圈的底界(彩圖16)。圖中藍色調的高速擾動主宰了整個圖面。該層中,高速擾動對應的主要地質單元有:柴達木盆地、西昆侖、唐古拉山、巴顏喀拉山、岡底斯山、念青唐古拉山、喜馬拉雅山。主要的幾處低速擾動分布在:曲麻萊北西的巴顏喀拉地體、羌塘地體的東段、可可西里地區、雅魯藏布江流域的大轉彎地區。另外,在拉薩—尼瑪之間有一條較弱的低速擾動帶沿北西方向展布。

第八層(240~310km):這一層位相當於青藏高原軟流圈的深度。在這一深度上,較強的高速擾動主要分布在西昆侖、拉薩地體的東部。較強的低速體主要分布在格爾木與雁石坪之間的巴顏喀拉、羌塘地體以及可可西里地區。其餘地區均被較弱的高速或低速擾動所覆蓋。另外,第七層在拉薩—尼瑪之間出現的低速條帶,在這層仍有顯示(彩圖17)。

第九層(310~400km):較強的高速擾動體主要出現在藏南地區,即雅江大轉彎地帶的喜馬拉雅山、岡底斯山;藏北為大面積的低速體所覆蓋,青藏高原北部格爾木與雁石坪之間是速度最低點(擾動值可達-5%);其次是可可西里地區(彩圖18)。

F. 預訓練好的輸入視頻的神經網路有哪些

摘要 親~你好 1、預訓練網路是已經在數據集上訓練過的模型。這種網路通常可以在載入網路參數之後立即產生有用的結果。

G. eviews軟體的使用問題。 得到一個線性模型的回歸結果之後怎樣對殘差作圖

一元線性回歸模型的置信區間與預測
多元線性回歸模型的置信區間問題包括參數估計量的置信區間和被解釋變數預測值的置信區間兩個方面,在數理統計學中屬於區間估計問題。所謂區間估計是研究用未知參數的點估計值(從一組樣本觀測值算得的)作為近似值的精確程度和誤差范圍,是一個必須回答的重要問題。

一、參數估計量的置信區間
在前面的課程中,我們已經知道,線性回歸模型的參數估計量 是隨機變數 的函數,即: ,所以它也是隨機變數。在多次重復抽樣中,每次的樣本觀測值不可能完全相同,所以得到的點估計值也不可能相同。現在我們用參數估計量的一個點估計值近似代表參數值,那麼,二者的接近程度如何?以多大的概率達到該接近程度?這就要構造參數的一個區間,以點估計值為中心的一個區間(稱為置信區間),該區間以一定的概率(稱為置信水平)包含該參數。即回答 以何種置信水平位於 之中,以及如何求得a。
在變數的顯著性檢驗中已經知道
(2.5.1)
這就是說,如果給定置信水平 ,從t分布表中查得自由度為(n-k-1)的臨界值 ,那麼t值處在 的概率是 。表示為



於是得到:在( )的置信水平下 的置信區間是
i=0,1 (2.5.3)
在某例子中,如果給定 ,查表得

從回歸計算中得到
根據(2.5.2)計算得到 的置信區間分別為 和(0.1799,0.2401)
顯然,參數 的置信區間要小。
在實際應用中,我們當然希望置信水平越高越好,置信區間越小越好。如何才能縮小置信區間?從(2.5.3)式中不難看出:(1)增大樣本容量n。在同樣的置信水平下,n越大,從t分布表中查得自由度為(n-k-1)的臨界值 越小;同時,增大樣本容量,在一般情況下可使估計值的標准差 減小,因為式中分母的增大是肯定的,分子並不一定增大。(2)更主要的是提高模型的擬合度,以減小殘差平方和 。設想一種極端情況,如果模型完全擬合樣本觀測值,殘差平方和為0,則置信區間也為0。(3)提高樣本觀測值的分散度。在一般情況下,樣本觀測值越分散,標准差越小。置信水平與置信區間是矛盾的。置信水平越高,在其他情況不變時,臨界值 越大,置信區間越大。如果要求縮小置信區間,在其他情況不變時,就必須降低對置信水平的要求。

二、預測值的置信區間
1、 點預測
計量經濟學模型的一個重要應用是經濟預測。對於模型

如果給定樣本以外的解釋變數的觀測值 ,有

因 是前述樣本點以外的解釋變數值,所以 和 是不相關的。引用已有的OLS的估計值,可以得到被解釋變數 的點預測值:
(2.5.4)
但是,嚴格地說,這只是被解釋變數的預測值的估計值,而不是預測值。原因在於兩方面:一是模型中的參數估計量是不確定的,正如上面所說的;二是隨機項的影響。所以,我們得到的僅是預測值的一個估計值,預測值僅以某一個置信水平處於以該估計值為中心的一個區間中。於是,又是一個區間估計問題。
2、 區間預測
如果已經知道實際的預測值 ,那麼預測誤差為

顯然, 是一隨機變數,可以證明



因為 由原樣本的OLS估計值求得,而 與原樣本不相關,故有:

可以計算出來:
(2.5.5)
(2.5.6)
因 和 均服從正態分布,可利用它們的性質構造統計量,求區間預測值。利用 構造統計量為:

將 用估計值 代入上式,有

這樣,可得顯著性水平 下 的置信區間為
(2.5.7)
(2.5.7)式稱為 的均值區間預測。
同理,利用 構造統計量,有

將 用估計值 代入上式,有:

根據置信區間的原理,得顯著性水平 下 的置信區間:
(2.5.8)
上式稱為 的個值區間預測,顯然,在同樣的 下,個值區間要大於均值區間。(2.5.7)和(2.5.8)也可表述為: 的均值或個值落在置信區間內的概率為 , 即為預測區間的置信度。或者說,當給定解釋變數值 後,只能得到被解釋變數 或其均值 以 的置信水平處於某區間的結論。
經常聽到這樣的說法,「如果給定解釋變數值,根據模型就可以得到被解釋變數的預測值為……值」。這種說法是不科學的,也是計量經濟學模型無法達到的。如果一定要給出一個具體的預測值,那麼它的置信水平則為0;如果一定要回答解釋變數以100%的置信水平處在什麼區間中,那麼這個區間是∞。
在實際應用中,我們當然也希望置信水平越高越好,置信區間越小越好,以增加預測的實用意義。如何才能縮小置信區間?從(2.5.5)和(2.5.6)式中不難看出:(1)增大樣本容量n。在同樣的置信水平下,n越大,從t分布表中查得自由度為(n-k-1)的臨界值 越小;同時,增大樣本容量,在一般情況下可使 減小,因為式中分母的增大是肯定的,分子並不一定增大。(2)更主要的是提高模型的擬合優度,以減小殘差平方和 。設想一種極端情況,如果模型完全擬合樣本觀測值,殘差平方和為0,則置信區間長度也為0,預測區間就是一點。(3)提高樣本觀測值的分散度。在一般情況下,樣本觀測值越分散,作為分母的 的值越大,致使區間縮小。置信水平與置信區間是矛盾的。置信水平越高,在其他情況不變時,臨界值 越大,置信區間越大。如果要求縮小置信區間,在其他情況不變時,就必須降低對置信水平的要求。

四、一元線性回歸模型參數估計實例
為了幫助讀者理解一元線性回歸模型參數估計的原理,下面以我國國家財政文教科學衛生事業費支出模型為例,不採用計量經濟學應用軟體,用手工計算,進行模型的參數估計。
經分析得到,我國國家財政中用於文教科學衛生事業費的支出,主要由國家財政收入決定,二者之間具有線性關系。於是可以建立如下的模型:

其中, 為第t年國家文教科學衛生事業費支出額(億元), 為第t年國家財政收入額(億元), ,為隨機誤差項, 為待估計的參數。選取1991—1997年的數據為樣本,利用(2.2.6)和(2.2.7)的計算公式,分別計算參數估計值。
表2.2.1 有關數據表
年份 ED FI
1991 708 3149 -551 -2351 734 -26 -0.037
1992 793 3483 -466 -2017 804 -11 -0.014
1993 958 4349 -301 -1151 1001 -43 -0.045
1994 1278 5218 19 -282 1196 82 0.064
1995 1467 6242 208 742 1424 43 0.029
1996 1704 7408 445 1908 1685 19 0.011
1997 1904 8651 645 3151 1963 -59 -0.031
有關中間計算結果如下:

由電腦計算的參數估計值為

全部統計結果如下表。
從表中可看出,判定系數 0.99,表示以國家財政收入額來解釋國家文教科學衛生事業費支出額,在1991至1997年間,擬合度相當理想。截距項 的估計值對應的t-統計量為0.47,不能通過顯著性檢驗,即不能推翻 為0的假設;而一次系數 的估計值對應的t-統計量為20.34,不用查表即可知通過顯著性檢驗,即 顯著不為0,因果關系成立。F-統計量的值為413.58,也表示方程系數顯著不為0。

表一:Eviews計算結果

Dependent Variable: ED
Method: Least Squares
Date: 09/21/02 Time: 16:22
Sample: 1991 1997
Included observations: 7
Variable Coefficient Std. Error t-Statistic Prob.
C 30.05237 63.90691 0.470252 0.6580
FI 0.223419 0.010986 20.33659 0.0000
R-squared 0.988055 Mean dependent var 1258.857
Adjusted R-squared 0.985666 S.D. dependent var 459.8972
S.E. of regression 55.06160 Akaike info criterion 11.08974
Sum squared resid 15158.90 Schwarz criterion 11.07428
Log likelihood -36.81408 F-statistic 413.5768
Durbin-Watson stat 1.644626 Prob(F-statistic) 0.000005

表二:不含截距項的Eviews計算結果:

Dependent Variable: ED
Method: Least Squares
Date: 09/21/02 Time: 16:19
Sample: 1991 1997
Included observations: 7
Variable Coefficient Std. Error t-Statistic Prob.
FI 0.228304 0.003337 68.40877 0.0000
R-squared 0.987526 Mean dependent var 1258.857
Adjusted R-squared 0.987526 S.D. dependent var 459.8972
S.E. of regression 51.36364 Akaike info criterion 10.84730
Sum squared resid 15829.34 Schwarz criterion 10.83957
Log likelihood -36.96556 Durbin-Watson stat 1.630622

Dependent Variable: LED
Method: Least Squares
Date: 09/21/02 Time: 16:21
Sample: 1991 1997
Included observations: 7
Variable Coefficient Std. Error t-Statistic Prob.
C -1.522329 0.383141 -3.973290 0.0106
LFI 1.005563 0.044764 22.46341 0.0000
R-squared 0.990188 Mean dependent var 7.077084
Adjusted R-squared 0.988226 S.D. dependent var 0.382958
S.E. of regression 0.041554 Akaike info criterion -3.288701
Sum squared resid 0.008634 Schwarz criterion -3.304156
Log likelihood 13.51045 F-statistic 504.6048
Durbin-Watson stat 1.930000 Prob(F-statistic) 0.000003

多元線性回歸模型的參數估計實例
例2.3.1 建立中國消費模型。根據消費模型的一般形式,選擇消費總額為被解釋變數,國內生產總值和前一年的消費總額為解釋變數,變數之間關系為簡單線性關系,選取1981年至1996年統計數據為樣本觀測值。樣本觀測值列於表2.3.1中。
表2.3.1 中國消費數據表
年份 消費總額 國內生產總值 前一年消費額 年份 消費總額 國內生產總值 前一年消費額
1981 3309 4901 2976 1989 10556 16466 9360
1982 3638 5489 3309 1990 11362 1832 10556
1983 4021 6076 3638 1991 13146 21280 11362
1984 4694 7164 4021 1992 15952 25864 13146
1985 5773 8792 4694 1993 20182 34501 15952
1986 6542 10133 5773 1994 27216 47111 20182
1987 7451 11784 6542 1995 34529 59405 27216
1988 9360 14704 7451 1996 40172 68498 34529
以y代表消費總額, 代表國內生產總值, 代表前一年消費總額,應用計量經濟分析軟體包TSP6.5中普通最小二乘法估計模型,得到下列結果:
(2.3.13)
(6.83) (32.36) (5.70)

式中各項都是評價估計結果優劣的重要標准,後面將逐一介紹。這里僅討論參數估計值。兩個解釋變數前的參數估計值分別為0.4809和0.1985,都為正數,且都處於0與1之間,常數項的估計值也為正,這些參數估計值的經濟含義是合理的。隨機誤差項的方差的估計值為33739.5。

H. 神經網路預測的實測數據量需要多少

越多越好,大概二三十組為宜。望採納

閱讀全文

與殘差101有多少數據量相關的資料

熱點內容
虹口房屋交易中心在哪個地鐵口下 瀏覽:668
手機號如何設置拒絕接收信息 瀏覽:853
澳林工廠的專屬產品是什麼 瀏覽:704
資源交易需要注意什麼 瀏覽:807
論文數據來源如何標出 瀏覽:908
竹茵游交易平台帳戶凍結怎麼解凍 瀏覽:392
教師資格證信息錯誤如何修改 瀏覽:114
每次向財付通交易多扣錢怎麼回事 瀏覽:334
大連原油交易所怎麼樣 瀏覽:752
信息課程序調試怎麼寫 瀏覽:600
正常交易時間段為什麼美股要停牌 瀏覽:759
無錫職業技術學院在哪個路 瀏覽:706
東方紅航天的產品怎麼樣 瀏覽:167
核心數據在哪裡搜索 瀏覽:884
aap後台使用數據有什麼用途 瀏覽:338
丹灶哪裡有二手市場 瀏覽:471
股市暗盤怎麼交易 瀏覽:361
公牛交易麥迪會怎麼樣 瀏覽:742
手游首充號怎麼代理 瀏覽:376
微信的信息怎麼設置來電鈴聲 瀏覽:492