時間:2023-07-31 16:40:33
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇統計學參數概念,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內容能為您提供靈感和參考。
1統計學課程特色分析
首先,統計學是經濟管理類專業基礎課。其作用在于方法體系和工具性質的入門,為更專業的統計工具學習做鋪墊,這決定了教學過程中應重視統計意識和思維的傳遞…。其次,統計學是解決問題的方法性工具。教學應突出如何科學的收集整理數據,并恰當運用統計方法分析數據,解決實際經濟管理問題。最后,統計學應用多元化。可應用于諸多專業領域問題,為課堂教學提供了各專業匯聚的豐富案例,但同時亦帶來教學案例選擇的難度?;诮y計學課程的應用性、方法性,可設計三線牽引的課堂教學模式。
2三線牽引課堂教學實踐
2.1三線牽引課堂設計
三線牽引課堂指在教學過程中,由求知心理牽引,完整解決問題的應用流程牽引,理論知識體系牽引三方面作為動力推動課堂進程,更具體的思路可總結為:情景案例導入,問題驅動思考,系統設問探索,問題解決成就感的獲得,深入追問延伸后續章節學習,教學目標達成。以統計學中抽樣與參數估計的講解為例,可進行教學設計思路圖如下:
2.2三線牽引課堂組織實現
首先,情景導入。情景1:某工廠生產某一型號燈泡,想知道這種型號燈泡的平均使用壽命,需要對所有燈泡使用壽命進行測試求出平均值嗎?情景2:想知道銅陵學院一萬八千多學生平均月生活支出或者是眼睛近視率,需要對全院學生進行全面調查嗎?
其次,統計意識的引導,講述抽樣原因。面對上述情景,測量遇到了障礙,情景1是無限總體不可能實現全部測量,同時所有產品都用于實驗這也是不可取的,情景2是總體很龐大而且個體之間差異性較小,沒有必要進行全部測量;由此引出抽樣和估計的概念。
再次,連續設問形式引導:抽樣相關概念。問題一:抽取的這一部分單位叫什么呢?講授:樣本與總體概念。問題二:如何抽???有什么要求呢?講授:重復抽樣不重復抽樣及隨機原則。問題三:應抽取多少個單位呢?講授:樣本容量與樣本空間概念。問題四:進行觀測計算的數量特征叫什么呢?講授樣本估計量:樣本均值、樣本比例、樣本方差,與總體參數:總體均值、總體比例、總體方差,及總體參數確定性和樣本統計量是隨機性。
最后.持續探索抽樣概率科學性:抽樣分布。問題五:觀測的數量特征是確定的一個值還是許多個值呢?為什么?講授:樣本估計量是隨機變量。在隨機原則抽樣和樣本空間概念的基礎上進一步例證樣本均值、樣本成數、樣本方差等樣本估計量均是隨機變量。問題六:如果是一個變量,有沒有自己的分布律呢?講授:抽樣分布知識,難點部分,輔之概率論與數理統計部分知識的回顧。問題五講解的基礎上,進一步例證隨機變量所有可能的取值,每個取值對應的概率,并針對總體如果取值改變,對應樣本取值及概率會發生什么變化,總而總結出樣本均值、樣本成數服從的分布律,即為抽樣的概率分布,在此理論講解的基礎上,要求學生記住可能的分布律及對應的參數。
另外,深入追問延伸后續章節學習:抽樣誤差。問題七:如果是一個變量,用一個變化的值來估計總體的數量特征會準確嗎?講授抽樣誤差概念,并延伸由于估計量隨機性誤差也是不確定的,誤差的大小如何衡量呢,由哪些因素決定呢,留作課后思考下一節學習。
3三線牽引課堂教學創新點
二、數理統計學的主要內容與研究形式數理統計學中推斷
統計學內容被分為兩個方面內容,其中一項就是抽樣分布,在這一部分中首先需要研究抽樣分布,弄清楚抽樣分布的基本概念,也就是總體、樣本以及統計量方面的內容。并且推斷統計中常用的分布形態有t分布、F分布等,后面分布內容主要是受到正態統計影響的,這些內容都是隨著變量函數分布變化的。在抽樣分布狀態中一定要有效領會它們之間的概念,掌握各種分布曲線狀態特點,熟練概率分布表的使用;其次,就是統計估值以及假設檢驗,這一部分內容主要是數理統計學習中重難點問題。并且統計估值主要包含區間估計與點估計方面的內容。假設檢驗中包含的內容較多,就能夠將其劃分為非正態總體與正態總體方面的內容,就其劃分內容包含總體參數與概率分布方面的內容,并且這兩個總體中包含多個總體假設檢驗,概率檢驗分布也分為不同發展形勢,從這一點來看,其內容較為繁雜,不容易進行改良。但是,在現實生活環境中,一些隨機現象對應產生的隨機變量大多數都是服從正常分布狀況進行,對于一些不能夠服從正態分布的隨機變量來說,其對應大樣本也能夠依照服從正態分布狀況進行。
關鍵詞:
生物統計;教學改革
統計學可以分為數理統計和應用統計兩大范疇。生物統計學就是應用統計學中的一個重要分支,同時也是生物信息分析和超級計算機平臺上進行大數據分析的重要理論基礎。隨著國際大數據時代的到來,中國不論從政府,企業還是高等學府越來越重視統計學的相關課程。通過生物統計學課程的講授,筆者發現了一些生物統計學課程講授中一些值得探討的問題。
1高校教學安排中通常將理論課的講授和實踐操作分割開來
舉個例子來說,在高校的生物統計學課程通常是先進行基礎理論的講授,內容包括統計資料的整理,資料的描述統計,常用的概率分布,假設檢驗,方差分析,卡方檢驗,直線回歸與相關分析,以及試驗設計方法。所有的理論課程講完以后,一般情況下就過去10個教學周了。之后是安排一整周的教學實習。教學實習的安排通常是一種統計學軟件(如SAS)的操作,以SAS軟件為例,主要教授如下內容:SAS軟件的基本操作,SAS程序結構、程序的輸入、修改調試和運行,常用生物統計方法的SAS程序(描述性統計、資料的正態性檢驗、t檢驗、方差分析、直線回歸分析等)[1]。這里有幾個小問題值得高等教育的工作者去思考。首先,學生的記憶能否再10周以后對于抽象的理論知識依舊清晰。在微機課程開始的時候,所學的知識已經是幾周以前講授的內容了,在教學中,我經常發現當我提出一個指令讓學生輸入的時候,一部分學生還可以馬上跟上教師的節奏,另一部分學生在線面瞪著眼睛茫然不知所措。其次就是實踐操作的部分內容和理論課程脫節。這樣講授的后果就是不論理論課程還是實踐操作,學生學習結果都是半桶水,而生物統計學課程也成為同學們心目中的難點課程。
2涉及大量的抽象概念和公式,導致學生缺乏學習該課程的興趣
生物統計學涉及大量抽象概念,例如:總體與樣本,參數與統計量,準確性與精確性,隨機誤差與系統誤差,小概率事件實際不可能原理等[2]。生物統計學涉及大量的數學知識。雖然我院的學生在開設生物統計學課程之前已經學習了部分高等數學的知識。但對于理工口的學生而言,農科口的學生對數學的掌握和運用程度仍然有所欠缺。而這些抽象的概念和公式導致了部分學生的恐懼心理。
3統計學課程的數理屬性導致了課堂交流開放性的欠缺
和管理或文法課程不同的是,生物統計學課程中講述例題的結果是在概率論的基礎下做出的結論。比如說:當計算出的試驗參數小于或超過試驗閾值的時候,我們可以接受或否定預先建立的零假設,而否定或接受備擇假設,從而對試驗結果做出統計學上的判斷[3]。而管理學課程往往可以是多元開放的結果。比如:請用S(strengths)W(weaknesses)O(opportunities)T(threats)分析法來討論一家企業的優勢,劣勢,機會和威脅。同學在和教師的討論過程中就可以根據自身的知識,經驗和理解給出開放多元的答案。根據以上三點在生物統計學講授課程中所發現的問題。我對生物統計學課程有如下思考:1)將理論課時和實踐課時結合講授。首選的方案是在機房里講授統計學課程,2個標準學時的大課可以一堂課程講授理論課程,一堂課講授相關的微機操作。次選方案是在多媒體教室講課時,老師用自己的筆記本電腦連接連接多媒體平臺,切換理論和操作課程的講授,每節課程結束后,下次課帶學生進機房實操。2)對于數學基礎相對薄弱學科的學生,在每節課的講授之前先做一個簡單的概念回顧,將本節課程所需要運用的數學知識進行一個幾分鐘的短時間review以消除學生對數學知識的恐懼心理。3)加強和學生的課堂溝通。盡管無法做到象文科類課程那樣隨心所欲的暢所欲言,課堂交流在生物統計學課程上仍然是必要的。一般而言,我會選擇上一堂課結束前講授過的習題和同學們進行溝通交流。溫故而知新,對自己已經聽過的課程同學們進行解答和回顧往往更有信心,也能更好的活躍課堂的氣氛。
4總結
生物統計是一門農業口重要的核心課程,在生物統計的教學中,筆者發現了一些困擾現在高校教師和學生的問題,也提出一些教學改革的探討,以期提高教學效率,改善教學效果。
Anselin(1988)對空間經濟計量學進行了系統的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經濟計量學的定義是:“在區域科學模型的統計分析中,研究由空間引起的各種特性的一系列方法。”Anselin所提到的區域科學模型,指明確將區域、位置及空間交互影響綜合在模型中,并且它們的估計及確定也是基于參照地理的(即:截面的或時-空的)數據,數據可能來自于空間上的點,也可能是來自于某個區域,前者對應于經緯坐標,后者對應于區域之間的相對位置。
國外近幾年空間經濟計量學得以迅速發展,如Anselin和Florax(1995)指出的,主要得益于以下幾點:
(1)人們對于空間及空間交互影響的作用的重新認識。對空間的重新關注并不局限于經濟學,在其它社會科學中也得以反映。
(2)與地理對應的社會經濟大型數據庫的逐步實用性。在美國以及歐洲,官方統計部門提供的以區域和地區為統計單元的大型數據庫很容易得到,并且價格低廉。這些數據可以進行空前數量的截面或時空觀測分析,這時,空間(或時空)自相關可能成為標準而非一種特殊情況。
(3)地理信息系統(GIS)和空間數據分析軟件,以高效和低成本的計算技術處理空間觀測的發展。GIS的使用,允許地理數據的有效存儲、快速恢復及交互可視化,為空間分析技術的藝術化提供了巨大的機會。至少目前線性模型中,缺少針對空間數據和空間經濟計量學的軟件的情況已經大為改觀。目前已有一些專門的空間統計分析軟件,并且SAS、S-PLUS等著名統計軟件中,都已經包括用于空間統計分析的模塊。
(二)空間經濟計量學與相關學科的關系
空間統計學是研究空間問題的另一門學科,它是應用數學的一個快速發展的分支。它起源于20世紀50年代早期,用以幫助采礦業進行礦藏量的計算。最早的工作是采礦工程師D.G.Krige和統計學家H.S.Sichel在南非進行的。70年代隨著計算機的普及以及運算速度的大幅提高,空間統計分析技術逐漸擴展到地球科學的其它領域。目前已經普遍存在于需要處理時間上或空間上相關的數據的科技領域中。
空間經濟計量學與空間統計學的區分不太容易。Haining和Anselin的觀點認為空間統計學的研究大多由數據驅動,而空間經濟計量學由模型驅動,即從特定的理論或模型出發,重點放在問題的估計、解釋和檢驗上。空間統計學的主流是研究生態學和地質學中的物質現象,空間經濟計量學主要研究與區域及城市經濟有關的模型。有一種觀點認為二者的區分應基于作者將其工作對應于空間經濟計量學還是空間統計學,這種區分辦法可能較為簡單。
地質統計學(Geostatistics)發展于20世紀60年代,主要用于研究地質學現象的空間結構和進行空間估值。例如,在探礦過程中,通常是在空間上布點進行鉆探,然后對采樣得到的樣品進行分析,估計礦藏的分布和儲量。由于礦藏不開采的話,在時間上結構幾乎是不變的,因此地質統計學研究的問題主要是空間相關??臻g經濟計量學所研究的問題不僅存在空間相關,往往所研究的問題在時間上也存在相關。
在區域經濟學的理論中,人們建立了各種理論以及關系式來描述人類在空間上的行為,如研究城鎮問題的“引力模型”等。但在利用模型進行定量研究問題的時候,需要將理論或關系式用數學模型來進行刻劃,利用統計方法對模型進行估計、檢驗,并進行評價,這些正好是屬于經濟計量學研究的范疇。應該說,空間經濟計量學主要研究區域經濟問題,依據的是區域經濟學理論,但它還需要綜合數學,以及空間統計學等學科,因此它不等同于區域經濟學,而是一門交叉學科。
二、研究的問題
空間經濟計量學主要研究存在空間效應的問題。空間效應主要包括空間相關和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。
(一)空間相關
空間相關指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關,即
附圖
存在空間相關的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調查過程中,數據的采集與空間中的單位有關,如數據是按省、市、縣等統計的,但設定的空間單位與研究問題不一致,存在測量誤差。
空間相關不僅意味著空間上的觀測缺乏獨立性,并且意味著潛在于這種空間相關中的空間結構,也就是說空間相關的強度及模式由絕對位置和相對位置(布局,距離)決定。
對于空間相關,空間自回歸通常是其核心內容,空間自回歸模型的一般形式為:
附圖
在這個模型中,β解釋變量X(n×k矩陣)的參數向量(k×1),ρ是空間滯后相關變量的參數,λ是殘差空間自回歸(空間AR)結構中的參數。
W[,1]和W[,2]為n×n矩陣,是標準化或未標準化的空間加權矩陣,分別對應于因變量以及擾動項中的空間自回歸過程,這兩個矩陣可以不同,這意味著兩個過程由不同的空間結構生成。
這個模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。
對這個模型,普通最小二乘估計不僅是有偏的,而且是不一致的,參數的估計通常采用極大似然估計,近幾年,有學者嘗試采用貝葉斯估計對參數進行估計。
(二)空間差異性
空間差異性指空間上的區域缺乏均一性,如存在中心區和郊區、先進和后進地區等。例如,我國沿海地區和中西部地區經濟存在較大差別。
對于空間差異性,只要將空間單元的特性考慮進去,大多可以用經典經濟計量學方法解決。但當空間差異性與空間相關共同存在時,經典經濟計量學方法不再適用,而且這時問題可能變得非常復雜,因為這時要區分空間差異性與空間相關可能非常困難。
研究空間差異性的模型主要有:
E.Casetti提出的空間擴展模型(1972)和回歸參數漂移分析方法(簡稱DARP)模型(1982)。這時,空間差異性表現為模型參數隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴展參數)。
y=Xβ+ε
附圖
模型(3)為以經緯坐標(Z[,x],Z[,y])作為擴展參數的空間擴展模型。同樣可以以到中心區域的距離作為擴展參數設計模型。
將模型(3)的第二個式子右邊加入隨機擾動項,則為DARP模型。E.Casetti(1992)進一步提出了貝葉斯空間擴展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加權回歸模型(簡稱GWR模型)。
附圖
(三)時空數據空間模型
在模型中考慮時間維增加了描述的復雜性,但綜合時間空間的模型在實際工作中非常有用。在經典的經濟計量學模型中,這是綜合截面和時間序列數據的情形。如果數據不存在空間相關,則可以采用PanelData模型。Anselin(1988)將似不相關(SUR)模型擴展到空間的情形,提出空間SUR模型。
三、應用前景及需要進一步研究的問題
(一)在中國的應用前景
在我國,地質統計學是較早應用空間統計學的領域,在20世紀80年代中國科學院就有人研究并應用Krige模型。空間統計學除了在地質學的研究中發揮作用,近十年來,周國法、徐汝梅等學者研究生態學中的空間相互作用,并于1998年出版了《生物地理統計學》。20世紀80年代以來,我國利用衛星遙感技術,對土地、森林、農業、礦產、能源、作物估產、災患檢測等進行應用,開始了我國空間統計學在經濟領域應用中統計調查的工作,為了將空間遙感調查技術逐步納入到我國統計的常規性工作中,1998年10月,國家統計局成立了空間統計研究室,并與中國科學院地理所合作,組成了“空間信息多重采樣設計的空間統計學應用研究”課題組,運用遙感技術和空間分析對我國農業耕地、森林、草地等資源以及城鎮動態變化進行調查,該項目獲得國家統計局2000年課題研究一等獎。
在我國地質統計學、生物地理統計學及利用遙感技術進行的各種調查,都屬于空間統計學的范疇。地質統計學、生物地理統計學主要研究空間相關及空間估值,在生物地理統計學的研究中還包括物種的空間擴散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型??臻g動態采樣的研究,與地質礦產調查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計算等問題的研究,根據其研究的問題和方法,也可以將其歸入統計學的抽樣調查分支之中。
隨著我國按地區進行統計的統計基礎資料不斷積累,尤其是遙感技術應用到統計調查中來,都將使得按時間和空間排列的數據資料極為豐富,對數據進行空間甚至時空分析成為可能,人們將逐漸從時間的角度轉向普遍從時空的角度來考慮問題。
從經濟分析的角度看,空間經濟計量學在我國以下幾個方面將有很大的應用前景。
由于區域之間存在相關性,或者存在差異性,因此一項政策對每個區域的影響是不同的,通過運用空間經濟計量學方法對各區域進行研究之后,找到政策在各區域上作用的關系,對于政府決策、正確制訂政策具有很大的參考價值。
由于區域之間存在先進地區和后進地區,通過空間經濟計量學方法可以對先進地區與后進地區之間的相互關系進行研究。
按區域編制投入產出表時,空間的概念將發揮作用。
對房地產的價值進行評估時,在考慮外界影響因素的基礎上,充分考慮地區之間的相互關系,將對正確評估房地產的價值有很大幫助。
對環境污染進行研究時,運用空間經濟計量學方法對污染的傳播方式進行研究,有助于人們對環境污染進行控制。
在交通領域的研究,可以利用空間經濟計量學方法對人員、貨物在空間上的流動方式進行研究,同時對通道上的不同區段進行研究。
在對某種疾病(如流感)在空間上的傳播過程進行研究之后,對于疾病的預防控制將有很大的幫助。
建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關性。而空間抽樣在空間上的布點方式也可以用作商業網點的布局研究。
總之,只要問題涉及到空間的概念,空間經濟計量學就將發揮其作用。對空間經濟計量學的深入研究及應用,將促使人們面對問題的時候,從空間或時空的角度思考問題。
(二)需要進一步研究的問題
目前的研究中,系統內的空間單元受到系統內其它位置單元的影響,但邊界處的單元還受到系統外與之相鄰的單元的影響,如何將這個影響考慮在模型中值得研究。
在具體問題中,距離的概念需要加以認真對待,單用地理上的距離有時并不合適,例如國與國之間的經濟聯系在今天并不是距離遠近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時,如何將貿易、人員、資金的流動充分考慮到空間加權矩陣中去,尚值得研究。
貝葉斯方法在統計學各個分支的應用越來越廣,空間貝葉斯模型也是目前空間經濟計量學研究的熱點之一。
可變單元的問題。當數據匯總的級別變化,可能整個模型的描述都發生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個統一的模式對系統進行描述尚待進一步研究。
時空數據的綜合分析,參數估計的漸近性質,模型的各種檢驗方法等,還有待進一步的研究。
經濟問題中,許多需要研究的對象是多維的,即研究對象是一個向量,如何在空間問題中建立一系列空間VAR模型,尚需研究。
不易獲得較為詳細且價格低廉的區域統計數據,將大大限制空間經濟計量學模型的應用。建立我國區域統計數據庫,要求價格低廉且方便實用,是擺在統計工作者面前的一個重要課題。
【參考文獻】
1Anselin,L.1988.SpatialEconometrics.MethodsandModels,DordrechtKluwerAcademic
Publishers.
2Anselin,L.andR.J.G.M.Floraxed.1995.NewDirectionsinSpatialEconometrics,Springer-Verlag.
3Brundson,C.,A.S.Fotheringham,andM.E.Chalton.1996."GeographicallyWeighted
Regression:AMethodforExploringSpatialNonstationarity,"GeographicalAnalysis,
Vol.28,p281-298.
4Brunsdon,C.,A.S.Fotheringham,andM.E.Chalton.1999."SomeNotesonParametric
SignificanceTestsforGeographicallyWeightedRegression,"JournalofRegional
Science,Vol.39,No.3,p497-524.
5Casetti,E.1972."GeneratingModelsbyExpansionMethod:ApplicationstoGeographic
Research,"GeographicalAnalysis,Vol.4,p81-91.
6Casetti,E.1982."DriftAnalysisofRegressionParameters:AnApplicationtothe
InvestigationofFertilityofFertilityDevelopmentRelations,"ModelingandSimulation
13,p961-966.
7Casetti,E.1992."BayesianRegressionandtheExpansionMetod,"Geographical
Analysis,Vol.24,p58-74.
8Cliff,A.D.andJ.K.Ord.1981.SpatialProcesses:ModelsandApplications,Pion.
9Haining,R.P.SpatialDataAnalysisintheSocialandEnvironmentalScience,Cambridge
UniversityPress.1990.
10Paelinck,JeanH.P.andLeoH.Klaassen.1979.SpatialEconometrics,SaxonHouse,
TeakfieldLtd.
Anselin(1988)對空間經濟計量學進行了系統的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經濟計量學的定義是:“在區域科學模型的統計分析中,研究由空間引起的各種特性的一系列方法。”Anselin所提到的區域科學模型,指明確將區域、位置及空間交互影響綜合在模型中,并且它們的估計及確定也是基于參照地理的(即:截面的或時-空的)數據,數據可能來自于空間上的點,也可能是來自于某個區域,前者對應于經緯坐標,后者對應于區域之間的相對位置。
國外近幾年空間經濟計量學得以迅速發展,如Anselin和Florax(1995)指出的,主要得益于以下幾點:
(1)人們對于空間及空間交互影響的作用的重新認識。對空間的重新關注并不局限于經濟學,在其它社會科學中也得以反映。
(2)與地理對應的社會經濟大型數據庫的逐步實用性。在美國以及歐洲,官方統計部門提供的以區域和地區為統計單元的大型數據庫很容易得到,并且價格低廉。這些數據可以進行空前數量的截面或時空觀測分析,這時,空間(或時空)自相關可能成為標準而非一種特殊情況。
(3)地理信息系統(GIS)和空間數據分析軟件,以高效和低成本的計算技術處理空間觀測的發展。GIS的使用,允許地理數據的有效存儲、快速恢復及交互可視化,為空間分析技術的藝術化提供了巨大的機會。至少目前線性模型中,缺少針對空間數據和空間經濟計量學的軟件的情況已經大為改觀。目前已有一些專門的空間統計分析軟件,并且SAS、S-PLUS等著名統計軟件中,都已經包括用于空間統計分析的模塊。
(二)空間經濟計量學與相關學科的關系
空間統計學是研究空間問題的另一門學科,它是應用數學的一個快速發展的分支。它起源于20世紀50年代早期,用以幫助采礦業進行礦藏量的計算。最早的工作是采礦工程師D.G.Krige和統計學家H.S.Sichel在南非進行的。70年代隨著計算機的普及以及運算速度的大幅提高,空間統計分析技術逐漸擴展到地球科學的其它領域。目前已經普遍存在于需要處理時間上或空間上相關的數據的科技領域中。
空間經濟計量學與空間統計學的區分不太容易。Haining和Anselin的觀點認為空間統計學的研究大多由數據驅動,而空間經濟計量學由模型驅動,即從特定的理論或模型出發,重點放在問題的估計、解釋和檢驗上。空間統計學的主流是研究生態學和地質學中的物質現象,空間經濟計量學主要研究與區域及城市經濟有關的模型。有一種觀點認為二者的區分應基于作者將其工作對應于空間經濟計量學還是空間統計學,這種區分辦法可能較為簡單。
地質統計學(Geostatistics)發展于20世紀60年代,主要用于研究地質學現象的空間結構和進行空間估值。例如,在探礦過程中,通常是在空間上布點進行鉆探,然后對采樣得到的樣品進行分析,估計礦藏的分布和儲量。由于礦藏不開采的話,在時間上結構幾乎是不變的,因此地質統計學研究的問題主要是空間相關。空間經濟計量學所研究的問題不僅存在空間相關,往往所研究的問題在時間上也存在相關。
在區域經濟學的理論中,人們建立了各種理論以及關系式來描述人類在空間上的行為,如研究城鎮問題的“引力模型”等。但在利用模型進行定量研究問題的時候,需要將理論或關系式用數學模型來進行刻劃,利用統計方法對模型進行估計、檢驗,并進行評價,這些正好是屬于經濟計量學研究的范疇。應該說,空間經濟計量學主要研究區域經濟問題,依據的是區域經濟學理論,但它還需要綜合數學,以及空間統計學等學科,因此它不等同于區域經濟學,而是一門交叉學科。
二、研究的問題
空間經濟計量學主要研究存在空間效應的問題??臻g效應主要包括空間相關和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。
(一)空間相關
空間相關指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關,即
附圖
存在空間相關的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調查過程中,數據的采集與空間中的單位有關,如數據是按省、市、縣等統計的,但設定的空間單位與研究問題不一致,存在測量誤差。
空間相關不僅意味著空間上的觀測缺乏獨立性,并且意味著潛在于這種空間相關中的空間結構,也就是說空間相關的強度及模式由絕對位置和相對位置(布局,距離)決定。
對于空間相關,空間自回歸通常是其核心內容,空間自回歸模型的一般形式為:
附圖
在這個模型中,β解釋變量X(n×k矩陣)的參數向量(k×1),ρ是空間滯后相關變量的參數,λ是殘差空間自回歸(空間AR)結構中的參數。
W[,1]和W[,2]為n×n矩陣,是標準化或未標準化的空間加權矩陣,分別對應于因變量以及擾動項中的空間自回歸過程,這兩個矩陣可以不同,這意味著兩個過程由不同的空間結構生成。
這個模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。
對這個模型,普通最小二乘估計不僅是有偏的,而且是不一致的,參數的估計通常采用極大似然估計,近幾年,有學者嘗試采用貝葉斯估計對參數進行估計。
(二)空間差異性
空間差異性指空間上的區域缺乏均一性,如存在中心區和郊區、先進和后進地區等。例如,我國沿海地區和中西部地區經濟存在較大差別。
對于空間差異性,只要將空間單元的特性考慮進去,大多可以用經典經濟計量學方法解決。但當空間差異性與空間相關共同存在時,經典經濟計量學方法不再適用,而且這時問題可能變得非常復雜,因為這時要區分空間差異性與空間相關可能非常困難。
研究空間差異性的模型主要有:
E.Casetti提出的空間擴展模型(1972)和回歸參數漂移分析方法(簡稱DARP)模型(1982)。這時,空間差異性表現為模型參數隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴展參數)。
y=Xβ+ε
附圖
模型(3)為以經緯坐標(Z[,x],Z[,y])作為擴展參數的空間擴展模型。同樣可以以到中心區域的距離作為擴展參數設計模型。
將模型(3)的第二個式子右邊加入隨機擾動項,則為DARP模型。E.Casetti(1992)進一步提出了貝葉斯空間擴展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加權回歸模型(簡稱GWR模型)。
附圖
(三)時空數據空間模型
在模型中考慮時間維增加了描述的復雜性,但綜合時間空間的模型在實際工作中非常有用。在經典的經濟計量學模型中,這是綜合截面和時間序列數據的情形。如果數據不存在空間相關,則可以采用PanelData模型。Anselin(1988)將似不相關(SUR)模型擴展到空間的情形,提出空間SUR模型。
三、應用前景及需要進一步研究的問題
(一)在中國的應用前景
在我國,地質統計學是較早應用空間統計學的領域,在20世紀80年代中國科學院就有人研究并應用Krige模型??臻g統計學除了在地質學的研究中發揮作用,近十年來,周國法、徐汝梅等學者研究生態學中的空間相互作用,并于1998年出版了《生物地理統計學》。20世紀80年代以來,我國利用衛星遙感技術,對土地、森林、農業、礦產、能源、作物估產、災患檢測等進行應用,開始了我國空間統計學在經濟領域應用中統計調查的工作,為了將空間遙感調查技術逐步納入到我國統計的常規性工作中,1998年10月,國家統計局成立了空間統計研究室,并與中國科學院地理所合作,組成了“空間信息多重采樣設計的空間統計學應用研究”課題組,運用遙感技術和空間分析對我國農業耕地、森林、草地等資源以及城鎮動態變化進行調查,該項目獲得國家統計局2000年課題研究一等獎。
在我國地質統計學、生物地理統計學及利用遙感技術進行的各種調查,都屬于空間統計學的范疇。地質統計學、生物地理統計學主要研究空間相關及空間估值,在生物地理統計學的研究中還包括物種的空間擴散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型。空間動態采樣的研究,與地質礦產調查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計算等問題的研究,根據其研究的問題和方法,也可以將其歸入統計學的抽樣調查分支之中。
隨著我國按地區進行統計的統計基礎資料不斷積累,尤其是遙感技術應用到統計調查中來,都將使得按時間和空間排列的數據資料極為豐富,對數據進行空間甚至時空分析成為可能,人們將逐漸從時間的角度轉向普遍從時空的角度來考慮問題。
從經濟分析的角度看,空間經濟計量學在我國以下幾個方面將有很大的應用前景。
由于區域之間存在相關性,或者存在差異性,因此一項政策對每個區域的影響是不同的,通過運用空間經濟計量學方法對各區域進行研究之后,找到政策在各區域上作用的關系,對于政府決策、正確制訂政策具有很大的參考價值。
由于區域之間存在先進地區和后進地區,通過空間經濟計量學方法可以對先進地區與后進地區之間的相互關系進行研究。
按區域編制投入產出表時,空間的概念將發揮作用。
對房地產的價值進行評估時,在考慮外界影響因素的基礎上,充分考慮地區之間的相互關系,將對正確評估房地產的價值有很大幫助。
對環境污染進行研究時,運用空間經濟計量學方法對污染的傳播方式進行研究,有助于人們對環境污染進行控制。
在交通領域的研究,可以利用空間經濟計量學方法對人員、貨物在空間上的流動方式進行研究,同時對通道上的不同區段進行研究。
在對某種疾病(如流感)在空間上的傳播過程進行研究之后,對于疾病的預防控制將有很大的幫助。
建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關性。而空間抽樣在空間上的布點方式也可以用作商業網點的布局研究。
總之,只要問題涉及到空間的概念,空間經濟計量學就將發揮其作用。對空間經濟計量學的深入研究及應用,將促使人們面對問題的時候,從空間或時空的角度思考問題。
(二)需要進一步研究的問題
目前的研究中,系統內的空間單元受到系統內其它位置單元的影響,但邊界處的單元還受到系統外與之相鄰的單元的影響,如何將這個影響考慮在模型中值得研究。
在具體問題中,距離的概念需要加以認真對待,單用地理上的距離有時并不合適,例如國與國之間的經濟聯系在今天并不是距離遠近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時,如何將貿易、人員、資金的流動充分考慮到空間加權矩陣中去,尚值得研究。
貝葉斯方法在統計學各個分支的應用越來越廣,空間貝葉斯模型也是目前空間經濟計量學研究的熱點之一。
可變單元的問題。當數據匯總的級別變化,可能整個模型的描述都發生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個統一的模式對系統進行描述尚待進一步研究。
二、目前統計學教材存在的主要問題
目前市面上國內編著的經濟、管理類的統計學教材數量繁多,其名字也五花八門,如:《統計學原理》《統計學基礎》《統計學》《經濟統計學》《管理統計學》等。據我調查,目前武漢市書店在售的這類圖書不下三十種。雖然數目眾多,但翻開一看,就會發現這些書的內容大同小異,和國外的統計學教材相比,對學生的吸引力不強。經過綜合,我認為國內的統計學教材主要存在以下問題。
(一)內容陳舊。如今的經濟、管理類統計學教材由以前的只介紹描述統計變成既有描述又有推斷統計的大統計學??墒欠_現有的統計學教材,就會發現不少已經過時的描述統計學的概念比比皆是,學生平時在生活、學習中幾乎用不上。如不少教材里的第一章緒論部分重點介紹“標志”和“指標”這對概念,花很大篇幅來介紹兩者的聯系和區別,但這對概念在后續的數據分析中幾乎用不到;在“后續統計調查”這章中,對統計報表、重點調查和典型調查這些方法也是花了不少篇幅來介紹,而這些在計劃經濟條件下使用的調查方法現在很少采用;另外,目前不少教材保留了“指數”一章,詳細介紹了編制指數的兩種方法,而這些內容由于內容繁雜,應用面窄,除了專門的統計調查人員,一般人根本沒有必要掌握,只需要了解其基本含義。由此可見,目前國內統計學教材內容陳舊,教材中對廣大讀者用處不大的資源占用了大量的篇幅,而一些實用性很強的內容,如參數估計、假設檢驗及多元回歸則放在教材后面簡單介紹,由于學時有限,很多老師在課堂上只是簡單地提一下,其結果是學生用這樣的教材根本學不到有用的知識。
(二)概念、公式多,案例少。目前很多學生并不需要學量系統的統計學知識,而只需要能用簡單、實用的統計學方法來辨別、處理出現的定量分析問題,并且能夠利用統計學軟件自己解決一部分,當自己不能解決時知道到哪里尋求幫助就行了。因此統計學教材的主要任務是教會他們統計學的主要思想,學會用統計分析方法解決實際問題。基于這種目的,統計學教材應偏重實際應用,多引入生活中常見的實例或案例,不知不覺地把讀者引入統計學專業知識的殿堂。但是目前的統計學教材一般都是先介紹理論、概念,再給出公式及其推導過程,最后才結合實踐進行舉例,而且大量繁瑣的數學推導占了很大的篇幅,而經濟、管理類專業的學生大多數是文科生,數學底子差,大量的公式推導往往讓他們望而卻步。而與大量公式相對應,國內現有的經濟、管理類的統計學教材有關經濟、管理的統計案例很少,大部分是過于簡單的設例,或是“編寫”的案例,甚至是若干年以前在自然科學領域內應用的陳舊的案例,與現實的經濟、管理工作嚴重脫節。國內統計學教材這種重理論學習和公式推導,輕結合實際案例的特點,使得本該妙趣橫生的統計學在學生眼里課程變得晦澀難懂、枯燥乏味。
(三)實用性不強。統計學作為一門實用性很強的方法論學科,是和計算機以及統計軟件緊緊地聯系在一起,任何統計學方法都可以在統計學軟件上操作完成,目前常用的統計學軟件有SAS、STATISTIC、MINITAB、SPSS和EXCEL,對于經濟管理專業的學生來說,SPSS和EXCEL都是操作起來相當簡單方便的統計學軟件。目前國內的統計學教材只是介紹統計學原理和方法,而如何應用統計軟件來解決具體問題則沒有系統的介紹,如Ex-cel制作圖、表的功能很強大,展示數據常用的直方圖、條形圖、餅圖、環形圖利用Excel都可以做得很漂亮,可是不少教材只是介紹什么是直方圖和條形圖,兩者有何區別,而具體如何利用軟件作圖則只字未提;時間數列分析、多元回歸分析等內容涉及的數據都很多,不借助統計軟件根本沒法完成,因此很多教材也只是介紹概念和方法,老師在課上也只簡單介紹方法,不給學生講授如何應用統計軟件來解決具體問題,這使得學生學完這門課后實際分析問題的能力沒有得到鍛煉,學生在學習后續課程或撰寫畢業論文時,抱怨統計學只是學了很多不會用,也不知怎么用的概念和公式。
三、對策分析
統計學教材的質量普遍不高,反映了當前我國定量分析問題的能力還有待提高。要解決這一問題,我覺得重點應從以下幾方面著手。
(一)加大對從事統計學教學的教師的培訓力度。統計學教材是統計學教師教學實踐的結晶。目前國內統計學教材質量不高的根本原因在于從事統計學教學教師的統計學能力有所欠缺。從事經濟、管理類統計學教學的教師不僅要熟練地掌握統計學方法和統計軟件的使用技巧,還要對經濟、管理有一定的了解,并了解統計學在經濟、管理中的使用。可是據我對武漢市高校的調查統計,不少學校從事經濟、管理統計學教學的教師都是學習經濟、管理的,他們對統計學方法和統計軟件的使用并不熟悉,因此編出來的教材其質量也是可想而知。雖然一部分老師是統計學專業畢業的,但絕大多數是學經濟統計的,對推斷統計和統計軟件的使用并不精通。另外還有一小部分老師是學數理統計專業的,他們對統計學方法進行過系統的學習,可是由于對于經濟、管理了解甚少,因此沒法和經濟、管理的實際案例相結合,而只是像講數學一樣,著重公式的推導。因此要改變這種狀況,各校首先要加大對統計學重要性的認識,其次要拿出切實可行的方案來對從事統計學教學的教師進行全方位的培訓,使得他們具備從事統計學教學的專業水平,這樣才有可能從根本上改變統計學教材吸引不了學生的現狀。
(二)借鑒國外優秀統計學教材的經驗。和國內經濟、管理類統計學教材內容陳舊、案例匱乏、實用性不強和趣味性差的現狀相比,國外的統計學教材則讓人眼前一亮。國外教材非常注重實際應用,每一部分都引入大量的生活中常見的實例或案例,不知不覺地把讀者引入統計專業知識的殿堂。這些教材幾乎都摒棄了繁瑣的數學推導,大部分只介紹基本公式,少數則采用純文字描述的形式來介紹統計學,讓沒有統計學基礎的學生也能輕松地學習統計學而且它們都非常詳細地介紹了如何利用統計軟件來進行操作,并貫穿在各章,課后也有大量配套的習題讓讀者自己去練習,以加深對統計學方法的理解。因此要提高目前國內統計學教材的質量,多多向國外同行學習是非常必要的,不少學校的老師直接以國外的教材作為學生的學習教材。但是完全采用國外的教材也有不少問題,如直接采用國外原版教材,對多數學生來說英文水平有待提高,而如果采用翻譯過來的教材,由于目前不少教材翻譯質量不高,學生讀起來感覺很生澀;另外國外的教材結合的都是本國的例子,和我國的具體國情不符,學生聽起來覺得陌生。因此最好的方法是借鑒國外統計學教材好的體系和編排方法,同時結合本國的具體實踐,編制適合我國國慶的教材,這就需要付出更多的努力。
結果:兩種劑量的檢測方法均檢查出21枚結節,低劑量掃描檢測鈣化、空洞、毛刺征、分葉征、支氣管征和胸膜粘連征等肺結節形態學的結果與常規劑量比較,差異無統計學意義(P>0.05);常規劑量掃描測量肺結節直徑為(2.56±0.88)cm,低劑量掃描測量肺結節直徑為(2.57±0.89)cm,兩者比較差異無統計學意義(P>0.05)。
結論:CT低劑量胸部掃描與常規掃描的價值等同,且低劑量CT掃描對患者的輻射危害性小,可見低劑量CT用于肺結節的診斷是可行的,可以應用于篩查早起肺癌的推廣應用。
關鍵詞:低劑量多層螺旋CT 孤立小結節診斷 探討
Doi:10.3969/j.issn.1671-8801.2014.03.206
【中圖分類號】R4 【文獻標識碼】B 【文章編號】1671-8801(2014)03-0144-01
肺癌是當今世界上發病率最高的惡性腫瘤。在CT(Computed Tomography)技術日益普及的今天,CT掃描是肺癌檢測的最重要的手段[1]。但是由于受到CT輻射劑量的限制,開展的并不廣泛。自1990年Naidich等[2]提出胸部低劑量螺旋CT的概念,并在臨床應用,低劑量螺旋CT掃描越來越受到廣泛關注。肺結節是肺癌在CT圖像中最為常見的表現形式[3],通常是指肺實質內直徑不超過3cm的圓形或類圓形病灶,在影像中表現為類圓形的致密區域,然而孤立性肺結節(solitary pulmonary nodule,SPN)可見于不同性質的病變,其定性診斷對臨床治療和預后十分重要。
本文對本院2012年5月~2013年2月行常規劑量CT掃描發現的21例肺結節病患者行低劑量CT掃描,對比其影像學資料進行回顧性分析現總結報道如下:
1 資料與方法
選擇我院2012年12月~2013年2月行常規劑量CT掃描發現的10例肺結節病患者行低劑量CT(30mA)掃描,共有結節21枚其中男7例女3例,年齡最大72歲最小為45歲平均60.8歲。
向所有患者告知X射線對人體的輻射作用,所有志愿者表示理解與支持,并均簽有知情同意書。所有病例均采用ToSHBIAAquilino128層螺旋TC掃描機進行全肺屏氣掃描,掃描范圍自肺尖至肺底。掃描參數:200mAs,120KV,FOV:320mm,層厚:5mm,重建參數:FC10。并對于同一結節,間隔1分鐘追加一次低劑量CT掃描,掃描條件除管電流其它完全一致的掃描序列。患者采用30mAs進行數據重建。
利用Vital2三維工作站所帶結節體積測量自動分析軟件,自動測量常規掃描參數下結節體積及低劑量掃描參數下結節體積,并記錄相關信息:結節的大小,征象等。應用統計學方法采用SPSS16.0統計學軟件進行數據分析計量資料數據用均數,準差表示,兩組間比較采用T檢驗,計數資料用率表示,組間比較采用X2檢驗,以P>0.05為差異有統計學意義。
2 結果
10例患者,兩種CT劑量檢測結果均檢測出21枚結節,不同劑量影像所見圖1,圖2。常規劑量及低劑量下結節形態改變見表1。
統計學分析,不同劑量掃描肺結節形態及影像學特征比較,差異無統計學意義(P>0.05)。不同劑量測量肺結節大小,常規劑量(直徑):2.56±0.88cm;低劑量:2.57±0.89cm,兩者比較,差異無統計學意義(P>0.05)。
3 討論
自1990年Naidich等首次提出了低劑量CT的概念,即在其他參數不變的情況下,降低管電流。因為放射線劑量與管電流成線性關系,因此劑量也相應下降。國外對低劑量普通螺旋CT的研究較多,有關低劑量CT肺部掃描技術可用于臨床診斷的最小管電流,目前意見還尚不統一。本研究通過對本院2012年12月~2013年2月行常規劑量CT掃描發現的21例肺結節病患者行低劑量CT掃描,通過三維軟件測量結節體積,對比其形態,大小及影像學征象的一致性,兩種劑量檢測方法均檢查出結節21枚,低劑量掃描檢測鈣化、空洞、毛刺征、分葉征和胸膜粘連征等肺結節形態學的結果與常規劑量比較差異無統計學意義(P>0.05)。不同劑量測量肺結節大小,常規劑量(直徑):2.56±0.88cm;低劑量:2.57±0.89cm,兩者比較,差異無統計學意義(P>0.05)。
由此可見(30mA)低劑量CT掃描與常規劑量(200mA)CT掃描的檢測價值相同。并且低劑量CT掃描輻射劑量小,更適用于篩查及隨診,可以推廣應用。
參考文獻
目前,在最大限度地挖潛老油氣田和高效開發新區油氣藏的過程中面臨著一個重要的挑戰,就是如何將地震數據有機地加入儲層地質模型之中,充分利用地震資料與井資料分別在平面和縱向上具有高密度采樣的特點,發揮地質統計學對多學科專業知識的綜合能力,使得儲層地質模型在地震資料的約束作用下, 儲層特性不僅在井周圍縱向上具有高分辨率,保持測井和巖心測量的儲層變化特征。同時又能反映出在地震數據中觀測到的大尺度結構和儲層連續性,在平面上也具有較高精度的展布,實現高精度儲層地質建模。傳統的地質統計學是以變異函數為工具,研究在空間上具有隨機性、結構性的自然現象的學科。然而,變異函數只能反映空間中兩點之間的相關性,不能充分描述出復雜幾何形狀的砂體,如河道砂在空間中的連續性和變異性。而多點地質統計學著重表達多點之間的相關性,彌補基于變異函數的地質統計學方法的不足,是目前國際前沿研究方向。
一、訓練圖像
多點統計方法都需要借助于“訓練圖像”,它是多點地質統計的輸入參數,其準確性是建模成功的關鍵。訓練圖像就是能夠表述實際儲層結構、幾何形態及其分布模式的數字化圖像。對于沉積相建模而言, 訓練圖像相當于定量的相模式,反映微相的定量分布模式。它不必忠實于實際儲層內的井信息,而只要求反映儲層變化的空間結構性, 是一種先驗的地質概念。其作用相當于兩點統計學中的變異函數。
由于儲層具有不同尺度的非均質性,可以產生不同分辨率的訓練圖像。針對研究變量的類型(離散或連續)也可以對訓練圖像進行分類,例如沉積相是離散型的,而物性參數,如孔隙度,滲透率或其它的巖石物性是連續型的。在實際應用中,訓練圖像必須是三維的,這樣才可以全面反映出沉積在橫向上的遷移和垂向上的加積模式。針對研究區的特點,訓練圖像可以通過以下四種方法來繪制:①砂體等厚圖方法;②地質認識方法;③人工劃相方法;④示性點過程方法。
二、二維和三維訓練圖像
二維訓練圖像就是在縱向上沒有變化,比如人工劃相圖,因此二維訓練圖像又稱為偽三維訓練圖像。二維訓練圖像在縱向上不能反映河道微相的加積,在橫向上也不能反映各沉積微相的遷移。因此二維訓練圖像比不能很好的反映沉積構型。在三維訓練圖像中,可以反映各微相在橫向上的遷移和垂向的加積,能夠很好的反映沉積體的空間結構。因此在實際應用中多使用三維訓練圖像。
三、結論
多點地質統計學的發展迄今已有20多年的研究歷史,而真正作為一種可實用的隨機建模方法則是在Strebelle提出了搜索樹的概念及SNESIM算法之后 迄今為止,還出現了SIMPAT方法和FILTERSIM方法等多種算法,但這些方法都未成熟,尚需進一步改進并加以完善,多點地質統計學隨機建模方法中,訓練圖像仍需進行深一步的研究。
1.在決定接受一個訓練圖像以前,應該判斷它是否是平穩的。判斷一個訓練圖像是否平穩沒有絕對的標準,常常具有主觀性。值得注意的是,訓練圖像必須是平穩的,然而實際的油藏大多數是非平穩的,也就是說,它們的的沉積模式依賴特定空間位置而且是非重復的。這是由沉積過程中的非均質性和各向異性所決定的。因此,為了減少平穩性的限制,可以加強算法研究,增加地質約束。
2.進行多點統計建模時,三維訓練圖像所得的模擬結果比較符合已有的地質研究。但是,獲取三維訓練圖像具有相當大的難度,一般對于三維訓練圖像,可以先建立一個二維的,然后結合砂泥巖比例曲線得到三維的訓練圖像。三維訓練圖像還可以通過示性點過程模擬得到。
參考文獻
[1]王家華,張團峰.油氣儲層隨機建模[M].北京:石油工業出版社,2001:119-143.
[2]王家華.迎接油氣儲層建模理論、應用的大發展-從2007年國際石油地質統計學大會談起[J].地學前緣,2008,15(1):16~254.
[3]李桂亮,王家華.多點地質統計學儲層建模的實用展望[J].國外油田工程,2009,25(11):1~2.
[4]Andrew Clark S.Challenges for Horizontal Well Placement Optimization in a Giant Mature Onshore Oilfield Abu Dhabi.UAE [C].SPE137070,2010,1~15.
[5]Matheron G. Principles of Geostatistics[J].Economic Geology,1963,58(1):21~28.
[6]王家華,趙巍.基于地震約束的地質統計學建模方法研究[J].海洋石油,2010,30(4):46~49.
統計學中幾大影響比較大的學派是頻率學派、貝葉斯學派和信念學派。在很長的時間內,頻率學派或稱經典學派的觀點、理論占據了主流地位,其余兩派并未得到足夠的重視。但是在實際應用中,卻早已應用貝葉斯學派的理念來處理問題。所以有必要在理解這幾大學派思想的基礎上,來了解不同思想的統計方法。
一、兩大學派的特點和分歧
頻率學派堅持對概率的看法是頻率的穩定性,所以,凡是不能重復進行的試驗的有關結果都不能應用概率作出判斷。但是很多時候,人們都是根據已有的知識和邏輯推理能力來對統計問題作出判斷。在實際經濟環境中,情況總是比較復雜,很難具備可以進行重復試驗的條件,這個時候頻率學派的理論就很難運用上了。與之不同,貝葉斯學派認為,概率是反映事件發生可能性的一個度量,既可以是反映重復試驗的頻率穩定性,也可以反映人們的某一些類型的主觀信念。只要可以接受到任何先驗信息,就都能對特定問題進行邏輯推理。
頻率學派和貝葉斯學派之間激烈的爭論,促進了統計學的發展,使得統計學最為一門信息科學在學科體系上和思想上更完善。這兩大學派爭論的分歧:其一,對概率這個概念的認識。經典學派認為概率是純客觀的,是頻率穩定性的內在依據。而貝葉斯學派則認為概率應包含客觀概率與主觀概率;其二,是對統計問題的看法。頻率學派研究的重點是樣本空間,認為樣本是變化的,參數是固定不變的,并從中尋找規律來推斷參數的性質。貝葉斯學派的重點是研究參數空間,認為樣本就是已觀測到的值,它已不再變動而參數則是隨機變量。需要探討的是,參數取值的變化規律;其三,利用信息的范圍不同。貝葉斯學派既利用樣本信息又利用先驗信息,而經典學派只局限于從樣本獲取的信息。其四,推斷的過程不同。貝葉斯學派是從參數的先驗分布到后驗分布。而頻率學派卻僅是根據樣本的信息對參數作出推斷。可以說,先驗分布這是區分這兩個學派的一個重要特征。
二、統計分析方法的基本思路
在參數估計的基本方法上,對于單一方程模型,最常用的有普通最小二乘法、廣義矩估計和極大似然估計法等。對于聯立方程模型有常用二段最小二乘法和三段最小二乘法等?;镜睦碚摽蚣苁菍ξ粗獏档哪P徒?參數估計包括點估計、區間估計、假設檢驗和預測等內容。并以此來研究各種模型,如線性回歸模型、非線性回歸模型、聯立方程組模型,面板數據模型、時間序列模型等。
而貝葉斯分析則采用不同的思路,來進行參數的估計,檢驗和模型的比較。一般有如下思路:在得到樣本數據的基礎上,建立模型,求出似然函數,同時先驗信息得到先驗分布,運用貝葉斯定理,推導出后驗分布,分析得出的結論。
可以說,經典的統計分析方法與貝葉斯分析的方法,孰優孰劣,也不可以一概而論。經典的方法在發展體系上很嚴密,有嚴謹的數理基礎,而貝葉斯方法則是提供了一種新的思維方式,是推進現代統計及相關學科理論發展的強大力量。
三、統計計算方法和軟件的發展
隨著現代電腦技術的發展,統計學也獲得了飛快的發展,尤其是促進了統計的計算方法的發展,特別是在針對貝葉斯方法的計算得到了新的進展。這主要分為兩類,一類是通過直接的抽樣手段,得到后驗均值的估計值,主要包括直接抽樣、分層抽樣、篩選抽樣等;它們的缺陷在于只能用于比較簡單、低維的后驗分布。第二類為 MCMC(Markov chainMonte Carlo),近年發展迅速,在各個相關領域得到了廣泛的應用。在實際研究工作中,經常遇到的是高維的復雜數據,這時運用傳統的方法就遇到困難了。而MCMC方法為這一復雜的計算過程開辟了新的方向。它的基本思想是把一個復雜的抽樣問題轉化為一系列簡單的抽樣問題,而不是直接從復雜的總體中抽取樣本,并利用電腦技術模擬這個過程。
2精簡和更新教學內容
在教學內容方面做到突出實用性,適當地減少或減弱概率論部分的理論性和難度,以直觀、趣味和易于理解的方式把概率論作為數理統計的基礎知識加以介紹.在假設檢驗部分注意闡述數理統計方法的思想、應用的背景及應用中所需的條件,重點講解假設檢驗應該如何選取原假設和備擇假設,如何對得出的結論進行合理的解釋;在參數估計部分著重地講解參數估計在實際應用中的重要性、合理性及應用中應注意的問題,區間估計中置信區間的理解及單側置信限在應用中的意義等;在方差分析部分講清楚引進方差分析的意義、假設檢驗的方法對多個總體進行多次t檢驗時的缺點、方差分析應用的條件及合理解釋檢驗結果等;在回歸分析部分注意闡述量與量之間的關系、回歸方程的理論意義及對回歸方程結果在應用中的解釋等.目前SPSS軟件是國際醫學論文中應用最廣泛的統計軟件[2],國內的大部分醫學期刊也要求論文數據統計分析要應用統計軟件處理,統計檢驗結果要用P值來表示,更要求學生了解統計軟件的使用方法,做到正確使用統計軟件.新晨
3互動式的教學方法培養應用、創新型人才
傳統的教學方式是知識傳授型教學,即教師在課堂上灌輸知識,在有限的時間內按教學大綱要求把大量的教學內容盡可能地講授完畢,不能有效地調動學生對學習的主動性,忽視學生應用能力的發展,結果導致學生把主要精力投入到統計計算上,很難有時間去深入分析統計結果.互動式教學方法要求教師在教學中充分發揮教師的主導作用,同時讓學生處于教學的中心,在加強課堂討論的同時,由教員歸納總結,充分調動學生的學習興趣,提高學生的主動性和創造性.統計學應用能力的培養主要指可正確選擇和應用統計分析方法解決醫藥學科學研究和醫藥工作中的實際問題[3].為了避免學生濫用及錯用統計方法,教師要重點講清各種方法的適用條件及特點.在考試方法上亦采用開卷考試,使學生不再花大量時間去推敲和死記那些復雜的公式,不再難于分清和理解符號及公式.通過幾年來的改革實踐,發現上述教學內容、方法及手段的改革增強了學生的學習興趣,使學生真正體會到數理統計學的內容在醫藥及日常生活中的應用價值,激發學生的創造性思維,取得了良好的效果.
[參考文獻]