登錄

統(tǒng)計數(shù)據(jù)處理

百科 > 統(tǒng)計數(shù)據(jù)處理

1.什么是統(tǒng)計數(shù)據(jù)處理

統(tǒng)計數(shù)據(jù)處理是指使用計算機對常規(guī)的統(tǒng)計報表、專項統(tǒng)計調(diào)查表和其他統(tǒng)計資料等載體上的數(shù)據(jù)進行錄入(讀入)、審核編輯、匯總、制表、打印和計算等操作的過程。

2.統(tǒng)計數(shù)據(jù)處理的內(nèi)容

(1) 對統(tǒng)計數(shù)據(jù)進行采集、整理,并按一定的數(shù)據(jù)格式放入計算機。

(2)在數(shù)據(jù)輸入過程中,對原始統(tǒng)計數(shù)據(jù)進行預(yù)審、編碼、邏輯檢查、修改、更新和簡單的算術(shù)運算等。

(3) 對統(tǒng)計數(shù)據(jù)進行分類、合并、邏輯校正等操作。

(4) 對數(shù)據(jù)進行分類匯總,以及制作各式綜合匯總表和過錄表。輸出各式打印表和種類數(shù)據(jù)文件。

3.統(tǒng)計數(shù)據(jù)處理的基本過程

統(tǒng)計資料是指反映大量社會經(jīng)濟現(xiàn)象的數(shù)量特征和規(guī)律性的數(shù)字資料。統(tǒng)計工作是搜集、整理和分析統(tǒng)計資料并進行推論的工作。可見,統(tǒng)計工作基本任務(wù)就是對統(tǒng)計資料的處理。

1.一般過程

根據(jù)統(tǒng)計學(xué)理論,我們知道統(tǒng)計數(shù)據(jù)處理過程一般分為:統(tǒng)計資料搜集、統(tǒng)計資料整理和統(tǒng)計資料分析及預(yù)測等三個階段。其中,統(tǒng)計資料搜集的目的是獲取與研究目的相關(guān)的大量原始、基層數(shù)據(jù);整理階段的處理對象是大量統(tǒng)計個體,是對個體的逐項處理;而分析研究階段的數(shù)據(jù)處理對象是統(tǒng)計總體,是在匯總基礎(chǔ)上對總體特征及規(guī)律的研究。

2.計算機統(tǒng)計數(shù)據(jù)處理過程

計算機數(shù)據(jù)處理過程是以計算機為中心的數(shù)據(jù)處理過程。它和手工、機械數(shù)據(jù)處理方式一樣,也包括三個階段,即:數(shù)據(jù)搜集→數(shù)據(jù)加工→數(shù)據(jù)輸出。

(1)數(shù)據(jù)處理的第一階段就是數(shù)據(jù)的搜集。搜集是指按一定的目的要求獲取原始統(tǒng)計資料的過程。數(shù)據(jù)處理質(zhì)量在很大程度上取決于搜集到的原始數(shù)據(jù)的完整性和真實性。統(tǒng)計數(shù)據(jù)搜集的手段很多,它既可以手工方式進行,也可借助互聯(lián)網(wǎng)和計算機以自動方式進行。統(tǒng)計數(shù)據(jù)搜集方式有:統(tǒng)計報表制度、各種普查、抽樣調(diào)查、典型調(diào)查、重點調(diào)查等。

數(shù)據(jù)搜集核心是:數(shù)據(jù)的識別、采集和組織,即有目標的選擇那些能反映事物運動過程屬性的數(shù)據(jù),將其及時、完整搜集起來并按一定層次加以組織。只有這樣才能清晰地反映事物活動全過程。

(2)數(shù)據(jù)加工是數(shù)據(jù)處理的核心,一般包括數(shù)據(jù)編碼、錄入、審核、分組、匯總、計算、存貯、傳輸?shù)葍?nèi)容。

在計算機中,廣義的數(shù)據(jù)是指能被計算機處理的各種對象。為了使計算機能識別不同的數(shù)據(jù)并加以迅速處理,應(yīng)對數(shù)據(jù)進行編碼,也就是通過一定的數(shù)字、符號來表達所得到的客觀事實。

據(jù)資料經(jīng)編碼分類后,由錄入人員將其輸入計算機。在數(shù)據(jù)組織中,很重要的工作是將數(shù)據(jù)輸入到計算機,并按照規(guī)范的要求組成各種形式的數(shù)據(jù)庫,再由數(shù)據(jù)庫管理系統(tǒng)對其進行管理。

數(shù)據(jù)審核是數(shù)據(jù)搜集的重要環(huán)節(jié)。所謂數(shù)據(jù)審核,就是對全部輸入數(shù)據(jù),設(shè)想其可能出現(xiàn)的差錯,并設(shè)法對其進行檢驗。對查出的有錯誤的數(shù)據(jù),考慮改正和補救的方法等。

統(tǒng)計匯總就是按照數(shù)據(jù)的特征(數(shù)字或字母)或按照數(shù)據(jù)的某種屬性,將原始數(shù)據(jù)分成若干類型,并得出合計結(jié)果的處理過程。統(tǒng)計資料的匯總是統(tǒng)計資料整理的中心內(nèi)容。

數(shù)據(jù)處理過程必然要涉及到大量數(shù)據(jù)的存儲問題。計算機為存貯數(shù)據(jù)提供了各種存貯設(shè)備,如硬盤、軟盤、光盤、磁帶、閃存等。

計算機進行數(shù)據(jù)傳輸可以分為機內(nèi)傳輸和機外傳輸。機內(nèi)傳輸主要是通過計算機的硬件和軟件進行傳輸,如從光盤傳到內(nèi)存,從磁帶傳到內(nèi)存再傳到磁盤等;此外,還有一種傳輸是脫離主機直接在外部設(shè)備之間交換數(shù)據(jù),這稱為脫機傳輸。機外傳輸主要是通過通訊線路(共用或?qū)S镁€路)進行的,一般稱為聯(lián)機系統(tǒng)。在聯(lián)機系統(tǒng)中數(shù)據(jù)發(fā)生一般是隨機的,需要及時進行處理和輸出,這種方式也稱為鏈接傳輸。

(3)數(shù)據(jù)輸出是將加工后所得到的信息,通過各種方式輸出,以滿足統(tǒng)計業(yè)務(wù)工作或計算機管理工作的需要。輸出方式很多,如打印、顯示、圖樣、聲音等。

現(xiàn)代化管理要求對統(tǒng)計數(shù)據(jù)進行快速、適時、有效地處理,并且可以在部門、地區(qū)之間,甚至在國家之間進行快速數(shù)據(jù)通訊,從而能及時為國民經(jīng)濟和領(lǐng)導(dǎo)部門的決策服務(wù)。這些要求,必須使用快捷、安全、準確的輸出系統(tǒng)才能得以實現(xiàn)。目前,統(tǒng)計數(shù)據(jù)處理一般都是指計算機統(tǒng)計數(shù)據(jù)處理。如下圖是一個統(tǒng)計報表匯總系統(tǒng)的數(shù)據(jù)處理過程:

Image:圖統(tǒng)計報表匯總系統(tǒng)的數(shù)據(jù)處理過程.jpg

其中:“錄入”是對大量采集的數(shù)據(jù)進行整理并按一定的格式輸入(或光電掃描、語音錄入、磁介質(zhì)數(shù)據(jù)格式轉(zhuǎn)換等)到磁介質(zhì)(硬盤、軟盤、磁帶、光盤等)中去;“審核”是對錄入(或傳輸入)的數(shù)據(jù)進行正確性判斷,保證得到正確的數(shù)據(jù);“分組”是對錄入的數(shù)據(jù)按照統(tǒng)計的要求,對數(shù)據(jù)進行分類、合并等操作;“制表”是對分組匯總后的數(shù)據(jù)按照統(tǒng)計表的格式加上標題、題注、表側(cè)、表頂、表體、腳注等內(nèi)容。由圖可見,以上各環(huán)節(jié)都是在相應(yīng)的計算機程序下完成的。

3.計算機統(tǒng)計數(shù)據(jù)處理的特點

一般而言,統(tǒng)計數(shù)據(jù)整理屬于“海量數(shù)據(jù)處理”范疇,其特點是:“量大、高效、質(zhì)高、數(shù)據(jù)利用率高”。

“量大”,統(tǒng)計需處理的數(shù)據(jù)一般都是海量數(shù)據(jù),同時,其數(shù)據(jù)處理需動用的人力、物力也很大,數(shù)據(jù)處理的程序也較復(fù)雜;

“高效”,統(tǒng)計數(shù)據(jù)處理一般都有嚴格的時間限制,必須在規(guī)定的時間內(nèi)完成任務(wù)。同時,由于處理的數(shù)據(jù)量大,還必須考慮到高效的數(shù)據(jù)錄入,高速的數(shù)據(jù)計算,計算機內(nèi)、外部存儲設(shè)備等的有效利用情況等;

“質(zhì)高”,統(tǒng)計數(shù)據(jù)處理必須做到科學(xué)、準確、及時,特別是反映社會經(jīng)濟現(xiàn)象的重要統(tǒng)計數(shù)據(jù);

“數(shù)據(jù)利用率高”,統(tǒng)計數(shù)據(jù)的處理還必須考慮數(shù)據(jù)的共享和進一步深加工的需要,使處理后的數(shù)據(jù)能夠適應(yīng)不同層次、不同用戶的需要,以利于信息資源的有效利用。

計算機統(tǒng)計數(shù)據(jù)處理,為“獲取信息資源的最大化”提供了可能。如下圖是手工、計算機數(shù)據(jù)處理對信息增減的對比示意圖。

Image:統(tǒng)計數(shù)據(jù)處理的信息增減示意圖.jpg

利用計算機,可以高效、廣泛搜集到各種統(tǒng)計數(shù)據(jù),并對大量采集到的數(shù)據(jù)進行整理,按一定的格式存儲起來以利于數(shù)據(jù)共享;可以在數(shù)據(jù)加工階段發(fā)揮計算機數(shù)據(jù)處理的優(yōu)勢,對原始統(tǒng)計資料進行各種分組、集成和計算,盡可能多的挖掘出各種有用信息;可以在數(shù)據(jù)提供階段根據(jù)用戶的不同需要而輸出各種結(jié)果,滿足個性化的需求。與傳統(tǒng)手工統(tǒng)計數(shù)據(jù)處理方式相比較,計算機統(tǒng)計數(shù)據(jù)處理方式在獲取統(tǒng)計信息資源最大化方面有著明顯的優(yōu)勢。

4.計算機統(tǒng)計數(shù)據(jù)處理的方式

計算機統(tǒng)計數(shù)據(jù)處理方式通常有集中批處理和聯(lián)機實時處理系統(tǒng)。

(1)集中批處理是統(tǒng)計部門廣泛使用的一種處理方式。集中批處理是把一批統(tǒng)計數(shù)據(jù)處理任務(wù),包括統(tǒng)計數(shù)據(jù)及任務(wù)要求一起交給計算中心,統(tǒng)計數(shù)據(jù)處理專業(yè)人員按系統(tǒng)具備的數(shù)據(jù)處理能力,對這批數(shù)據(jù)處理任務(wù)的性質(zhì)和特點做出合理的安排,使計算機系統(tǒng)用最短的時間保質(zhì)、保量地完成這批任務(wù)。在集中批處理進行的過程中,不需要其他用戶干預(yù)。由于批處理是把作業(yè)匯集在一起進行處理,因此,處理效率比較高。

采用集中批處理方式,數(shù)據(jù)源就在機房或可將數(shù)據(jù)源匯集后在機房處理,且處理結(jié)果不必要實時返回,這種集中批處理方式也是通常所指的機房處理方式。

(2)實時處理是在數(shù)據(jù)產(chǎn)生的同時,立即進行處理,并在規(guī)定的時間內(nèi)返回處理的結(jié)果。實時處理已廣泛應(yīng)用在網(wǎng)上直報、網(wǎng)絡(luò)調(diào)查等統(tǒng)計工作中,也廣泛應(yīng)用于飛機票、車船票預(yù)約系統(tǒng)和銀行業(yè)務(wù)、交通控制、過程控制、生產(chǎn)管理,倉庫管理等領(lǐng)域。

采用實時處理,數(shù)據(jù)源一般是分散的,而且處理結(jié)果實時響應(yīng)。這時系統(tǒng)必然是多終端的聯(lián)機系統(tǒng),終端分布在各數(shù)據(jù)源,通過通信線路連接終端和主機,這就是通常所指的聯(lián)機處理方式。一般的實時事物處理系統(tǒng)和經(jīng)營管理系統(tǒng)都采用這一方式。應(yīng)該指出,在聯(lián)機終端上也可以提交批處理作業(yè),而且聯(lián)機系統(tǒng)的基礎(chǔ)是計算機及通信網(wǎng)絡(luò)。

評論  |   0條評論