初級統(tǒng)計師考試統(tǒng)計基礎:統(tǒng)計數(shù)據(jù)的搜集
來源:考試大發(fā)布時間:2011-11-25 17:32:37
統(tǒng)計數(shù)據(jù)的搜集、整理與顯示
統(tǒng)計活動是從搜集個體統(tǒng)計數(shù)據(jù)(Data)開始的。這些數(shù)據(jù)可能是定量的,也可能是定性的,它們都是統(tǒng)計分析的素材。在做統(tǒng)計分析之前,還應對其進行加工整理和顯示。
統(tǒng)計數(shù)據(jù)的搜集
統(tǒng)計數(shù)據(jù)的搜集,涉及數(shù)據(jù)的計量尺度與類型、數(shù)據(jù)調查的組織方式與數(shù)據(jù)搜集的具體方法、調查方案的設計以及對數(shù)據(jù)的質量要求等內容。
一、統(tǒng)計數(shù)據(jù)的計量與類型
統(tǒng)計數(shù)據(jù)計量(Measurement,亦稱測量)的質量,影響甚至決定統(tǒng)計描述和分析的質量。數(shù)據(jù)計量的準確程度,視所觀察的客體及其標志的性質和測量工具而定。自然科學以物理、化學或力學的某些特征為觀察現(xiàn)象,自然界的客體也比較穩(wěn)定,而且大多有較精確的儀器作為測量工具。故自然科學的計量在精度上領先于社會科學。社會科學以人類行為、社會關系、價值觀念等為研究對象,甚至涉及被研究者的隱私(Privacy),而不易得到研究對象的合作;即使有時研究對象給予合作,由于計量的原因,也很難取得準確的數(shù)據(jù)。所以,改進并確切運用測量工具,始終是社會工作者的一項重要工作。要改進并確切運用測量工具,獲取令人滿意的統(tǒng)計數(shù)據(jù),首先就要考慮數(shù)據(jù)的計量尺度與類型。
�。ㄒ唬⿺�(shù)據(jù)的計量尺度
在計量學的一般分類方法中,依據(jù)對事物計量的精確程度,可將所采用的計量尺度由低級到高級、由粗略到精確分為四個層次,即名類尺度、順序尺度、區(qū)間尺度和比尺度。
1、名類尺度
名類尺度(Nominal scale,亦稱分類尺度、列名尺度等)是這樣一種品質標志,按照它可對研究客體進行平行的分類或分組,使同類同質,異類異質。例如,按照性別將人口分為男、女兩類;按照經(jīng)濟性質將企業(yè)分為國有、集體、私營、混合制企業(yè)等。這里的“性別”和“經(jīng)濟性質”就是兩種名類尺度。名類尺度是最粗略、計量層次最低的計量尺度,利用它只可測度事物之間的類別差,而不能了解各類之間的其他差別。名類尺度計量的結果表現(xiàn)為某種類別;但為了便于統(tǒng)計處理,例如為了計算和識別,也可用不同數(shù)字或編碼表示不同類別。比如用1表示男,0表示女;用1表示國有企業(yè),2表示集體企業(yè),3表示私營企業(yè),等等。這些數(shù)字只是不同類別的代碼,決不意味著它區(qū)分了大小,更不能進行任何數(shù)學運算。名類尺度能對事物做最基本的測度,是其他計量尺度的基礎。
2、順序尺度
順序尺度(Ordinal scale,亦稱序數(shù)尺度、順位尺度等)是這樣一種品質標志,利用它不僅能將事物分成不同的類別,還可確定這些類別的等級差別或序列差別。例如“產(chǎn)品等級”就是一種測度產(chǎn)品質量好壞的順序尺度,它可將產(chǎn)品分為一等品、二等品、三等品、次品等;“考試成績”也是一種順序尺度,它可將成績分為優(yōu)、良、中、及格、不及格等;“對某一事物的態(tài)度”作為一種順序尺度,可將人們的態(tài)度分為非常同意、同意、保持中立、不同意、非常不同意,等等。顯然,順序尺度對事物的計量要比名類尺度精確些,但它至多測度了類別之間的順序,而未測量出類別之間的準確差值。因此,順序尺度的計量結果只能比較大小,不能進行加、減、乘、除等數(shù)學運算。
3、區(qū)間尺度
區(qū)間尺度(Interval scale,亦稱間隔尺度、等距尺度、定距尺度等)是能測度事物類別或次序之間間距的數(shù)量標志,更具體些說,區(qū)間尺度是可將事物區(qū)分為不同類別,對這些類別進行排序,并較準確度量類別之間數(shù)量差距的一種計量尺度。該尺度通常使用自然或物理單位作為度量單位,如收入用人民幣“元”度量,考試成績用“百分制”度量,溫度用攝氏或華氏的“度”來度量,重量用“克”度量,長度用“米”度量等。區(qū)間尺度的計量結果表現(xiàn)為數(shù)值。區(qū)間尺度的數(shù)值可做加、減法運算,例如,考試成績80分與90分之間相差10分,一個地區(qū)的溫度20°C與另一個地區(qū)的25°C相差5°C,等等。但不能做乘、除法運算。而且,區(qū)間尺度沒有絕對零點。
4、比尺度
比尺度(Ratio scale,亦稱為比率尺度)的計量結果也表示為數(shù)值,跟區(qū)間尺度屬同一層次,有時對兩者可不作區(qū)分。比尺度這種數(shù)量標志不僅能測度各類別的大小和多少,還有一個絕對零點(Absolute zero)作為起點。這個絕對零點是它跟區(qū)間尺度的明顯差別,就是說,區(qū)間尺度中沒有絕對零點,即使其計量值為“0”,這個“0”也是有客觀內容的數(shù)值,即“0”水平,而不表示“沒有”或“不存在”。例如,某個學生統(tǒng)計學的考試成績?yōu)?ldquo;0”分,這個“0”分是他的統(tǒng)計學的客觀成績,并不表示他沒有考試成績或沒有任何統(tǒng)計學知識;一個地區(qū)的溫度為0°C,這表示一種溫度的水平,并不是說沒有溫度。而比尺度中絕對零點的“0”,表示“沒有”或“不存在”。例如,一個人的身高為“0”米,表示這個人不存在;一個人的收入為“0”,表示這個人沒有收入;一個產(chǎn)品的產(chǎn)量為“0”,表示沒有這種產(chǎn)品;等等�,F(xiàn)實中,大多數(shù)場合人們使用的都是比尺度。
比尺度與上述三種計量尺度相比還有一個特性,就是可以計算數(shù)值之間的比值。例如,一個人的月工資收入為600元,另一個人的為300元,可以得出一個人的收入是另一個的兩倍。但區(qū)間尺度由于不存在絕對零點,就只能比較數(shù)值差,而不能計算比值。比如,可以說30°C與15°C之差為15°C,而不能說30°C比15°C熱一倍�?梢�,比尺度可以做加、減、乘、除法運算。
上述四種計量尺度對事物的計量層次是由低級到高級、由粗略到精確,逐步遞進的。高層次的計量尺度可以計量低層次計量尺度能夠計量的事物,但不能反過來。顯然,可以很容易地將高層次計量尺度的計量結果轉化為低層次計量尺度的計量結果;將考試成績的百分制轉化為五等級分制就是一例。
�。ǘ⿺�(shù)據(jù)的類型
在第一章中,我們曾把統(tǒng)計標志分為品質標志和數(shù)量標志,這兩種統(tǒng)計標志的標志表現(xiàn)在廣義上都可叫做統(tǒng)計數(shù)據(jù)。更確切些說,在計量學的意義上,統(tǒng)計數(shù)據(jù)是采用某些計量尺度對事物進行計量的結果,但采用不同的計量尺度會得到不同類型的統(tǒng)計數(shù)據(jù)。就上述四種計量尺度計量的結果來看,我們可以大體上將統(tǒng)計數(shù)據(jù)分為兩種類型:定性的數(shù)據(jù)和定量的數(shù)據(jù)。定性數(shù)據(jù)(Qualitative data,亦稱品質數(shù)據(jù))是說明事物的品質特征表現(xiàn)的具體類別,不能用數(shù)值表示;因這類數(shù)據(jù)由名類尺度和順序尺度計量形成,故又可細分為名類數(shù)據(jù)和順序數(shù)據(jù)。定量數(shù)據(jù)(Quantitative data,亦稱數(shù)量數(shù)據(jù))是說明現(xiàn)象數(shù)量特征表現(xiàn)的,能夠甚至必須用數(shù)值來表現(xiàn);因這類數(shù)據(jù)由區(qū)間尺度和比尺度計量形成,故又可細分為區(qū)間數(shù)據(jù)和比數(shù)據(jù)。對不同類型的數(shù)據(jù),可采用不同的統(tǒng)計方法來處理和分析,比如,對定性數(shù)據(jù)一般只采用分組法計算,分析各組的頻數(shù)或頻率,而對定量數(shù)據(jù)則可用更多的統(tǒng)計方法去處理,計算、分析更多的統(tǒng)計指標或統(tǒng)計量。
在統(tǒng)計中,一般把表示現(xiàn)象某種特征的概念稱為變量(Variable)。這樣,統(tǒng)計標志和指標都可以稱為變量。變量的具體表現(xiàn)稱為變量值(Variate-value);統(tǒng)計標志的標志表現(xiàn)和指標數(shù)值都是變量值。如果一個變量的變量值由品質數(shù)據(jù)來記錄,該變量就是品質變量(Qualitative variable),如“性別”就是個品質變量,其變量值是“男”或“女”;“產(chǎn)品等級”也是個品質變量,它可以表現(xiàn)為“一等品”、“二等品”、“三等品”、“次品”等。如果一個變量的數(shù)值由數(shù)量數(shù)據(jù)來記錄,該變量就是數(shù)量變量或稱數(shù)字變量(Quantitative variable),如“產(chǎn)品產(chǎn)量”、“商品銷售額”、“零件尺寸”、“年齡”、“時間”等都是數(shù)量變量,它們可以表現(xiàn)為不同的數(shù)值。數(shù)量變量還可以細分為離散變量和連續(xù)變量。離散變量(Discrete variable)的取值是有限的,所有取值都以整位數(shù)斷開,且可一一列舉,如“企業(yè)數(shù)”、“產(chǎn)品數(shù)量”等就是離散變量。而連續(xù)變量(Continuous variable)的取值是無窮的,連續(xù)不斷的,不能一一列舉,如“年齡”、“溫度”、“零件尺寸”等都是連續(xù)變量。另外,應該注意,多數(shù)情況下我們所說的變量是指數(shù)量變量,統(tǒng)計標志中的數(shù)量標志和所有的統(tǒng)計指標就是這種變量,大多數(shù)統(tǒng)計方法所處理的也都是數(shù)量變量,因此有時把數(shù)量變量就簡稱為變量。本書以后各章多沿用這種做法。
二、統(tǒng)計數(shù)據(jù)的調查方式和搜集方法
在本源上,統(tǒng)計數(shù)據(jù)都來自直接的調查或試驗,這種來源的數(shù)據(jù)也被稱為第一手或直接的統(tǒng)計數(shù)據(jù)。有時,別人調查或試驗的數(shù)據(jù)也是使用者搜集統(tǒng)計數(shù)據(jù)的一個來源,當然,這種數(shù)據(jù)屬第二手或間接的統(tǒng)計數(shù)據(jù)。但任何一種統(tǒng)計數(shù)據(jù)的獲取都要進行適當?shù)慕M織和運用具體的搜集方法。這里,我們著重討論取得社會經(jīng)濟統(tǒng)計數(shù)據(jù)的主要調查組織方式和具體搜集方法。
�。ㄒ唬┙y(tǒng)計調查的組織方式
實際中常用的統(tǒng)計調查組織方式主要有普查、抽樣調查、統(tǒng)計報表、重點調查和典型調查等。
1、普查。普查(Census)是為某一特定目的而專門組織的一次性全面調查方式,如人口普查、工業(yè)普查、農業(yè)普查等。世界各國一般都定期進行各種普查。普查適用于特定目的、特定對象,旨在搜集有關國情國力的基本統(tǒng)計數(shù)據(jù),為國家制定有關政策或措施提供依據(jù)。它主要用于搜集處于某一時點狀態(tài)上的社會經(jīng)濟現(xiàn)象的數(shù)量。普查作為一種特殊的調查組織方式有以下幾個特點:
�。�1)普查通常是一次性或周期性的。普查涉及面廣,調查單位多,要耗費大量的人力、物力和財力,所以間隔較長時間,如10年才進行一次。我國的人口普查從1953年到1990年共進行過4次。今后,我國的普查將規(guī)范化、制度化,每逢末尾為“0”的年份進行人口普查,末尾為“3”的年份進行第三產(chǎn)業(yè)普查,末尾為“5”的年份進行工業(yè)普查,末尾為“7”的年份進行農業(yè)普查,末尾為“1”或“6”的年份進行統(tǒng)計基本單位普查。
�。�2)普查一般需要規(guī)定統(tǒng)一的標準調查時間,以避免調查數(shù)據(jù)的重復或遺漏,保證普查結果的準確性。我國前四次人口普查的標準時間定為普查年份的7月1日0時,第五次人口普查為2000年11月1日0時。農業(yè)普查的標準時間定為普查年份的1月1日0時。標準時間一般定為調查對象比較集中、相對穩(wěn)定的時期。
�。�3)普查的數(shù)據(jù)一般比較準確,規(guī)范化程度也高,因此可作為抽樣調查和其他調查的依據(jù)。
�。�4)普查的使用范圍較窄,只能調查一些最基本或特定的現(xiàn)象。
2、抽樣調查。抽樣調查(Sampling survey)是按照一定的概率從總體中抽取一部分單位構成樣本,并根據(jù)樣本信息推斷總體數(shù)量特征的一種非全面調查。這是一種應用最為廣泛的調查組織方式。抽樣調查的內容將在后面設專章討論。
3、統(tǒng)計報表。統(tǒng)計報表(Statistical report forms)是按照國家有關法規(guī)規(guī)定,自上而下統(tǒng)一布置,自下而上逐級填報的一種調查組織方式。這種調查組織方式在我國政府統(tǒng)計工作中,經(jīng)過幾十年的改進和完善,已形成了一套比較完備的統(tǒng)計報告制度,它要求以原始數(shù)據(jù)為基礎,按照統(tǒng)一的表式、指標、報送時間和報送程序填報,已成為國家和地方政府部門獲取統(tǒng)計數(shù)據(jù)的主要統(tǒng)計調查組織方式。
統(tǒng)計報表類型多樣。統(tǒng)計報表按調查范圍可分為全面報表和非全面報表;按報送時間可分為日報、月報、季報和年報等;按報送受體可分為國家、部門、地方統(tǒng)計報表。
4、重點調查。重點調查(Key-point investigation)是這樣一種調查組織方式,它只從全部總體單位中選擇少數(shù)重點單位進行調查,這些重點單位盡管在全部總體單位中出現(xiàn)的頻數(shù)極少,但其某一數(shù)量標志卻在所要研究的數(shù)量標志值總量中占有很大的比重。例如,要了解全國的鋼鐵生產(chǎn)總量,只要對產(chǎn)量很大的少數(shù)幾個鋼鐵企業(yè),如鞍鋼、寶鋼、首鋼等進行調查,就可對全國的鋼鐵生產(chǎn)總量有個大致的認識。這幾個產(chǎn)量很大的企業(yè),構成了這次全國鋼產(chǎn)量調查的重點單位,因為它們的鋼鐵產(chǎn)量,在全國的鋼鐵生產(chǎn)總量中占有很大比重。
5、典型調查。典型調查(Model survey)是從全部總體單位中選擇一個或幾個有代表性的單位進行深入細致調查的一種調查組織方式。典型調查的目的是通過典型單位來描述或揭示事物的本質或規(guī)律,因此所選擇的典型單位應能反映所研究問題的本質屬性或特征。例如,要研究工業(yè)企業(yè)的經(jīng)濟效益問題,可以在同行業(yè)中選擇一個或幾個經(jīng)濟效益突出的單位做深入細致的調查,從中找出經(jīng)濟效益好的原因和經(jīng)驗。典型調查主要用于定性研究,調查結果一般不能推斷總體。
�。ǘ⿺�(shù)據(jù)搜集方法
不論采用哪種方式組織調查,都要運用具體的數(shù)據(jù)搜集方法去采集統(tǒng)計數(shù)據(jù)。歸納起來,數(shù)據(jù)搜集方法有詢問調查和觀察實驗兩大類。
1、詢問調查。詢問調查是調查者與被調查者直接或間接接觸以獲得數(shù)據(jù)的一種方法、具體包括訪問調查、郵寄調查、電話調查、電腦輔助調查、座談會、個別深度訪問等。
�。�1)訪問調查。訪問調查又稱派員調查,是調查者與被調查者通過面對面交談從而得到所需資料的調查方法。這又可分為標準式訪問和非標準式訪問兩種。標準式訪問又稱結構式訪問,是按照調查人員事先設計好的,有固定格式的標準化問卷或表格,有順序地依次提問,并由受訪者作出回答。其優(yōu)點是能夠對調查過程加以控制,從而獲得比較可靠的調查結果。非標準式訪問又稱非結構式訪問,它事先不制作統(tǒng)一的問卷或表格,沒有統(tǒng)一的提問順序,調查人員只是給一個題目或提綱,由調查人員和受訪者自由交談,從中獲得所需資料。詢問調查在市場和社會調查中常被采用。
(2)郵寄調查。郵寄調查是通過郵寄、宣傳媒體和專門場所等將調查表或問卷送至被調查者手中,由被調查者填寫,然后將調查表寄回或投放到收集點的一種調查方法。這是一種標準化調查,其特點是,調查人員和受調查者沒有直接的語言交流,信息的傳遞完全依賴于調查表。郵寄調查在統(tǒng)計部門進行的統(tǒng)計報表及市場調查機構進行的問卷調查中經(jīng)常使用。
�。�3)電話調查。電話調查是調查人員利用電話同受訪者進行語言交流,從而獲得信息的一種調查方法。該方法具有時效快,費用低等特點。隨著電話的普及,電話調查也越來越廣泛。電話調查可以按照事先設計好的問卷進行,也可以針對某一專門問題進行電話采訪。電話調查所提問題要明確,且數(shù)量不宜過多。
�。�4)電腦輔助調查。這種調查也叫做電腦輔助電話調查,就是在電話調查時,調查的問卷、答案都由計算機顯示,整個調查過程,包括電話撥號、調查記錄、數(shù)據(jù)處理等也都借助于計算機來完成的一種調查方法。目前,電腦輔助調查已在一些發(fā)達國家和地區(qū)廣泛應用,并已開發(fā)出了各種電腦輔助電話調查系統(tǒng)。
�。�5)座談會。座談會也稱為集體訪談法,就是將一組被調查者集中在調查現(xiàn)場,讓他們對調查的主題發(fā)表意見,從而獲取資料的方法。參加座談會的受訪者應是所調查問題的專家或有經(jīng)驗者,人數(shù)不宜太多,通常為6-10人,研究人員應對受訪者進行嚴格的甄別、篩選。討論方式主要看主持人的習慣和愛好。這種方法能獲取其他方法無法取得的資料,因為在彼此交流的環(huán)境里,受訪者相互影響、啟發(fā)、補充,不斷修正自己的觀點,這就有利于研究者從中獲得較為廣泛深入的想法和意見。而且座談會不會因為問卷過長而遭到拒訪。
�。�6)個別深度訪問。深度訪問是一種一次只要一名受訪者參加的特殊的定性研究。“深訪”暗示著要不斷深入到受訪者的思想中,努力發(fā)掘其行為的真實動機。深訪是一種無結構的個人訪問,調查者運用大量的追問技巧,盡可能讓受訪者自由發(fā)揮,表達他的想法和感受。深度訪問常用于動機研究,如消費者購買某種產(chǎn)品的動機等,以發(fā)掘受訪者非表面化的深層意見。這一方法最適用于研究隱私的問題,如個人隱私問題,或敏感問題,如政治性問題。對于那些不同人之間觀點差異極大的問題,用小組討論可能會把問題弄糟,這時也可采用深度訪問法。
座談會和個別深訪法屬于定性方法,通常圍繞一個特定的主題取得有關定性資料。此類方法和定量方法不同。定量方法是從總體中按隨機方式抽取樣本獲得資料,其研究結果或結論可以進行推論。但定性研究著重于問題的性質和對未來趨勢的把握,而不是對研究總體數(shù)量特征的推斷。座談會和個別深度訪問主要用于市場調查和研究。
2、觀察與實驗。觀察與實驗是調查者通過直接的觀察或實驗獲得數(shù)據(jù)的一種方法。
(1)觀察法。這是指就調查對象的行動和意識,調查人員邊觀察邊記錄的收集信息的方法。這是一種可替代直接發(fā)問的方法。運用這種方法,訓練有素的觀察員或調查員到重要地點,利用感覺器官或設置一定的儀器,觀測和記錄人們的行為和舉動。采用觀察方法,由于調查人員不是強行介入,受訪者無須任何反應,因而常常能在被觀測者不察覺的情況下獲得信息資料。
�。�2)實驗法。這是一種特殊的觀察調查方法。實驗法是在所設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進行實驗以取得所需資料的一種調查方法。根據(jù)場所不同,實驗法可分為在室內進行的室內實驗法和在市場或外部進行的市場實驗法。室內實驗法可用于廣告認知的實驗等,例如,在同日的同種報紙上,版面大小相同,分別刊登A、B兩種廣告,然后將其散發(fā)給讀者,以測定其反應結果。市場實驗法可用于消費者需求調查等,例如,企業(yè)讓消費者免費使用一種新產(chǎn)品,以得到消費者對新產(chǎn)品看法的資料。
當然,若能通過直接調查或實驗獲取第一手數(shù)據(jù)那最好不過了。但這往往不可能。有時,需要通過間接渠道獲取別人調查或科學試驗的第二手數(shù)據(jù)。第二手數(shù)據(jù)主要是公開出版或公開報道的數(shù)據(jù)。在我國,公開出版或報道的社會經(jīng)濟統(tǒng)計數(shù)據(jù)主要來自國家和地方的統(tǒng)計部門以及各種報刊媒介。例如,公開出版物有《中國統(tǒng)計年鑒》、《中國統(tǒng)計摘要》、《中國社會統(tǒng)計年鑒》、《中國工業(yè)經(jīng)濟統(tǒng)計年鑒》、《中國農村統(tǒng)計年鑒》、《中國人口統(tǒng)計年鑒》、《中國市場統(tǒng)計年鑒》,以及各省、市、地區(qū)的統(tǒng)計年鑒等。提供世界各國社會和經(jīng)濟數(shù)據(jù)的出版物也有許多,如《世界經(jīng)濟年鑒》、《國外經(jīng)濟統(tǒng)計資料》,世界銀行各年度的《世界發(fā)展報告》等。聯(lián)合國的有關部門及世界各國也定期出版各種統(tǒng)計數(shù)據(jù),除了公開出版的,還有尚未公開的統(tǒng)計資料,以及在各種報刊、雜志、圖書、廣播、電視傳媒中的數(shù)據(jù)資料也可利用。隨著計算機網(wǎng)絡技術的發(fā)展,在網(wǎng)絡上獲取資料也很重要。但在使用第二手數(shù)據(jù)時,應注意統(tǒng)計數(shù)據(jù)的含義,計算口徑和計算方法的可比性,避免誤用或濫用。同時,在引用第二手數(shù)據(jù)時,一定要注明來源,以尊重他人的勞動成果。
三、調查方案的設計
為了使調查工作順暢進行,最終取得高質量的數(shù)據(jù)資料,事先應制定出一個綱領性文件,這個綱領性文件就是調查方案。不同調查的調查方案在內容和形式上會有差別,但調查目的、調查對象、調查項目和調查表等內容是必不可少的。
(一)確定調查目的
調查方案首先應明確本次調查的目的。調查目的是調查所要達到的目的,它回答的是為什么調查,要解決什么樣的問題,調查具有什么樣的社會經(jīng)濟意義等。只有在調查目的明確之后,才能確定向誰調查,調查什么及采用什么方法進行調查。調查目的的表述應簡明扼要。我國1990年第四次人口普查的目的是這樣表述的:“為準確地查清第三次全國人口普查以來我國人口在數(shù)量、地區(qū)分布、構成和素質方面的變化,為科學地制定國民經(jīng)濟和社會發(fā)展戰(zhàn)略與規(guī)劃,統(tǒng)一安排人民的物質文化生活,檢查人口政策執(zhí)行情況,提供可靠的資料”。
(二)確定調查對象
調查對象亦稱調查單位。確定調查對象就是明確向誰搜集統(tǒng)計數(shù)據(jù),換言之,調查對象是調查項目的承擔者或載體,是提供統(tǒng)計數(shù)據(jù)的基本單位。我國第四次人口普查規(guī)定:“人口普查的對象是具有中華人民共和國國籍并在中華人民共和國境內常住的人(指自然人)。”簡言之,人口普查的調查對象是每一個人。再如,若要取得某地區(qū)工業(yè)產(chǎn)品產(chǎn)量、產(chǎn)值的全面統(tǒng)計數(shù)據(jù),就可以將該地區(qū)的所有獨立核算的工業(yè)企業(yè)都確定為調查對象。
這里,須特別說明三點:第一,調查單位和調查對象是同義詞,只是在不同的場合采用不同的叫法而已;一些教材和文獻將兩者區(qū)分開來,把調查對象看成是調查單位的集合體,這是不規(guī)范的。第二,關于對全面調查和非全面調查的劃分,全面調查是指對構成統(tǒng)計總體的全部單位都搜集其數(shù)據(jù)資料,如普查,而非全面調查是指只對統(tǒng)計總體中的部分單位搜集其數(shù)據(jù)資料,如抽樣調查;但不管是全面調查還是非全面調查,所有的總體單位都是調查對象或稱調查單位。第三,調查對象和調查單位,跟總體單位也是同義詞,只是在統(tǒng)計調查階段對總體單位的一種特殊叫法;因此,一些教材和文獻把調查對象(調查單位)和總體單位看成是完全不同的范疇,這也是不規(guī)范的。
�。ㄈ┐_定調查項目和設計調查表
確定調查項目,這是要回答調查什么的問題。具體說,調查項目就是所要調查的總體單位的數(shù)量標志和品質標志。在多數(shù)統(tǒng)計調查中,調查項目通常以表格,即調查表的形式來表現(xiàn)。這種用于登記定性數(shù)據(jù)和定量數(shù)據(jù)的表格,一般由表頭、表體和表外附加三部分組成。表頭是調查表的名稱,用來說明調查的內容、被調查單位的名稱、性質等。表體是調查表的主要部分,列示調查的具體項目。表外附加通常由填表人簽名、填報日期、填表說明等內容組成。
調查項目和調查表是調查方案的核心部分,而在許多方案中,調查項目和調查表又往往表現(xiàn)為一張調查問卷。調查問卷是搜集數(shù)據(jù)資料的工具。問卷在結構上一般由開頭部分、甄別部分、主體部分和背景部分組成。開頭部分包括問候語、填表說明和問卷編號等內容。甄別也稱為過濾,就是對被調查者進行篩選,去掉不需要的部分,確定合格的被調查者,從而滿足調查研究的需要。主體部分最核心的是調查的項目,具體說,就是調查者根據(jù)調查的目的和要求所設計的一系列問題、備選答案、說明以及碼表等。背景部分是有關被調查者的一些背景資料,通常放在問卷的最后,背景資料可使研究者對被調查者進行分類比較分析。
�。ㄋ模┓桨冈O計中的其他內容
除上述幾項主要內容外,調查方案還應明確調查所采用的方式和方法、調查時間以及調查的組織與實施的具體細則等。明確調查的方式就是明確此項調查是全面調查還是非全面調查;如果是非全面調查,還要再明確是抽樣調查、重點調查還是典型調查;若是抽樣調查,還應繼續(xù)明確抽樣框、具體的抽樣方法、數(shù)據(jù)的推斷方法等。明確調查的方法就是規(guī)定好是用訪問調查、郵寄問卷調查、電話調查還是其他方法去獲取具體的統(tǒng)計數(shù)據(jù)資料。調查時間包括調查數(shù)據(jù)的所屬時間和調查的工作期限。數(shù)據(jù)所屬時間對時期數(shù)來說是指該數(shù)據(jù)所涵蓋的一段時間區(qū)間,對時點數(shù)來說是指該數(shù)據(jù)所存在的瞬間時點。調查的工作期限指該項調查工作從開始到結束的時間長度,包括搜集數(shù)據(jù)的時間、數(shù)據(jù)處理的時間、數(shù)據(jù)分析和完成調查報告的時間等。第四次全國人口普查數(shù)據(jù)所屬的時間是“1990年7月1日0時”,普查的工作期限是“1990年7月1日至7月10日完成普查的登記工作”。調查的組織與實施工作,具體包括調查人員的選擇、組織和培訓,調查表格、問卷、調查員手冊的印刷,調查工具的準備、調查經(jīng)費的來源和開支預算等。
四、統(tǒng)計數(shù)據(jù)的質量
統(tǒng)計數(shù)據(jù)的質量直接影響到統(tǒng)計分析的結論。為確保統(tǒng)計數(shù)據(jù)的質量,在數(shù)據(jù)的搜集、整理、分析各階段都應盡可能減少誤差,在數(shù)據(jù)的搜集階段這個問題尤為重要。
�。ㄒ唬┙y(tǒng)計數(shù)據(jù)的誤差
統(tǒng)計數(shù)據(jù)的誤差通常是指統(tǒng)計數(shù)據(jù)與客觀現(xiàn)實之間的差距,主要有登記性誤差和代表性誤差兩類。登記性誤差是調查過程中由于調查者或被調查者的人為因素所造成的誤差。調查者所造成的登記性誤差主要是由調查方案中有關的規(guī)定或解釋不明確導致的填報錯誤、抄錄錯誤、匯總錯誤等引起的。被調查者造成的登記性誤差主要是由故意虛報或瞞報引起的。理論上講,登記性誤差是可以消除的。代表性誤差是指用樣本推斷總體時可能產(chǎn)生的誤差,也被稱為抽樣誤差。這種誤差不象登記誤差那樣,可以通過加強工作責任心來消除,只要進行概率抽樣,這種誤差就可能產(chǎn)生,甚至不可避免。但這種誤差可事先進行計算或控制。
�。ǘ┙y(tǒng)計數(shù)據(jù)的質量要求
數(shù)據(jù)的質量包括多方面的含義,不僅僅指數(shù)據(jù)本身的準確性或誤差的大小。一般而言,可將統(tǒng)計數(shù)據(jù)的質量評價標準概括為6個方面:(1)精度,即最低的抽樣誤差或隨機誤差;(2)準確性,即最小的非抽樣誤差或偏差;(3)關聯(lián)性,即滿足用戶決策、管理和研究的需要;(4)及時性,即在最短的時間里取得并公布數(shù)據(jù);(5)一致性,即保證時間序列的可比性;(6)最低成本,即在滿足以上標準前提下,以最經(jīng)濟的方式取得數(shù)據(jù)。人們對統(tǒng)計數(shù)據(jù)質量的要求越來越高。當我們?yōu)槟骋恍枰鸭y(tǒng)計數(shù)據(jù)時,在調查方案的設計,數(shù)據(jù)的搜集,數(shù)據(jù)的處理與分析各個環(huán)節(jié)中,都應保證數(shù)據(jù)的質量,以便得出切合實際的客觀結論。