據(jù)中國(guó)報(bào)告大廳了解,數(shù)十年來(lái),有關(guān)政治決策應(yīng)該依靠科學(xué)的要求早已成為老生常談。但是,在從能源到健康再到環(huán)境等諸多領(lǐng)域中,將科學(xué)應(yīng)用于政治決斷的過(guò)程依然存在一系列問(wèn)題。
英國(guó)劍橋大學(xué)動(dòng)物系保護(hù)生物學(xué)教授William J. Sutherland、數(shù)學(xué)科學(xué)中心的David Spiegelhalter,以及澳大利亞墨爾本大學(xué)的Mark Burgman如今提出了應(yīng)該成為公務(wù)員、政治家、政治咨詢顧問(wèn)和記者教育一部分的20條概念。
“當(dāng)然,其他人也許會(huì)有不同的列表。我們認(rèn)為,一旦能夠充分理解這20個(gè)概念,社會(huì)將向前邁出一大步?!彼麄?cè)凇蹲匀弧?a href="http://1" class="innerlink">雜志上撰文指出。
差異和偶發(fā)原因變化。現(xiàn)實(shí)世界的變化難以預(yù)測(cè)??茖W(xué)在很大程度上是要尋找究竟是什么引發(fā)了人們看到的模式,為何這個(gè)十年比過(guò)去更熱以及為何一個(gè)地區(qū)的鳥(niǎo)類(lèi)比其他地區(qū)更多。此類(lèi)趨勢(shì)有許多解釋?zhuān)虼搜芯康闹饕魬?zhàn)是梳理出有趣過(guò)程的重要方面,例如,氣候變化對(duì)鳥(niǎo)類(lèi)種群的影響。而重要方面往往隱含了其他的許多變化原因,例如農(nóng)業(yè)集約化、入侵物種,以及影響出生和死亡的偶發(fā)事件等。
沒(méi)有測(cè)量是準(zhǔn)確的。實(shí)際上,所有的測(cè)量值都存在某些錯(cuò)誤。如果測(cè)量過(guò)程被重復(fù),人們可能會(huì)記錄到不同的結(jié)果。在某些情況下,測(cè)量誤差可能比實(shí)際偏差要大。如果你被告知上月的經(jīng)濟(jì)增長(zhǎng)了0.13%,那么也有可能實(shí)際經(jīng)濟(jì)在收縮。
偏見(jiàn)很普遍。實(shí)驗(yàn)設(shè)計(jì)或測(cè)量工具可能產(chǎn)生一個(gè)給定方向的非典型結(jié)果。例如,在街上、家里或通過(guò)網(wǎng)絡(luò)調(diào)查詢問(wèn)人們的投票行為,涉及的樣本可能是不同的人群,他們會(huì)有不同的回答。另外,研究還可能因期望值而出現(xiàn)偏差:參與療法實(shí)驗(yàn)的人可能假設(shè)自己會(huì)有不同的經(jīng)歷,因此出現(xiàn)行為偏差。
更大樣本量通常更好。從大量觀察中提取的平均結(jié)果與從少量觀察中獲得的結(jié)果相比通常更具信息量。換言之,當(dāng)我們?cè)诜e累證據(jù)時(shí),我們的知識(shí)量在提高。當(dāng)研究被大量自然變異和測(cè)量錯(cuò)誤環(huán)繞時(shí),這尤為重要。例如,一個(gè)藥物試驗(yàn)的參與者多達(dá)數(shù)萬(wàn)人時(shí),其結(jié)論的有效性要比僅有數(shù)百人參加的類(lèi)似實(shí)驗(yàn)更高。
相關(guān)性不蘊(yùn)含因果聯(lián)系。假設(shè)一個(gè)事件引起另一個(gè)事件,十分吸引人,但是,相關(guān)性可能純屬巧合,或者可能是由第三個(gè)事件引起的兩個(gè)事件的共同結(jié)果—— 一個(gè)“混合”或“潛伏”變量。例如,生態(tài)學(xué)家曾認(rèn)為有毒藻類(lèi)會(huì)殺死河里的魚(yú),但實(shí)際藻類(lèi)并沒(méi)有引起魚(yú)的死亡。
回歸意味著能夠誤導(dǎo)。至少在某種程度上,數(shù)據(jù)的極端模式很可能是由偶然或錯(cuò)誤引起的異常現(xiàn)象。接下來(lái)的數(shù)據(jù)可能沒(méi)有那么極端。例如,測(cè)速相機(jī)被放置在交通事故頻發(fā)地段,但是事故率的減少并不是因?yàn)檫@架相機(jī),無(wú)論如何發(fā)生率都可能降低。
數(shù)據(jù)外的推斷都有風(fēng)險(xiǎn)。在一個(gè)給定范圍內(nèi)發(fā)現(xiàn)的模式未必適用于其他范圍。例如,當(dāng)變化速率比現(xiàn)有物種的進(jìn)化史更快,或極端氣候可能完全是新型的時(shí)候,預(yù)測(cè)生態(tài)系統(tǒng)對(duì)氣候變化的應(yīng)答將非常困難。
注意基礎(chǔ)概率謬誤。用一個(gè)不完美的測(cè)試來(lái)確定一種狀態(tài)的能力,取決于該狀態(tài)發(fā)生的可能性(基準(zhǔn)利率)。例如,一個(gè)進(jìn)行血液測(cè)試的人,有99%的準(zhǔn)確率患有一種稀有疾病且測(cè)驗(yàn)呈陽(yáng)性,但是他們也可能不會(huì)患這種病。如果10001個(gè)人進(jìn)行測(cè)試,其中只有1人有病,那個(gè)人幾乎可以肯定有一個(gè)陽(yáng)性結(jié)果,但也可以說(shuō)有100個(gè)人(1%)會(huì)患病,即使他們沒(méi)患病。
對(duì)照是重要的。除了特定療法沒(méi)有施用外,一個(gè)對(duì)照組的處理方法與實(shí)驗(yàn)組是完全一樣的。沒(méi)有對(duì)照組就很難確定一個(gè)給定療法是否有效。對(duì)照可以幫助研究人員確信沒(méi)有混雜變量影響結(jié)果。
隨機(jī)化避免偏見(jiàn)。只要有可能,實(shí)驗(yàn)應(yīng)該隨機(jī)分配個(gè)人或團(tuán)體。對(duì)照兒童的教育成就時(shí),采用健康計(jì)劃的父母與未采取的父母可能會(huì)出現(xiàn)偏斜,例如,受教育越好的家庭越傾向于參與該項(xiàng)目。一個(gè)精心設(shè)計(jì)的項(xiàng)目應(yīng)隨機(jī)選擇接受項(xiàng)目的人。
尋求復(fù)制而非偽重復(fù)。能夠被獨(dú)立研究小組重復(fù)的研究結(jié)果可能更可靠。幾個(gè)這樣的實(shí)驗(yàn)結(jié)果可能合并成系統(tǒng)回顧和薈萃分析,從而提供該主題的總體觀點(diǎn),這比任何獨(dú)立的研究更具統(tǒng)計(jì)功效。
科學(xué)家是人??茖W(xué)家在推動(dòng)自己的工作方面有既得利益,通常出于身份和進(jìn)一步研究,盡管有時(shí)也因?yàn)橹苯拥慕?jīng)濟(jì)收益。這可能導(dǎo)致有選擇地報(bào)告結(jié)果和偶爾夸大其詞。同行評(píng)議并不絕對(duì)可靠:報(bào)紙編輯更喜歡正面結(jié)果和新聞價(jià)值。多樣化、事件的獨(dú)立信源和復(fù)制更能令人信服。
意義是重大的。用P表示的統(tǒng)計(jì)顯著性表示一個(gè)結(jié)果發(fā)生的偶然性。P=0.01意味著一個(gè)治療的效果發(fā)生的概率是1%,但實(shí)際上可能并沒(méi)有效果。
從無(wú)意義中分離不出影響。統(tǒng)計(jì)上的顯著結(jié)果的缺失,并不意味著沒(méi)有潛在影響:它意味著沒(méi)有發(fā)現(xiàn)影響。一項(xiàng)小型研究可能沒(méi)有能力發(fā)現(xiàn)一個(gè)真正的區(qū)別。
效應(yīng)量很重要。小規(guī)模應(yīng)答不太可能被發(fā)現(xiàn)。一個(gè)重復(fù)多次的研究可能導(dǎo)致具有統(tǒng)計(jì)顯著性的結(jié)果,但只是有一個(gè)較小的效應(yīng)量。不過(guò),一個(gè)效應(yīng)量的影響因素是生物學(xué)、物理學(xué)或社會(huì)學(xué)問(wèn)題,而不是統(tǒng)計(jì)學(xué)問(wèn)題。上世紀(jì)90年代,《流行病學(xué)》期刊要求作者在遞交的手稿中不要使用統(tǒng)計(jì)顯著性,因?yàn)樽髡咄ǔ?huì)曲解顯著性實(shí)驗(yàn)的意義,從而為公共健康政策提供無(wú)效或誤導(dǎo)的建議。
研究相關(guān)性會(huì)限制概括。從動(dòng)物到實(shí)驗(yàn)室試驗(yàn)再到人類(lèi)的概括過(guò)程存在限制。
感覺(jué)影響風(fēng)險(xiǎn)感知。概括地講,風(fēng)險(xiǎn)可以被認(rèn)為是某段時(shí)間里一個(gè)事件發(fā)生的可能性,乘以該事件可能出現(xiàn)的結(jié)果。人們的風(fēng)險(xiǎn)感知受到許多東西的不成比例的影響,其中包括事件的稀有度、他們認(rèn)為能在多大程度上控制,以及風(fēng)險(xiǎn)自發(fā)與否等。例如,美國(guó)人將家里擁有手槍的風(fēng)險(xiǎn)低估了100倍,卻把住宅附近有核反應(yīng)堆的風(fēng)險(xiǎn)擴(kuò)大了10倍。
依賴關(guān)系改變風(fēng)險(xiǎn)。計(jì)算極端潮汐、暴雨等單個(gè)事件的風(fēng)險(xiǎn)存在可能性。但是,如果是相互關(guān)聯(lián)的事件(例如風(fēng)暴引起潮汐或大雨阻止工人進(jìn)入某地),那么它們同時(shí)發(fā)生的概率比預(yù)想中的高。信用評(píng)級(jí)機(jī)構(gòu)斷言,次級(jí)抵押貸款集團(tuán)有一個(gè)非常低的違約風(fēng)險(xiǎn),是2008年信貸市場(chǎng)崩潰的重要因素。
挖掘或遴選數(shù)據(jù)。人們能夠?qū)κ录M(jìn)行安排,以便支持某個(gè)觀點(diǎn)。要解釋孕婦食用酸奶和后代出現(xiàn)哮喘兩者之間的關(guān)系,一個(gè)是需要了解作者是否著手測(cè)驗(yàn)這個(gè)單獨(dú)的假設(shè),或者利用巨大數(shù)據(jù)集得出結(jié)論。相比之下,希格斯玻色子的證據(jù)與研究人員多么努力地尋找它有關(guān)。
極端測(cè)量可能產(chǎn)生誤導(dǎo)。任何測(cè)量(例如給定學(xué)校的效益)將顯示天賦能力(教師能力)差異產(chǎn)生的可變性,加上樣本(孩子),加上偏見(jiàn)和測(cè)量誤差(不同學(xué)校的產(chǎn)出結(jié)果可能采用不同的測(cè)量方法)。但是,由此產(chǎn)生的變化通常只解釋天生能力的差異,但忽略了其他因素。這變成不確定的陳述描繪一個(gè)極端產(chǎn)出(及格率翻倍),或者用平均值比照極端量級(jí)(學(xué)校X的及格率是國(guó)家平均值的3倍)或范圍(最高或最低的學(xué)校之間的差異為 x倍 )。
更多科學(xué)行業(yè)研究分析,詳見(jiàn)中國(guó)報(bào)告大廳《科學(xué)行業(yè)報(bào)告匯總》。這里匯聚海量專(zhuān)業(yè)資料,深度剖析各行業(yè)發(fā)展態(tài)勢(shì)與趨勢(shì),為您的決策提供堅(jiān)實(shí)依據(jù)。
更多詳細(xì)的行業(yè)數(shù)據(jù)盡在【數(shù)據(jù)庫(kù)】,涵蓋了宏觀數(shù)據(jù)、產(chǎn)量數(shù)據(jù)、進(jìn)出口數(shù)據(jù)、價(jià)格數(shù)據(jù)及上市公司財(cái)務(wù)數(shù)據(jù)等各類(lèi)型數(shù)據(jù)內(nèi)容。