2012年11月4日 星期日

數據要看清楚!(之一)抽樣

真的?假的?或是望文生義?      
圖片來源:http://www.cheersafety.org

        最近在一個「號稱」推廣啦啦隊安全,附屬於 Varsity 集團旗下的「子公司」- AACCA ( American Association of Cheerleading Coaches and Administrators ) 在它的官方部落格的一篇文章中引用了許多篇研究結果與數據,來鋪陳目前啦啦隊的發展有多安全。而這篇文章的也暗示了一個非常令人玩味的結果,並引用了一篇研究報告的結果指出,目前啦啦隊的「運動傷害發生率」比許多運動都要來的低,僅比女子游泳高一些些!這與許多目前的研究結果都大相逕庭背道而馳,於是這不免又引起我耙糞的癮頭......

運動傷害發生率研究原文連結:
http://www.nationwidechildrens.org/cirp-rio-study-reports

啦啦隊受傷率只比游泳高一點點耶!
http://www.cheersafety.org/

        於是乎找出了這篇研究的全文來看一看。這是一篇洋洋灑灑 210 頁,抽樣調查了許多運動項目的傷害發生率的專案研究報告。然而一篇調查研究結果固然重要,但如何產生這些研究結果的過程卻是更重要的。在看不懂一大堆敘述研究結果的英文前,我們可以先看看幾個重要的 Key Word....


首先,我們就從樣本的選取 ( Sample ) 開始看起。

        本篇研究對於所有運動項目樣本的選擇分別採取的「Random Sample,隨機抽樣」以及「Convenience Sample,方便抽樣」,如上圖 紅框 處。既然提到了抽樣,我們就不能不提到統計。

         提到統計學,抽樣當然是接觸統計觀念的第一步,這看似簡單的一步,卻會對研究結果有著動搖國本的影響。而抽樣最常被使用就是「隨機抽樣」,也就是我們最常使用的「抽籤」。簡單的說,隨機抽樣可以說是「亂槍打鳥」。每隻鳥在空中亂飛,獵人扳機隨便扣,打到什麼就是什麼。也就是個個有機會,但個個沒把握。所以統計課本上會說「隨機抽樣是嚴格按照隨機原則來抽取樣本,同時樣本全體中的每單位都有擁有相同的被選取機率。」

        然而本篇研究還使用了另一種抽樣方式「方便抽樣」。方便抽樣簡單的說就是手邊有什麼樣本就用什麼樣本,方便就好。所以統計課本上會說,「方便抽樣並不是嚴格按照隨機原則抽取樣本,而是根據調查者的主觀經驗和主觀判斷選擇樣本的。」

同時,統計課本還會說:

        與隨機抽樣相比,雖然「方便抽樣(非隨機抽樣)」的代表性較差,提供的資料訊息較為零散,比較難從樣本調查的結果準確的推論母群體的樣貌。但是,由於它非常簡便易行,並能通過對樣本的調查而「大致」瞭解總體的某些情況,對調查研究工作很有啟發性。因此,它適用於那種調查對象的總體難以具體界定,以及不需要準確推斷總體情況的調查。

        從這篇研究看來,在啦啦隊這項目的抽樣也同時使用了「隨機抽樣」以及「方便抽樣」,並且方便抽樣的樣本數比隨機抽樣要來的多一些(約多了 50%)。或許是因為運動普及性的關係,在運動項目分類中分為「Original Sports」以及「New Sports」的分類中,如上圖 藍框 處。「Original Sports」所有運動項目隨機抽樣的樣本數都比方便抽樣要來的多(有些項目還是多很多),而幾乎所有「New Sports」中的運動項目方便抽樣的樣本都比隨機抽樣要來的多(就算是少也只是少一個而已)。對照前面統計課本告訴我們的,本篇研究的結果資料在 Original Sports 的數據結果應該會較具有「代表性」,而 New Sports 的數據結果比較適合當參考。

        先不論抽樣方式對於研究樣本總體的代表性,從抽樣數量的觀點來看,僅僅 70 所高中學校的樣本數(橘色框框處)很明顯是無法代表目前美國所有的啦啦隊參與者的。並且以校園內的場邊助陣啦啦隊為樣本主體的推論結果,是否能與性質完全相異的 All Star Cheerleading 一體概括?所以這篇研究先天在啦啦隊項目取得的樣本總數,就已經很明顯的不足以代表所有啦啦隊的參與群體,特別是目前美國啦啦隊參與人數的主體;再加上前面提到,超過半數的參與者樣本並不是以隨機的方式取得,使得這「低受傷率」的數據結果無法有力的解釋啦啦隊目前在運動傷害中真實的樣貌。再回頭對照統計課本的說法,這結果真的只能「僅供參考」。

        所以我們可以知道這研究結果的數據「僅適用於高中校內場邊助陣的水準層級」,根本無法完全套用在全美國參與人數最眾多,同時也是 Varsity 大金庫的 All Star Cheerleading。同時這樣本也無法適用在我們台灣目前的發展環境與技術水平?充其量只是我們擁有相同的 Cheerleading 的字眼,完全無法擁有這麼美麗的數據。同時這篇研究報告並沒有具體的文字說明啦啦隊是相對安全的運動項目,只是呈現出研究者抽樣過後「僅供參考」的數據而已。同時仔細看這份研究報告啦啦隊的部分,我們將會發現更驚人的事實....

所以這篇文章,
充其量只是 AACCA 在說服其追隨者的一套話術罷了。

沒有留言:

張貼留言