Classification of Formosan Languages: Lexical Evidence
暂无分享,去创建一个
台灣南島語言的分類問題至今仍然沒有令人滿意的解決方案。本文嘗試以作者歷年來所鑑定的同源詞的多寡來計算各語言之間的親疏關係和彼此的距離。 我們的計量方法是根據遺傳學界所發展出來的運算方式,以電腦計算,然後再以人工換算成距離而繪成樹圖。今日仍然存活的語言共有十四種和已消失的五種語言資料都作為比較研究資料。前者各種語言各約有一千個詞項,而後者各種語言各的有四百個詞項(所鑑定的同源總數約一千一百個)。因為材料不平衡,所鑑定的同源詞前者自然遠多於後者,在計量方面也就有必要做一些調整,本文採用了Jaccard的「係數原理」。即使經過調整,五種消失語言的同源詞數量仍然偏低,因此表面看起它們自成一群。 惟獨保存在兩種語言之間的同源詞(exclusively shared cognates)最能顯示它們的親密關係。然而,有好多對(pairs)的語言極少或沒有任何這一類的同源詞。因此,我們不能根據這種資料繪成樹圖。我們仍然要以第一對語言之間所保存的同源總數,來計算它們之間的親疏距離。此外,每種語言是以單一方言作為代表,還是綜合各種方言的資料來統計同源詞數字,所得的結果也會略有不同:兩種樹圖就顯示魯凱語的歸屬不同。 較低層次的關係(如泰雅和賽德克,卡語和沙語)顯而易見,不成問題。而較高層次問題就很多了,正如樹圖中所顯示的,各組語言的共同歷史很短暫。 本文所採用的方法和傳統的詞彙統計法(lexicostatistics)有所不同。第一,詞彙統計法每次只比較兩種語言,而在本文所有的語言都一起比較,以標準誤差來檢查錯誤。第二,詞統計法只用一百或二百個基本詞彙,而在本文使用所有的詞彙,因為資料愈多錯誤愈少。 以詞彙的證據作為語言分類的依據,和以音韻或句法的證據,所得的結果大致相近,但也有一些出入。以不同的證據和方法所得的結果都可作為分類的參考。本文嘗試一種新的計量方法,希望提供一種新的分類證據。