國立中正大學
大規模的漢語似詞判斷研究

雙音節判斷

  搜尋資料庫

主介面其他介面

  (請參考這裡 包含的各個檔案變相的解釋內容)

  關於實驗

    測驗流程

     實驗參與者需執行四項測試,依序如下:慣用手測試(屬實驗參與者個人資料的一部份)、評估詞彙量的詞彙判斷測驗、閱讀廣度測驗以及似詞判斷實驗。所有實驗皆使用E-prime 2.0軟體(Schneider et al. 2002)設計後,再予以執行。由於前測到主似詞判斷實驗需花費三小時才能完成,因此將實驗分為兩個階段。第二階段可於當日不同時段執行(於中午兩小時的休息之後)或者於其他時段執行(ㄧ到十天以內)。

    實驗參與者

    本實驗招募國立中正大學共114位研究生及大學生。年齡分佈為18至27歲(平均21歲)。其中有四位實驗參與者(兩位男生及兩位女生),因未執行第二階段測驗,實驗結果不予使用。所有參與實驗的實驗參與者皆無視覺及聽覺問題且無腦部損傷。參與研究實驗的人可獲得參與實驗的報酬,且基於研究倫理準則,會要求實驗參與者簽署知情同意書。同意書中說明實驗參與者有權退出實驗且無需承擔任何責罰,且實驗參與者同意將其資料以不具名方式公開在線上語料庫。

    慣用手問卷

      材料

       我們使用直接由英文翻譯成中文的愛丁堡慣用手評量(Oldfield, 1971)。本評量調查受試者關於左手和右手的使用偏好,左右腳或左右眼在各種情況下的活動情形(例如:書寫、拋擲物品、使用牙刷、踢擊物品),以1至5分給分。請參考 這裡來了解本問評量中關於受試者的資料以及慣用手測驗之內容。

      測驗流程

      受試者將會在電腦螢幕上看見各種活動名稱的文字以及五個選項;五個選項分別對應五個數字。這五個選項分別是:(1)你使用右手、(2)你只使用右手且從不使用左手、(3)你使用左手、(4)你只使用你的左手且從不使用右手、(5)兩隻手都可以。作答沒有設定時間限制,本評量約需5分鐘完成。所有作答分數將由測驗總題數所平均,來得到每位受試者整體慣用手測驗分數。為了方便資料庫使用,此五級制的分數將被轉換成-2(強烈傾向使用左手)到+2(強烈傾向使用右手)的形式。

    詞彙判斷測驗

      材料

       本測驗由120個中文的真雙字詞和120個中文假雙字詞組成。其中120個真雙字詞是選自中央研究院現代漢語語料庫詞頻統計(Accumulated Word Frequency in Sinica Corpus; Chen et al., 1996)中的低頻詞。假雙字詞則是以具有可構詞特性的字詞所組成,因此該字詞欲表達的語意是清楚的。如此一來實驗參與者將無法單從可構詞性特性來猜測這些假雙字詞在非詞彙環境中的語意。假雙字詞是藉由對應真實字詞的合乎語法的詞彙內部構詞結構所建構而成。舉例來說,真詞「藥理」yàolǐ是對應一個有關於醫藥的理論;而就假雙字詞「戟曲」jǐqǔ的情況來說,「戟」是一種「武器」,「曲」的語意是「歌曲」,所以這個假雙字詞可以被理解成是一首跟武器有關的歌曲。
      為了減輕實驗參與者的負擔,在前導測試(pilot test)後,我們將原本的120字詞/假雙字詞減少至21組的雙字詞(避免影響主要實驗的最大限度),其測試準確率皆低於90%。

      測驗流程

      實驗參與者在詞彙量測驗開始前,會被告知實驗過程中,必須先判斷螢幕上顯示的字詞為真字或假字。若為真字則在鍵盤上按下Yes鍵;反之,若為假字則按下No鍵。在實驗流程介紹後,會有四組練習題,測驗判斷並無時間的限制,且反應時間也不會被記錄。整個測驗約需花費5至10分鐘。雖然如何有效評估詞彙量的方法仍存在許多爭議,但無時間限制的詞彙判斷結果已顯示與傳統詞彙量評估有相互關聯性。

    閱讀廣度測驗

      實驗語料

      我們參考Kane et al. (2004) 的框架設計閱讀廣度測驗,並從中研院平衡語料庫(Chen, et al. 1996)中隨機選出共60句語意互不相關的句子。句子長度從13到16個字不等。60句子中的30句被更改其中字詞,因此形成語意怪異的句子。最終,我們有30句屬正常語意句子以及30句屬語意怪異的句子,如(1)跟(2)所示。此60個句子隨機分配到5個測試級別,從級別2(2個句子)到級別6(6個句子)。每個級別會有三組題目。每個句尾會出現隨機產生的0到9數字。

(1) 語意正常:

王太太又為他特別做了幾樣拿手好菜

(2) 語意奇怪:

*有些人一生的會議都是混淆不清的。

      依照Kane et al. (2004, p.198)的方式,閱讀廣度測驗首先計算每組測驗題目記憶下來的數字之排序正確度(每組題目記憶的回答數字群視為一個字串) ,將其除以該階段出現的項目數。然後將各個測驗階段測試所得的比例平均化。然而,是否能將此分數詮釋為工作記憶的記憶容量問題而不是短期記憶問題,憑藉在實驗參與者是否專注於句子的理解及閱讀。我們延伸Kane et al.的看法,以是否正確辨別出有意義的句子及將每位實驗參與者的兩項比例相成,藉此加重閱讀廣度分數。因此如果實驗參與者在數字回憶有良好的表現,但是卻在語意判斷中表現偶然機率的表現(0.5),則該實驗參與者最後的分數會是0.5而不是1。

      實驗流程

      開始閱讀廣度測驗時,實驗參與者被告知需先判斷句子且記住每一個句子之後的數字。實驗參與者也被告知將不能更改其答案。在實驗介紹完成後,有兩組第二階段的閱讀廣度測驗讓實驗參與者練習。在受測過程,每一位實驗參與者看到三組句子及數字,含括第二至第六階段句子類型。實驗參與者於測驗過程中,首先看到一個句子其後伴隨著一個數字(0-9)。實驗參與者閱讀句子與記憶數字時,並無時間上的限制。當實驗參與者做好作答的準備時,則可按下空白鍵。之後,必須判斷句子是否符合語法。完成每組句子判斷後,實驗參與者必須回想出剛才記憶下來正確的數字順序。舉例來說,實驗參與者判斷第二階段類型的句子時,需回憶兩個數字。句子與記憶數字均無時間上的限制。此測試約需花費10分鐘完成。

  似詞判斷測驗

    材料

    每個語料是由兩個注音符號的非詞彙音節隨機組合。這些音節語料取自於音節判斷實驗的3274個音節語料及33個隨機取樣的輕聲非詞彙音節。因此,組成共10,936,249 (3307*3307) 雙音節字詞。從中,我們再隨機挑選出3000項語料,舉例如下。在所有可能組合成的雙音節字詞中,我們進一步將含有無聲音節的雙音節字詞分成三類,每一類有11個隨機選取的語料:輕聲+非輕聲(例如: ㄕㄧㄣ˙ ㄕㄝ),非輕聲+輕聲(例如: ㄑㄩㄡˇ ㄘㄩㄠ˙),輕聲+輕聲(例如: ㄘㄨ˙ ㄈㄨㄣ˙)。因此,在3000項實驗語料中,33項屬於輕聲音節的字詞,符合漢語真詞中輕聲音節所佔的比例(Tsai, 2000),而剩下2967項非輕聲的雙音節語料則是由不含輕聲的雙音節字詞中隨機選取。由於實驗需要實驗參與者判斷大量的語料,因此實驗分成兩階段執行。每個階段有1500項測試語料須判斷。

    實驗流程

    實驗參與者會看到3000個非詞彙的音節,分成兩階段(第一、二階段各有1500項非詞彙音節的語料)。實驗語料經過隨機排序後,再呈現在螢幕上。主實驗開始前會有四題練習階段使實驗研究參與者熟悉實驗操作模式(或是在這個第二階段實驗中,使他們再次熟悉該實驗),而在每次實驗中,實驗參與者判斷完80組語料後,會有一個無限時間的休息頁面跳出。實驗參與者便可以逕行休息。休息結束後,實驗參與者需按下空白鍵繼續實驗。

    實驗參與者會被要求分別把左右手先放至在鍵盤上,接著盡可能快速地判斷每筆實驗語料。如判斷結果為「像國語」,則按下「L」鍵(右手);若「不像國語」,則按「S」鍵(左手)。每組語料出現之前,螢幕上會先顯示「+」記號並停留在螢幕上1000毫秒(1秒)的時間,以確保當語料出現時,實驗參與者的眼睛專注於正確的位置。之後出現的實驗音節語料會顯示在螢幕上最多4000毫秒。當研究參與者判斷時間超過4000毫秒,或是按下「L」或「S」鍵完成判斷後,該筆實驗語料判斷程序則會結束,並進行至下一筆語料判斷。

    我們在前測中發現,實驗參與者在4000毫秒內判斷每筆雙字詞有其困難。因此,在練習階段,參與者可以藉由練習用的語料(這些語料並不會使用於主實驗中)逐漸習慣在4000毫秒中做出判斷。實驗的練習語料設置如下:ㄧ開始,參與者需在8000毫秒內做出判斷,之後縮短為6000毫秒,最後兩組練習語料,研究參與者則需在4000毫秒內做出判斷。

    參考文獻

      Chen, K. J., C.R. Huang, L. P. Chang & H.L. Hsu. (1996). SINICA CORPUS: Design Methodology for Balanced Corpora. Proceedings of PACLIC 11th Conference, 167-176.

      Kane, M. J., Hambrick, D. Z., Tuholski, S. W., Wilhelm, O., Payne, T. W., & Engle, R. W. (2004). The generality of working memory capacity: A latent-variable approach to verbal and visuospatial memory span and reasoning. Journal of Experimental Psychology: General, 133(2), 189-217.

      Mochida, A., & Harrington, M. (2006). The yes/no test as a measure of receptive vocabulary knowledge. Language Testing, 23(1), 73-98.

      Oldfield, R. C. (1971). The assessment and analysis of handedness: the Edinburgh inventory. Neuropsychologia, 9(1), 97-113.

      Schneider, W., Eschman, A., & Zuccolotto, A. (2002). E-Prime: User's guide. Psychology Software Incorporated.

      Tsai, C. H. (2000). Mandarin syllable frequency counts for Chinese characters. Chi-Hao Tsai’s Technology Page. Retrieved July, 4, 2009.



© 2015 Institute of Linguistics, National Chung Cheng University. All Rights Reserved.