文本情緒推論:封閉式與開放式詞彙分析比較
封閉式詞彙分析(closed vocabulary analysis)與開放式詞彙分析(open vocabulary analysis)是兩種電腦化文本分析(computerized text analysis)取徑。前者主要依據一套依心理語文屬性編列的詞典,記算各詞類(例如,正向情緒詞)於文本中出現的頻次。心理學家發現這些詞類的使用確實能反映書寫者的內在狀態。後者則是使用機器學習演算法或人工智慧(artificial intelligence, AI)語言模型,直接針對文本抽取語文特徵,例如,以AI語言模型針對文本詞彙生成相應的語意表徵。過去研究發現開放式詞彙抽取出的語文特徵比封閉式詞彙分...
Saved in:
Published in | 中華心理學刊 Vol. 67; no. 1; pp. 101 - 118 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
五南圖書出版股份有限公司
01.03.2025
|
Subjects | |
Online Access | Get full text |
ISSN | 1013-9656 |
DOI | 10.6129/CJP.202503_67(1).0005 |
Cover
Summary: | 封閉式詞彙分析(closed vocabulary analysis)與開放式詞彙分析(open vocabulary analysis)是兩種電腦化文本分析(computerized text analysis)取徑。前者主要依據一套依心理語文屬性編列的詞典,記算各詞類(例如,正向情緒詞)於文本中出現的頻次。心理學家發現這些詞類的使用確實能反映書寫者的內在狀態。後者則是使用機器學習演算法或人工智慧(artificial intelligence, AI)語言模型,直接針對文本抽取語文特徵,例如,以AI語言模型針對文本詞彙生成相應的語意表徵。過去研究發現開放式詞彙抽取出的語文特徵比封閉式詞彙分析中的詞類,更能正確預測書寫者的性別年齡等變項。然而,這些人口變項往往對應了特定詞彙的使用,但這些詞彙卻可能不曾被收錄於封閉式詞彙分析的詞典中,如此有可能只有利於開放式詞彙分析。同時,這些研究並沒有比較過AI語言模型,以及它們都是以線性迴歸模型檢驗語文特徵預測依變項的正確率。基於上述幾點,本研究改以書寫方式較為豐富多變的情緒文本為刺激材料,使用三種封閉式詞彙分析詞典與一個AI語言模型Bidirectional Encoder Representations from Transformers(BERT),對這些文本抽取語文特徵。然後訓練一個三層神經網路(非線性模型)根據這些語文特徵預測文本的情緒價性。結果發現,使用BERT能更正確地預測測驗文本的情緒價性,這應該是因為BERT生成的語意表徵也能表徵語徑脈絡所致。 |
---|---|
ISSN: | 1013-9656 |
DOI: | 10.6129/CJP.202503_67(1).0005 |