協作閣

開源協作部落格

台灣同性婚姻論述分析(I)

從高頻詞看論述

Don / 2019-03-06 /


前言

近年來,同婚議題在台灣社會逐漸受到重視,並在2017年大法官宣布目前保障一男一女的民法婚姻制度違憲之後,更帶來保守派反動力量的復甦。同婚的支持方與反對方之間的對立在2018年大選時達到高峰,首先由反對方(以下一代幸福聯盟為代表)提出了三案公投案,而後支持方(以伴侶盟為代表)也提出了兩案公投案。也因此使得同婚議題浮上政治檯面,無論支持兩好三壞或是三好兩壞,可以說同婚議題首次以如此「高調」的方式登上台灣社會的舞台。

媒體上我們看見各種關於同婚議題的論述,舉凡倫理、家庭、兒童、教育、宗教、法律、性、愛、價值…等,這顯示了同婚議題從來不只是兩個相愛的人是否能夠在制度中結婚而已。兩造立場的論述動用了大量上述列舉的角度來傳播自己的主張,大幅增加了同婚議題的複雜度。

目標

我所好奇的是,究竟兩造立場動用了哪些角度和哪些觀點來宣傳自己的理念?在我們都很清楚兩造立場的對立背後,能不能透過更具體的證據(例如他們所使用的語言)來看出他們論述方式的不同?而我們又能從這些論述方式又觀察到哪些模式?這是我對同婚議題的最關心的地方,同時也能夠從語言學所提供的工具來做觀察和分析。

取材的考量

當然,所謂兩造立場可能是個虛構的概念。我們在各大網路論壇上能看到許多使用者的觀點,可能座落在支持/反對光譜上的某個座標,可能因為某些原因支持而同時因為另一些原因反對。因此我在語料選擇上,決定以官方提供的語料作為分析對象。我預設兩邊的公投發起方:下福盟與伴侶盟,分別處於光譜上的極端兩點,因此我將以這兩個組織的官方網站上的文字為主要分析對象。

方法

透過 python 對兩個組織的官方網站(下福盟伴侶盟)進行爬蟲。將爬下來的文字做前處理,包括斷句、去除非中文字元、以 jieba 套件加上我自定義的詞典進行分詞。如此以來我已能取得能用以觀察分析豐富語料。

另外,這兩個網站都是類似wordpress部落格的形式,因此可以說兩個網站中的文章大致擁有相同的register:都屬於在網路上的「書寫語言」(相對於口語而言),並且每篇文章自成一格,是書寫者單方面向閱聽人傳遞訊息。

有了語料,要如何開始做分析呢?我將以 Paul Baker 於 2006 年出版的 Using Corpora in Discourse Analysis 為藍圖,其中提供了許多利用語料庫做言談分析的方法和案例,包括頻率分析、Concordance、Collocation、Keyness…等。之後沒有意外的話,也會按照這些方法,從爬下的語料中搾出有意義的觀察。

兩份語料的數據

以下資料為2019年3月6日進行爬蟲時所得的數據:

下福盟 伴侶盟
文章數 319 篇 200 篇
中文字元數 484705 字 129932 字
平均每篇字數 1591 字 650 字
總詞數(含重複) 235488 個 63504 個
平均每詞字數 2.1 字 2.0 字
總詞數(不含重複) 33680 個 15851 個
type token ratio 0.14 0.25

首先比較文章數,可以看到下福盟的文章數幾乎是伴侶盟的1.6倍,多出了119篇文章。在包含所有重複的總詞數方面,下福盟的總詞數為伴侶盟的3.7倍。

但有趣的是,當統計不重複的總詞數(word type)時,下福盟只剩下伴侶盟的2.12倍。再看到type token ratio(也就是拿word type除以word token所得的比率,是檢視語料詞彙豐富度的一個指標之一),發現下福盟的詞語豐富度比伴侶盟的還要來得低,幾乎是伴侶盟詞彙豐富度的一半。

以上只是就語料本身的客觀數據進行分析,至於為什麼下福盟的詞語豐富度變得比伴侶盟來得低,要回答這個問題可能就必須進入到語料本身做更細緻的觀察和分析。

前100個高頻詞

我找出了兩份語料中的前100個高頻詞,想看在兩份語料的高頻詞中,有哪些共同出現的詞,而又有哪些詞只頻繁地出現在其中一份語料。

同時出現在兩份語料的高頻詞

若按照詞的主題區分,可以區分如下:

這些詞除了反映討論的議題(婚姻、憲法、法案…等)本身之外,更反映了兩造立場在討論此議題時接聚焦討論的共通話題,尤其是關於兒童的詞彙,頻繁出現在兩邊的論述中,顯示兒童是台灣同婚議題的話題熱點之一(有些是關於收養問題,有些則是下福盟做出「同婚/同運將對兒童造成不良影響」的指控)。與此相關的還有「教育」一詞,同婚議題不只關注兩個人之間的婚姻制度的連結,更折射出「我們應該如何教育下一代」的討論。至於為什麼同婚議題會牽涉「教育下一代」問題,或者換個問法,從論述生產者的角度來看,為什麼教育下一代的問題會「被選擇」作為討論的焦點,或許可以是下一步的討論方向。

只出現於下福盟的高頻詞

歡迎, 發展, 須知, 附, 職業, 行為, 理由, 發生, 想, 朋友, 法, 合法化, 健康, 人民, 事實, 原則, 結合, 投稿, 本站, 一種, 筆名, 編輯, 最新消息, 信箱, 文化, 性行為, 成家, 民主, 完全, 讀者, 同運, 讚, 最大, 媒體, 背景, 性解放, 增刪, 多元, 本名, 不願, 幫, 這種, 兒童, 主流, 收養, 成為, 不要, 保留, 醫療, 刊登, 信時, 調查, 加入, 收到, 宗教, 教授, 非常, 定義, 事, 意識, 粉絲團, 資料, 婚姻制度, 目的, 意見, 色情, 很多, 道德, 爭議

將其中一些詞語分類如下:

我們可以看到關於性的議題大量使用於下福盟的論述。這裡我們還是能問同一個問題:為什麼性行為、性解放、色情這些題目會在同性婚姻議題的脈絡下出現?下福盟這樣的選擇反映出了什麼策略?另外是關於醫療,婚姻制度在什麼意義下與醫療相關,這是一個值得深究的問題。

「同運」一詞(同志運動的縮略詞)的出現,讓我們得以指認使用這個詞的使用者並非同運人士本身,這個詞在下福盟的脈絡下,常常是作為受批判的對象, 諸如「同運團體在學校洗腦學生騙學生同志狼師多p雜交」和「同運不敢面對的真相」…等標題。這反映了台灣脈絡下同志運動的一個有趣的語言使用:「同運」一詞常出現於反對同運者的言論當中;反而是在同志運動者自己的言論中,往往是採用未縮略的形式,也就是「同志運動」來指涉自身參與的運動。

另外,許多詞語看似中性無害,僅僅表達語義和概念,其實在現今的使用中大多隱含有負面的意義,有學者稱之為discourse prosody或semantic prosody。出現在下福盟的高頻字「這種」就是其中一例。例如當我說:「像他這種人…」的時候,你大概就會預測接下來我大概不會做太正面的評斷。此詞的出現或許暗示了下福盟對同婚議題的態度,此詞的大量運用似乎也揭露了下福盟在做論述/宣傳時情緒字眼的直接介入。

只出現於伴侶盟的高頻詞

同婚, 希望, 族群, 一起, 形式, 進行, 黨, 修法, 許秀雯, 直接, 醫師, 現行, 申請, 陳, 跨, 黃, 原文, 公開, 處理, 立委, 多元性, 工作, 香港, 廁所, 性平, 法院, 跨性, 跨性別者, 參選人, 適用, 心理, 新聞, 反同, 行政, 完成, 平權, 愛家, 釋憲, 違憲, 未來, 立法院, 第一, 報導, 提案, 友善, 了解, 草案, 世界, 禁止, 造成, 連署, 連結, 修改, 聽, 話, 登記, 未, 出櫃, 註, 記者, 目前, 二人, 站, 雙性, 專法, 委員會, 台北市, 記, 男性

至於只出現於伴侶盟的高頻詞,一眼掃過去似乎不太有「具煽動性」的字詞。另外,正如同上面對下福盟的討論,從「反同」一詞能看出,這應該是伴侶盟用以指涉「反同方」的詞語,而不會是「反同方」會用來自我指涉的詞語。

小結

這是這一系列的第一篇,將較多篇幅著墨在前言、目標和語料介紹,同時做了初步的高頻詞分析,尤其是觀察只出現在其中一方的高頻詞,就能看到一些有趣的現象。

當然只憑頻率的多寡並不能做過多的推論,因為仍需要檢視該詞是如何使用的。以「性解放」一詞為例,單憑下福盟語料中該詞的高頻出現,並不能馬上確定說下福盟對「性解放」的態度究竟是什麼,必須要進到語料中去看這個詞出現在哪些句子中,而那些句子又是怎麼描述這個詞。另一方面像是「這種」這種在現今中文使用的脈絡下本身就具有負面情緒的詞,似乎能夠直接推論出該語料在情緒表態和情緒煽動上的效果。

另一個有趣的現象是兩邊論述中對於對立方的命名:「同運」方與「反同」方,「同運」方不太會稱呼自己為「同運」,「反同」方更不會稱呼自己為「反同」。這些關鍵詞提供了我們在閱讀某些論述時,判斷該論述立場偏向哪一方的線索。

同婚議題像是個有待詞語照亮的燈籠罩,一個一個的詞語在燈籠裡的不同位置點亮火光,於是兩造立場的論述形成了樣式截然不同的燈籠。當選擇使用(或無意識地使用)一個詞語的時候,同時也是壓抑著其他詞語選項的出現。這或許就是透過高頻詞分析可以看見的,看見一個原本黯淡無光的燈籠如何妝點亮相呈現在世人眼前,為了吸引讀者的目光,或為了影響讀者的想法,當然更讓我們能回頭看見點亮燈籠的人所使用的技巧與手法。