
在本書的前言中,著名心理學家 Steven Pinker 坦言:「一次又一次,我對我的國家和物種的既有觀念,被這本書的發現徹底顛覆。」這份智識上的震撼,正是《Everybody Lies》的核心體驗。作者 Seth Stephens-Davidowitz 原是一位「自信,甚至有些自負」的資料專家,深信自己對世界瞭若指掌,直到他偶然發現 Google 搜尋紀錄這座資料金礦,才讓他徹底謙卑下來。
本書的核心論點極具顛覆性:當人們對調查者說謊、對朋友說謊,甚至對自己說謊時,他們卻會對一個地方絕對誠實——那就是 Google 的搜尋框。傳統社會科學因人們習慣說謊而充滿盲點,而這本書將帶領讀者踏上一場智識顛覆之旅,探索作者口中的「數位真話血清」(Digital Truth Serum)如何揭示一個與我們想像中截然不同的人類心理地圖,從隱藏的種族歧視到羞於啟齒的性焦慮,挑戰我們所有關於社會的假設。
為什麼「人人都在說謊」?
「謊言」是理解本書資料分析方法論的基石。在展示巨量資料的力量之前,作者 Seth Stephens-Davidowitz 必須先打破一個普遍的社會假象——我們生活在一個相對誠實的社會中。他指出,這種表面的誠實其實是一種精心修飾後的產物,而這種修飾從根本上構成了傳統社會科學研究的結構性挑戰。
表面誠實的社會,其實充滿修飾
人們在公開場合,甚至在匿名問卷中,都深受「社會期許偏誤(social desirability bias)」的影響,傾向於隱藏自己真實的、但不符合社會期待的想法。這種現象長期以來導致社會科學對現實世界的誤判。
書中引用了幾個經典案例。例如,2016年美國總統大選,絕大多數民調專家都低估了唐納.川普的支持度,因為許多受訪者不願公開承認自己支持一位言論充滿爭議的候選人。另一個更荒謬的例子來自性行為調查:問卷資料顯示,美國異性戀男性回報每年使用16億個保險套,女性則回報11億個——這兩個數字在邏輯上應該相等。然而,根據市場追蹤公司尼爾森(Nielsen)的實際銷售資料,每年售出的保險套其實不到6億個。更 damning 的細節是:光是從未結婚的男性所宣稱的年均用量,加總起來就已超過美國已婚與單身人士的保險套總銷量。
這些案例揭示了傳統研究方法的核心盲點:它們長期依賴「人們所說的」,而非「人們所做的」或「人們真正在想的」,從而導致了對社會現實的嚴重誤判。
說謊成為資料分析的結構性問題
作者指出,傳統資料來源之所以不可靠,並非單純的個案,而是源於幾種根深蒂固的人性偏誤,它們從一開始就污染了資料的真實性:
- 問卷偏誤(Social Desirability Bias): 這是最核心的問題。人們為了符合社會期待或避免被評判,會有意識或無意識地美化自己的答案。他們會誇大自己的投票率、慈善捐款,並隱瞞帶有偏見的想法。
- 回憶偏誤(Recall Bias): 人類的記憶並非精確的錄影機。當被問及過去的行為時,我們的回憶往往是不準確且充滿主觀建構的。
- 自我認知偏誤(People Lie to Themselves): 更深層次的問題是,人們甚至會對自己說謊。超過90%的大學教授認為自己的工作表現高於平均水準,這種自我美化的傾向,使得連最私密的自陳式報告都可能失真。
這些並非傳統研究中的微小瑕疵,而是從根本上毒害資料真實性的系統性問題。它們使得我們賴以理解社會的許多基礎資料從一開始就不可信,從而創造了一個迫切的需求:我們需要一種全新的資料類型,一種能繞過人類謊言的「數位真話血清」。
搜尋引擎如何成為「數位真話血清」
在充滿謊言的資料環境中,Google 等搜尋引擎的出現,無疑是一場革命。作者將其比喻為「數位真話血清」(Digital Truth Serum),因為它提供了一個獨特的場景,讓數十億人能夠在完全私密的狀態下,卸下所有社會偽裝,坦承內心最深層的恐懼、慾望與困惑。這使得搜尋紀錄成為了窺探人類心靈最珍貴的資料來源之一。
為什麼搜尋紀錄特別誠實
搜尋行為之所以比問卷調查或社群媒體貼文更誠實,源於其三個核心特質:
- 私密的(Private): 當我們在搜尋框中輸入文字時,我們是獨自面對螢幕的。沒有觀眾,沒有評判者,我們不必擔心家人的驚訝、醫師的皺眉或朋友的議論。
- 即時的(Immediate): 搜尋行為往往反映了當下最直接、最未經修飾的需求與衝動。它是一個即時的念頭,而不是深思熟慮後準備呈現給他人的答案。
- 不需對他人負責的(No Accountability): 在搜尋框中坦白,沒有任何社會懲罰的風險。人們與其說是在「查詢」,不如說是在「告解」。他們會安心地輸入那些在現實生活中絕不敢說出口的話,例如「我恨我的老闆」、「我喝醉了」,甚至是令人心碎的求助:「我爸打我」。
正因如此,人們會向 Google 坦承那些連對最親密的伴侶、醫師或心理治療師都難以啟齒的真實困惑與慾望。
Google 搜尋不是為了「表態」,而是為了「求助」
作者提出了本書最關鍵的洞見之一:搜尋並非一種「表演」,而是「需求的直接反映」。這與社群媒體的本質截然不同。在 Facebook 或 Instagram 上,我們精心策劃、發布的內容是一種「展演自我」的行為,目的是為了塑造一個理想的公開形象——快樂的家庭、成功的工作、精彩的假期。
相比之下,Google 搜尋是一種「低社會修飾、低表演性」的行為。我們使用搜尋引擎,不是為了告訴世界我們是誰,而是為了尋求資訊、解答疑惑或滿足需求。這種本質上的差異,賦予了搜尋資料無與倫比的力量,使其能夠穿透社會的層層偽裝,揭示最真實的人性。這些誠實的資料,也將徹底顛覆我們對許多社會議題的既有認知。
當搜尋資料推翻我們對社會的既有想像
誠實的資料具備強大的力量,它能夠挑戰、甚至顛覆我們長久以來對社會的標籤和刻板印象。傳統民調和媒體敘事常常描繪出一個逐漸進步、偏見日益消弭的社會樣貌,但搜尋資料卻揭示了完全不同的現實。本章節將以「種族歧視」為例,展示資料如何揭示一個隱藏在公開言論之下的、更為複雜與黑暗的社會真相。
搜尋揭露的「隱藏偏見」
本書中最具衝擊力的案例,莫過於對美國種族歧視議題的分析。在歐巴馬當選總統後,許多公開民調與學術研究都顯示,美國已進入「後種族時代」。
然而,Google 搜尋紀錄卻描繪了截然不同的景象。作者發現,帶有高度歧視性的關鍵字,如「黑鬼笑話 (nigger jokes)」,其搜尋量驚人地高。更令人不安的是,在歐巴馬首次勝選當晚,每100筆包含「歐巴馬」的搜尋中,就有大約1筆同時包含了「KKK」或「黑鬼 (nigger)」這類詞彙。
這兩組資料的巨大差異揭示了一個深刻的現實:關鍵不在於誰對民調說了謊,而在於我們過去的研究方法只能觸及那些「願意被說出口的態度」。搜尋資料則像一面誠實的鏡子,照出了隱藏在社會水面下,那座巨大而沉默的偏見冰山。
地圖會說謊,人會說謊,搜尋資料不會美化
作者不僅揭示了偏見的存在,更利用地區性的搜尋資料差異,重新繪製了一幅美國的「種族歧視地圖」。這幅新地圖徹底顛覆了「南方保守、北方進步」的傳統簡化敘事。資料顯示,種族歧視性搜尋最頻繁的地區,不僅包括傳統的南方州份,還大量集中在紐約州北部、賓州西部、俄亥俄州東部以及工業化的密西根州等地。
這幅地圖的預測能力在川普的崛起中得到了驚人的驗證。資料分析師 Nate Silver在試圖解釋川普為何能吸引廣大支持時,檢視了各種可能的變數,最終發現,與川普在共和黨初選中支持度「相關性最高的單一因素」,正是這些地區的種族歧視性搜尋頻率。
這一發現的深層意義在於,資料的力量不僅是證實我們的猜想,更是挑戰我們習以為常的標籤,迫使我們更精準、更誠實地理解社會的複雜紋理。當資料展示出社會隱藏的偏見後,它同樣能深入到更私密的個人領域,揭開另一層謊言的面紗。
性、親密關係與羞於承認的真實需求
「性」與「親密關係」無疑是社會謊言的重災區。在這個領域,人們的出於羞恥、不安或維護形象的動機,往往會對外呈現出經過高度美化的版本。因此,這裡也成為了驗證 Google 搜尋資料誠實性的絕佳場域。當傳統問卷失效時,匿名搜尋揭示了人們在私密生活中最真實、最脆弱的焦慮與需求。
問卷裡的性行為,為什麼永遠對不起來
本書開篇便用一個經典案例,揭示了自陳式資料在性議題上的不可靠性。傳統社會調查顯示,異性戀男性與女性回報的性行為頻率和保險套使用率存在巨大且無法解釋的鴻溝。更具說服力的是,當這些問卷資料與實際的保險套銷售資料對比時,謊言昭然若揭。無論男性還是女性,似乎都傾向於誇大或美化自身的性生活。這再次證明,當議題涉及個人隱私與社會評價時,依賴人們的口頭回報是極其危險的。
搜尋資料揭露的真實焦慮
相較於問卷中那個充滿活力與激情的性生活圖像,Google 搜尋描繪的畫面則顯得更加焦慮與真實。在私密的搜尋框中,人們坦承了那些在公開場合被淡化,卻在內心深處翻騰的困擾:
- 性生活不足(Sexless Marriage/Relationship): 資料顯示,「無性婚姻」的搜尋量是「不快樂婚姻」的3.5倍,是「無愛婚姻」的8倍。這表明,性生活的匱乏是許多伴侶關係中一個巨大但羞於啟齒的核心痛點。
- 身體焦慮(Body Anxiety): 男性對自身性器官的深度焦慮令人震驚。書中指出:「男性針對其性器官的 Google 搜尋提問,比他們對肺、肝、腳、耳、鼻、喉和腦部加總起來的提問還要多。」而女性最常見的擔憂,則是關於私密處的氣味,這幾乎可視為女性版的陰莖尺寸焦慮。
- 親密關係中的不安全感(Insecurity): 搜尋資料中還充斥著對伴侶忠誠度的懷疑(例如:「我老婆出軌的跡象」)以及對自身吸引力的不確定感。這些搜尋共同揭示了人們在親密關係中最深層、最脆弱的一面。
雖然這些誠實的資料為我們提供了前所未有的洞見,但作者同樣保持著科學家的警惕,提醒我們資料並非萬能,它的力量伴隨著特定的局限性。
資料不是全知,但比直覺誠實
儘管作者在書中高度推崇大數據,特別是搜尋資料在展示人性方面的革命性潛力,但他同時也保持著極為清醒與嚴謹的態度。他深刻地意識到資料的局限性,並對當前社會上普遍存在的「大數據萬能論」迷思提出了有力的警告。對作者而言,資料是工具,而非神諭。
作者對「大數據迷思」的自我警惕
作者破除的第一個迷思是,大數據的力量不在於「大」。他指出:「我相信,一個資料集的大小經常被高估了……Google 搜尋之所以如此有價值,主要原因並非其數量龐大,而是人們在其中表現得如此誠實。」這本書的核心並非讚頌資料的「量」,而是強調資料的「類型」與「誠實度」。
第二個核心觀點是:資料本身不是答案。它非常擅長告訴我們「發生了什麼」(What),但往往無法直接回答「為什麼」(Why)。例如,Walmart 的資料顯示,在颶風來臨前,草莓口味的 Pop-Tarts 餡餅銷量會飆升七倍,但資料本身無法解釋為什麼偏偏是草莓口味。資料可以展現相關性,但因果關係的探尋與最終的價值判斷,仍然需要人類的洞察力與倫理思考。
真正危險的不是資料,而是過度解讀
作者強調,資料本身是中性的,真正的危險來自於使用者對資料的盲信與過度解讀。他特別提醒讀者必須注意以下三大限制:
- 可量測不等於重要(Measurable doesn’t equal important): 資料科學家往往會陷入一個陷阱,即過度關注那些容易被量化和測量的指標,而忽略了那些雖然更重要,但難以用數字捕捉的面向,例如幸福、信任或創造力。
- 相關不等於因果(Correlation is not causation): 這是資料解讀中最經典也最容易被誤解的原則。兩個變數同時出現,不代表其中一個導致了另一個。辨別相關性與因果關係,是資料分析中最關鍵、也最需要嚴謹方法論的一環。
- 搜尋誠實不代表人性可以被簡化(Search honesty doesn’t mean humanity can be simplified): 搜尋資料之所以珍貴,是因為它揭示了人性的複雜、矛盾與掙扎,而不是為人性提供一個簡單的、可以被輕易化約的公式。將資料視為理解人性的起點,而非終點,才是正確的態度。
對資料局限性的清醒認知,最終引導作者回歸到一個更根本的問題:我們所談論的「誠實」,其本質究竟是什麼?
重新理解「資料的誠實與謊言」
本書的探討最終從資料科學的方法論,提升到了一個更具哲學意味的層面。作者引導我們深入思考,「誠實」本身並非一種穩定的人格特質,而是一種高度依賴情境的產物。理解這一點,不僅能幫助我們更好地解讀資料,更能讓我們對人性的複雜性抱持一份清醒與謙卑。
人不是比較誠實,而是情境不同
作者的核心洞察是:人類的表達方式會根據「是否被觀看」而產生劇烈的調整。我們在不同的舞台上,會扮演不同的角色,說出不同版本的話語。Google 搜尋之所以能成為「數位真話血清」,其根本原因在於它創造了一個獨特的「無舞台」情境:
- 沒有觀眾: 在搜尋框面前,我們是唯一的表演者與觀眾。
- 沒有評分: 我們的搜尋不會被按讚、不會被評分,也沒有社會比較的壓力。
- 沒有社會懲罰: 我們不必為腦海中閃過的任何念頭、慾望或偏見承擔被指責的風險。
這揭示了人性的一個深刻洞見:誠實與否,很多時候並不取決於我們的道德品質,而取決於我們所處的「舞台」是否存在。當舞台撤去,當聚光燈熄滅,我們才會展現出那個未經修飾的真實自我。
《Everybody Lies》的核心提醒
本書的最終價值主張,並非是讓我們利用資料變得更冷酷、更善於算計。恰恰相反,作者認為,資料科學的真正力量,在於它能讓我們以一種前所未有的方式,更誠實、更謙卑地去理解人性的複雜與掙扎。
當我們透過資料,看到無數人在私底下搜尋著與我們同樣的焦慮、不安與困惑時——無論是關於「無性婚姻」的痛苦,還是對自身外貌的擔憂——我們應當意識到,那些看似完美的社會表象之下,隱藏著普遍的人類脆弱性。正如作者所強調的,當我們透過資料看見他人的真實困境時,我們應該變得「更謙卑,而非更武斷」。這份由資料驅動的同理心,或許才是這場大數據革命帶給我們最寶貴的禮物。
資料不會說謊,但我們會
《Everybody Lies》這個書名,並非一句憤世嫉俗的道德譴責,而更像是一份對人類行為現實的客觀描述。Seth Stephens-Davidowitz 以海量的資料和生動的案例,向我們證明了:在社會的舞台上,謊言是常態,是我們用以潤滑人際關係、維護自我形象的必要工具。
然而,在數位時代的隱密角落,我們留下了無法被輕易抹去的真實足跡。本書最深刻的啟示在於,Google 搜尋之所以能「比你更懂你」,並非因為演算法比人腦更聰明,而是因為它忠實地記錄了你生命中那些「不需要演給任何人看的那一刻」。在那個瞬間,沒有社會期許的壓力,沒有自我審查的束縛,只有最赤裸的需求、最直接的恐懼和最坦誠的慾望。正是這些由無數個「真實瞬間」匯集而成的資料洪流,為我們提供了一把前所未有的鑰匙,去解開關於我們自己和我們所處社會的、最深層的秘密。
發佈留言