分類的人如何被分類?/陳志賢
當法國思想家布迪亞(Pierre Bourdieu)於1960年代進行藝文品味的問卷調查時,他很快就發現,音樂是所有藝術中最具有「精神性」(spirituality)的,也最能做為階級分類區異的指標,三分之二的低教育程度法國受訪者無法從提供的十六人名單中指認超過兩位作曲家,高教育程度者如此的比例僅有百分之七,而且近八成的大學教師認得十二位以上作曲家,低階藍領與白領勞工能這樣的人數是零。布迪亞因此宣稱,音樂是最純粹的藝術,它的直觀來自於身體感官於特定物質環境的耳濡目染,遠非後天勉力學習所能企及。
四十多年後一群英國學者執行的「文化資本與社會排除」(Cultural Capital and Social Exclusion)研究案仍然發現類似的現象,即使高低文化雜食趨勢興起,當代與傳統音樂界限漸趨模糊,古典音樂依舊是菁英的標誌,足以召喚公眾的欽羨折服與添增成為領袖的合法性。更有甚者,音樂是所有藝術中最愛恨分明的,受訪者對大多音樂類型如不是熱情擁抱,往往就嗤之以鼻,很少選中間值。連跨界雜食都有明顯極限,如重金屬音樂就專屬特定群體。所以從音樂的品味喜好,不難猜出聽音樂者的階級、年紀與族群背景,反之亦然。
當今音樂串流方便,輕鬆游移在各種數位載具上,不少人開始質疑文化區異的持續性,畢竟聆聽陌生群體的音樂不再遙不可及,打破品味的階級牢籠可能只要觸擊鍵盤的一指之力而已。許多軟體推薦與各方好友交換的playlist,加上隨機播放的功能,愛樂者很容易在下一首歌曲中,毫無防備地與迥異品味展開第一次接觸、進而墜入愛河。布迪亞的當代支持者可不這麼樂觀,他們反而更擔心電腦程式演算法的同溫層過濾效應,以往唱片行裡與唱片錄音帶B面中,跟新音樂不期而遇的驚喜,會不會在開啟數位音樂平台、戴上耳機的瞬間就此一去不返?
今年初劍橋大學與賓州大學的研究團隊在Psychological Science期刊發表的一篇論文指出,音樂的品味偏好確實具有模式規律,並非單純個人隨意選擇。他們從網路召募了兩萬多名志願者,讓他們聆聽並評估二十五首專家事先分類過的音樂片段,結果再與他們於網路完成的人格測驗進行相關分析。研究顯示,除了良心型人格與音樂喜好無顯著相關外,開放性人格偏愛複雜深奧音樂,對過甜過軟的音樂不屑一顧,而外向型人格正好相反,欣賞直接簡單不做作的音樂。易相處的人格給多數音樂高分,而神經質人格則傾向都給低分。
雖然這項心理學研究並未觸及階級文化區異的問題,卻已對數位科技創造更多元自由音樂環境的說法提出質疑。細心的人還可能察覺,這項研究中五種人格的測驗量表怎麼似曾相識?沒錯,不久前涉嫌非法盜用八千萬位臉書使用者資料的Cambridge Analytica政治顧問公司,即是透過也曾在劍橋大學任教的Aleksandr Kogan所設計之人格測驗app,而獲取這些大數據。兩者差別在於音樂與人格的研究是由自願者上網填答問卷,而Kogan的研究表面上也如此,實際上卻在未明白告知的情況下,偷偷將填答者的臉書個人與好友相關檔案與動態等「數位足跡」一網打盡。
不滿者批評Kogan的人格測驗app是標準的屠城木馬,看似學術研究,實則為商業與政治考量而操作。不僅資料海量,發展出來的演算法與模式還能藉由反覆湧進的新資訊與使用者的實際作為而修正優化。由人格預測音樂偏好只是小菜一碟,客製化精準地瞭解與影響這些網民才是真正目的。脫歐成功與川普當選美國總統的過程中,這隻木馬到底發揮多大的作用還待釐清,然而可以肯定的是,Cambridge Analytica擁有的是Bourdieu多年田野調查都無法望其項背的大數據!
Kogan本人倒是頻頻叫屈,他先是宣稱這些數據雖大,卻沒傳言般的神奇價值,據此而做的針對性廣告行銷多未達預期成效。他然後強拉整個學界下水,抱怨偷竊網路使用者資料的學者多如過江之鯽,為何對其責難特別多。BBC為了查證Kogan說法的正確性,訪問多位資料科學家,一般同意大數據預測與操控的技術能力尚在發展階段,整體效果不宜誇大,不過其中具有強烈偏好傾向者的資料相對簡單突出,才是目前業界預測操控的重點,尤其在緊繃的投票關頭與旗鼓相當的市場競爭中,掌控這群人的數位資料,確實可能產生不成比例的強大影響力。
至於學界共犯的指責也有相當的真實性。一組瑞典與波蘭的研究團隊從2014年到2016年間,利用名為Scraper的程式下載超過三億六千萬位臉書使用者的詳細資料,去年他們在Entropy期刊所發表的論文就提及輕易獲取大筆個人資料的危險隱憂。紐約時報也披露學界過去十年中以類似方法蒐集資料者不勝枚舉,如何記錄、保護、與使用資料又缺乏共同遵守與監督的SOP,即使不因政商誘惑而出賣資料,仍難保資料不外流、不被誤用。儘管資料多已匿名化(de-identification),只要足夠的交叉比對,其實很容易就再具名化(re-identification)。2015年Science期刊的一份研究就表示,一份信用卡消費資料加上四筆隨意提供的社群媒體訊息,資料科學家就可以成功預測百分之九十以上的消費者身份。這樣的資料與精確的身份倘若流落到有心人士手中,後果就不堪設想。
五月二十五日起歐盟將根據新的一般資料保護規範(General Data Protection Regulation, GDPR),保障公民與住民的隱私與數位權,賦予個資當事人取得、修正、刪除、攜取、限制處理、與拒絕提供資料等權利,違者最高將面臨兩千萬歐元或全球營運所得百分之四的罰款。即使有人擔憂規定不利於剛加入數位市場競爭的中小型業者,卻無損於既有優勢平台的網絡效應,新的措施還是普遍獲得肯定,希望要求數位高科技業者賺錢之餘,多關照幫產業生產真正價值的個資所有人。
臉書也已經開始檢討並限縮學者擷取平台資料的權限,只是這樣一來,資料分析的權力恐怕會拱手讓予業者內部工程師以及少數親業界的學術研究人員,令人擔心的是:數位媒體與平台選擇學者合作、允許擷取資料的標準為何?誰來決定?誰來監督與負責?除了部分資料蒐集過程淪為地下化之外,在高薪的引誘下,還可能迫使大數據分析的學者從學界轉至業界。而仍留在學界的研究者該如何面對數位資料的人權保障與平台業者倚賴個資生產買賣的資本邏輯?
相對於美國,台灣業者研發支出偏低,也較少高薪大批地聘請博士或向學界挖角,或許產學合作是項既變通又省成本的經營策略。部分大學的實驗室或研究中心因此如同業者外包的研發部門,投入國家教育預算,以學術研究之名,大方使用國民個資與公部門各種統計數據,研究主題與提問方式卻多以發達私人企業利潤為依歸,分析結果遂變身為商業機密。貢獻個資的當事人被蒙在鼓裡,無從分享研究與利潤,研究者則如爺們般光鮮遊走產學兩端。而當越來越多學者捲進產官學共同體時,往往代表越來越少人能以獨立第三者的身份監督資料與知識的濫用,大學也越來越跟產業靠攏、不敢跟產業say no。
布迪亞的品味調查規模如今看來是小巫見大巫,但是他的田野心得依然發人深省:分類者人恆分類之。用什麼方式分類評估音樂就透露他是什麼類型的人,同樣地,用什麼樣的方式進行產學合作、分析大數據,無意間也顯現他是什麼類型的學者。不懂得因利益衝突而迴避,只會讓這些一向躲在暗處監視他人作為的研究者與業者,終究得見光接受社會公評。這當然不是壞事,看與被看、分析與被分析的角力與反轉也許是反省數位時代知識/權力佈署的契機,也許是邁向真正大學自治的第一步!
Latest posts by 陳 志賢 (see all)
- 光有滿滿的大平台是不夠的:MoviePass與Netflix的不同抉擇/陳志賢 - 2018-08-20
- 分類的人如何被分類?/陳志賢 - 2018-05-14
- 《鞋尖革命》的內行笑話與敢曝/陳志賢 - 2017-11-13