分类的人如何被分类?/陈志贤
当法国思想家布迪亚(Pierre Bourdieu)于1960年代进行艺文品味的问卷调查时,他很快就发现,音乐是所有艺术中最具有「精神性」(spirituality)的,也最能做为阶级分类区异的指标,三分之二的低教育程度法国受访者无法从提供的十六人名单中指认超过两位作曲家,高教育程度者如此的比例仅有百分之七,而且近八成的大学教师认得十二位以上作曲家,低阶蓝领与白领劳工能这样的人数是零。布迪亚因此宣称,音乐是最纯粹的艺术,它的直观来自于身体感官于特定物质环境的耳濡目染,远非后天勉力学习所能企及。
四十多年后一群英国学者执行的「文化资本与社会排除」(Cultural Capital and Social Exclusion)研究案仍然发现类似的现象,即使高低文化杂食趋势兴起,当代与传统音乐界限渐趋模糊,古典音乐依旧是菁英的标志,足以召唤公众的钦羡折服与添增成为领袖的合法性。更有甚者,音乐是所有艺术中最爱恨分明的,受访者对大多音乐类型如不是热情拥抱,往往就嗤之以鼻,很少选中间值。连跨界杂食都有明显极限,如重金属音乐就专属特定群体。所以从音乐的品味喜好,不难猜出听音乐者的阶级、年纪与族群背景,反之亦然。
当今音乐串流方便,轻松游移在各种数位载具上,不少人开始质疑文化区异的持续性,毕竟聆听陌生群体的音乐不再遥不可及,打破品味的阶级牢笼可能只要触击键盘的一指之力而已。许多软体推荐与各方好友交换的playlist,加上随机播放的功能,爱乐者很容易在下一首歌曲中,毫无防备地与迥异品味展开第一次接触、进而坠入爱河。布迪亚的当代支持者可不这么乐观,他们反而更担心电脑程式演算法的同温层过滤效应,以往唱片行里与唱片录音带B面中,跟新音乐不期而遇的惊喜,会不会在开启数位音乐平台、戴上耳机的瞬间就此一去不返?
今年初剑桥大学与宾州大学的研究团队在Psychological Science期刊发表的一篇论文指出,音乐的品味偏好确实具有模式规律,并非单纯个人随意选择。他们从网路召募了两万多名志愿者,让他们聆听并评估二十五首专家事先分类过的音乐片段,结果再与他们于网路完成的人格测验进行相关分析。研究显示,除了良心型人格与音乐喜好无显著相关外,开放性人格偏爱复杂深奥音乐,对过甜过软的音乐不屑一顾,而外向型人格正好相反,欣赏直接简单不做作的音乐。易相处的人格给多数音乐高分,而神经质人格则倾向都给低分。
虽然这项心理学研究并未触及阶级文化区异的问题,却已对数位科技创造更多元自由音乐环境的说法提出质疑。细心的人还可能察觉,这项研究中五种人格的测验量表怎么似曾相识?没错,不久前涉嫌非法盗用八千万位脸书使用者资料的Cambridge Analytica政治顾问公司,即是透过也曾在剑桥大学任教的Aleksandr Kogan所设计之人格测验app,而获取这些大数据。两者差别在于音乐与人格的研究是由自愿者上网填答问卷,而Kogan的研究表面上也如此,实际上却在未明白告知的情况下,偷偷将填答者的脸书个人与好友相关档案与动态等「数位足迹」一网打尽。
不满者批评Kogan的人格测验app是标准的屠城木马,看似学术研究,实则为商业与政治考量而操作。不仅资料海量,发展出来的演算法与模式还能借由反复涌进的新资讯与使用者的实际作为而修正优化。由人格预测音乐偏好只是小菜一碟,客制化精准地了解与影响这些网民才是真正目的。脱欧成功与川普当选美国总统的过程中,这只木马到底发挥多大的作用还待厘清,然而可以肯定的是,Cambridge Analytica拥有的是Bourdieu多年田野调查都无法望其项背的大数据!
Kogan本人倒是频频叫屈,他先是宣称这些数据虽大,却没传言般的神奇价值,据此而做的针对性广告行销多未达预期成效。他然后强拉整个学界下水,抱怨偷窃网路使用者资料的学者多如过江之鲫,为何对其责难特别多。BBC为了查证Kogan说法的正确性,访问多位资料科学家,一般同意大数据预测与操控的技术能力尚在发展阶段,整体效果不宜夸大,不过其中具有强烈偏好倾向者的资料相对简单突出,才是目前业界预测操控的重点,尤其在紧绷的投票关头与旗鼓相当的市场竞争中,掌控这群人的数位资料,确实可能产生不成比例的强大影响力。
至于学界共犯的指责也有相当的真实性。一组瑞典与波兰的研究团队从2014年到2016年间,利用名为Scraper的程式下载超过三亿六千万位脸书使用者的详细资料,去年他们在Entropy期刊所发表的论文就提及轻易获取大笔个人资料的危险隐忧。纽约时报也披露学界过去十年中以类似方法蒐集资料者不胜枚举,如何记录、保护、与使用资料又缺乏共同遵守与监督的SOP,即使不因政商诱惑而出卖资料,仍难保资料不外流、不被误用。尽管资料多已匿名化(de-identification),只要足够的交叉比对,其实很容易就再具名化(re-identification)。2015年Science期刊的一份研究就表示,一份信用卡消费资料加上四笔随意提供的社群媒体讯息,资料科学家就可以成功预测百分之九十以上的消费者身份。这样的资料与精确的身份倘若流落到有心人士手中,后果就不堪设想。
五月二十五日起欧盟将根据新的一般资料保护规范(General Data Protection Regulation, GDPR),保障公民与住民的隐私与数位权,赋予个资当事人取得、修正、删除、携取、限制处理、与拒绝提供资料等权利,违者最高将面临两千万欧元或全球营运所得百分之四的罚款。即使有人担忧规定不利于刚加入数位市场竞争的中小型业者,却无损于既有优势平台的网络效应,新的措施还是普遍获得肯定,希望要求数位高科技业者赚钱之余,多关照帮产业生产真正价值的个资所有人。
脸书也已经开始检讨并限缩学者撷取平台资料的权限,只是这样一来,资料分析的权力恐怕会拱手让予业者内部工程师以及少数亲业界的学术研究人员,令人担心的是:数位媒体与平台选择学者合作、允许撷取资料的标准为何?谁来决定?谁来监督与负责?除了部分资料蒐集过程沦为地下化之外,在高薪的引诱下,还可能迫使大数据分析的学者从学界转至业界。而仍留在学界的研究者该如何面对数位资料的人权保障与平台业者倚赖个资生产买卖的资本逻辑?
相对于美国,台湾业者研发支出偏低,也较少高薪大批地聘请博士或向学界挖角,或许产学合作是项既变通又省成本的经营策略。部分大学的实验室或研究中心因此如同业者外包的研发部门,投入国家教育预算,以学术研究之名,大方使用国民个资与公部门各种统计数据,研究主题与提问方式却多以发达私人企业利润为依归,分析结果遂变身为商业机密。贡献个资的当事人被蒙在鼓里,无从分享研究与利润,研究者则如爷们般光鲜游走产学两端。而当越来越多学者卷进产官学共同体时,往往代表越来越少人能以独立第三者的身份监督资料与知识的滥用,大学也越来越跟产业靠拢、不敢跟产业say no。
布迪亚的品味调查规模如今看来是小巫见大巫,但是他的田野心得依然发人深省:分类者人恒分类之。用什么方式分类评估音乐就透露他是什么类型的人,同样地,用什么样的方式进行产学合作、分析大数据,无意间也显现他是什么类型的学者。不懂得因利益冲突而回避,只会让这些一向躲在暗处监视他人作为的研究者与业者,终究得见光接受社会公评。这当然不是坏事,看与被看、分析与被分析的角力与反转也许是反省数位时代知识/权力布署的契机,也许是迈向真正大学自治的第一步!
Latest posts by 陈 志贤 (see all)
- 光有满满的大平台是不够的:MoviePass与Netflix的不同抉择/陈志贤 - 2018-08-20
- 分类的人如何被分类?/陈志贤 - 2018-05-14
- 《鞋尖革命》的内行笑话与敢曝/陈志贤 - 2017-11-13