英文原文: Data (v.)
让我们把 data 变成动词吧。
我 data 你,你 data 我。他们 data 我们,我们 data 他们。
当你的简明牛津词典跨过屋子向我飘来时,我们还是花些时间来考虑下面的说法:
data 这个词语的角色和功能随着技术和文化对其重新定义,在过去的十多年里呈现了明显的变化。十年前,data 只是一个复数名词。具体地说,它是 datum 的复数——一条 datum、两条 data。在当时,你可以指出并嘲笑数据爱好者们,因为他们说‘data is’,而不是‘data are’。当然,那些 data 新手继续组建公司、制作软件、开发数据库、出书、以及做 TED 演讲。慢慢地,data 真的变成了某种特别的单数:它已经变成了普普通通的不可数名词。
不可数名词是被看做单数的词语,而不管其可能有多少。blood、homework、software、trash、love、happiness、advice、peace、confidence、flour、bread 和 honey——都是不可数名词,因为它们不能计数。我保证你在本文只能看到一次 big data 这个词语,它已经结束了:这个特定的流行语被准确地采用了,因为我们通过了一种无法挽回的界限,在那里 data 不再能够被计数。它已经变得如此广泛,以致于它不能再被低等的人类操作,而不得不总是使用更广泛、更复杂的算法和半结构化的数据库来计算。正如技术对这种规模上的巨大变迁做出了响应,语言也做了响应,data 这个词发现自己大众化了。
既然 data 已经忍耐了如此巨大的语法变迁,或许我们能够说服习惯用法的神灵们,彻底地转换这个词语可被接受的词类【注1】:我们可以让那个 data 成为一个动词吗?这听起来有些怪怪的,请考虑和 data 相近的两个同义词:record 和 measure。这两个词语可做为名词(I made a record)、和动词(We measured the temperature of the room)、真正的动名词【注2】(They found a list of measurements and recordings)。相比之下,把 data 限制在呆滞的、不活跃的名词分类里,不觉得奇怪吗?
上面两个词语都有一种动词形态,对于 making records 或者 taking measurements ,可以更容易地表达。我能够简单地说“ I am recording this conversation ”,而不用说“ I am going to be making an record of this conversation ”。如果我们把 data 动词化,就不必说美国国家安全局(National Security Agency)正在就我们的每次交互、移动和代谢功能,收集着 data。我们可以简单地说:They data us。
data 不是惰性的,然而,其被感知到的被动性,是一种非常危险的属性之一。当我们被警告,一个政府正在收集其公民的 data 时,我们或许没有留下深刻印象,尤其是因为这种收集行为貌似没有伤害、且无关紧要时。不过,data 当然不会被收集起来就扔在了一边:它将作为决策制定的基础;还作为区分、歧视和破坏的仪器。把词语 data 的活跃形态注入普通用法,能够提醒人们,收集和使用 data 的系统在影响、行动和暴力的功能方面,正在欺骗着我们。
把 data 变成动词,还可以向我们暴露,我们共同努力的显著不对等所带来的力量失衡。从语法上讲,data 动词化将为主语/宾语的组合提供很多可能:
I data you. You data me. We data you. You data us. They data me. They data us. We data them.
看到了这种充分的原因和效果,如今 data 的普通用法就显得非常狭隘了:在我们生活的 data 体验里,我们是宾语,而不是主语。 Google 阅读了我们的每一封电子邮件 ,根据我们给朋友、同事和爱人写信的内容,不光彩地把我们放到了营销 bucket 【注3】里。Uber 的算法把我们的深夜旅行标记为 浪漫约会的记录 。他们 data 我们,然后他们再次 data 我们。
甚至名义上体现着‘我 data 我自己’的、无辜的健身追踪装置,也不单单量化自己,而是量化“自己们”,除了让个人追踪他们自己的心跳,还是一种系统,它要找到居住在圣弗朗西斯科湾地区的所有 24 岁的人们,便于再次营销。这些建议都是给跑步和走路的人们提供的让人激动的玩具,对于律师而言,他们已经找到了 反对人身伤害索赔的新方法 。
然而,对我们而言,还有很多潜在要记录的数据。去年,我们开发了 Floodwatch ,它是一个基于浏览器的工具,让用户追踪他们创建的关于自己的广告情况——为个人提供追踪那些追踪者的能力。由 Ferguson 的积极分子 @samsway 、 @Nettaaaaaaaa 和 @deray 创办的项目 Mapping Police Violence ,保留着美国发生的、被警察杀害的每个黑人的记录。这样,该项目就让我们认识到, 简单的数据收集行为所产生的影响力就可以产生多么地强大 ,尤其是在一些有权势的人不想让我们看到数据的时候。
这些项目让我们大概了解到,如果我们放任关于 data 的想法,将其做为无辜的、被动性质的名词,就会发生什么。拥抱 data 新的动词形态,或许我们能够更好地理解其行为的潜力,相应地,把我们在 data 句子中、自己规定的宾语角色挪到前面【注4】。
在此过程中,我们或许能够设想关于 data 的理想前景,不仅他们在 data 我们,我们也将 data 他们。或许某一天,我们在一起 data。
插图:Sukjong Hong – http://sukjonghong.com/
本文首发 OCR Journal #001 ,它在 The Office For Creative Research(OCR) 运营的前两年里收集了写作、形象和数据方面的东东。还有一些有限的版本拷贝可以买到。