1857 年,几名隶属于一个叫“语言学会”的英国教会人员能买到的辞典不仅词条数量少得可怜,而且净是收录些生僻、奇怪的英文单词。于是,他们决定发起一项英语辞典的编撰计划。
第一版 OED。图片来自: Bauman Rare Books
消息一出,除了一些唏嘘的声音,更多人认为这无关痛痒。对于习惯了生活在互联网和智能移动设备环境中的现代人来说,“查词”这一行为早就从翻阅纸质词典,变成了通过图像、语音、文字形式输入电脑或手机,仅需几秒钟,就能获得相应的答案。
准确的说法应该是:这个英国人在 1980 年代见证了 OED 语料库电子化的过程,并且从 1990 年代开始,主导了在线牛津英语词典项目和第二版牛津英语词典的编撰增补工作。
但对于 John Simpson 来说,他恰巧站在了时代变化的十字路口。
“回到 1989 年,当第二版 OED 出版后,我们开始从印刷材料里收集数据录入电脑。(牛津大学出版社雇佣了 120 个打字员花费 18 个月时间将收录了 67,000,000 个字符的第二版 OED 全部录入电脑,并采用了一种基础标签语言结构)当时我们把探索的方向放在了创建一个巨大的电子数据库上。1990 年代,数据库大体结构成型后,世界又变了。我们开始注意到万维网和互联网所带来的可能性——它能够改变我们一直以来使用的传统词典搜索和出版方式。”Simpson 在他的一本名叫 The Word Detective:A Life in Words: from Serendipity to Selfie 的回忆录中写道。
“当你去了解一个词语时,你会对最后它会呈现出一个什么样的产品有个大致的感觉。每个单词都是一首诗——小到像莎士比亚的十四行诗,大到像乔伊斯的《尤利西斯》。但当在电脑上编撰辞典时,我们越来越多地意识到,其实并不应该关注某个单独的单词,单独的单词就像‘语言’这张拼贴画上的某一块砖。在现在我们得以创建的语言网络里,你能够看见相比旧时期来说更清晰的、词与词之间的紧密关系。”2013 年,John Simpson 在接受《时代周刊》采访时说道。
所以,图书馆装载的纸质材料会随着电子数据的创建而消亡吗?John Simpson 也问过自己这个问题。
而牛津英汉词典的 App 化,是在一个叫刘浩贤的中国人倡导下完成的。
就在 John Simpson 快将退休的时候,刘浩贤和他的团队负责将牛津高阶英汉双解词典(第七版)做成了一个 App。
图片来自: 当当
“挑选牛津高阶来做我们数字化出版的一次试水,是因为这本词典一直以来的销售都比较稳定。”刘浩贤告诉《好奇心日报》。
大约在 2011 年,刘浩贤代表牛津大学出版社与商务印书馆提出制作 App 的想法。由于互联网和搜索发动机的介入,纸质词典在全世界范围内的销售都进入了一个急速下降的状态,改变已然刻不容缓。
当时牛津大学出版社已经具备了一些相关数字产品制作研发的基础,这其中包括向一些电子产品生产商进行内容授权。 一个典型的案例是从 1990 年代末开始与日本卡西欧合作推出的电子词典。它大大简化了手动翻阅查词的过程,同时在较小的体积里详尽地录入十多本不同版本和用途的词典。
不仅如此,刘浩贤的 App 提案一开始就受到了来自各方的阻碍。由于电子书籍的读者群尚不明确,各个出版社都对刚刚兴起的数字出版业务并没有信心。另一方面,一百多年来,纸质词典已经形成了一个完整的销售、营销渠道和参考标准,但App要卖给谁?怎么宣传?没有人知道。
另外一个让刘浩贤感到压力倍至的因素是:词典软件的盈利模式到现在还没有一个清晰的定论。
在整个 App 开发策划案敲定前夕,他被上司问了两个问题:现在做数字版本,对纸本出版会有什么样的影响?这个数字版本,能赚多少钱?
“我当时没有想太多。”刘浩贤回忆道:“当时我的回答是:第一,不要把出版数字版本看成是对纸本的打击,因为数字版本的使用方法和纸本是有差别的。数字版本是一个全新的机会——找到新的读者,以及,为老读者带去新的内容。第二个问题,我不能告诉你我们能赚多少钱,但我能告诉你我们最多能赔多少钱,就是赔掉我们编程开发的费用。”
刘浩贤认为这个答案在当时看来不怎么完美,但好在他的策划案并未因此被草草否决。更令他感到高兴的是,牛津高阶 App在上线两个月后的销售额就让出版社收回了开发成本,并在一次打折季营销活动里,登入了香港地区苹果商店软件销售总榜的第 7 名。
牛津高阶英汉双解词典 App (第 8 版)。 图片来自: Apple Store
刘浩贤把这次成功归结于一个“顺应时代发展的做法”,另外,牛津辞典在此之前树立的良好口碑,使其得到了许多教育机构和专业出版社的推荐。
牛津高阶英汉双解词典 App 与现在人人爱用的在线词典软件其实并不相同,尽管二者都接入了专业辞典出版社的语料库。就拿网易旗下的有道词典来说,它的词库里包括了柯林斯英汉双解大辞典、21 世纪大英汉辞典,甚至于维基百科上的内容。当你查询一个词时,可以得到来自于这些数据库不同的解释,以及搜索发动机提供的英语例句。
相较于此,传统词典出版社所创建的语料库所能提供的释义范围则要因此受到一定局限。
事实上,不论是辞典、电子辞典、内容授权,都是在这个语料库支持下的前端的产品。它曾是 Murray 的一间小书阁,现在,语料库让我们快速地在外国旅行时,用几秒钟便看得懂眼前菜单上的菜名。
同样在语料库的支持下,除了传统意义上的辞典开发,牛津大学出版社的内容授权对象范围很广——包括和苹果、谷歌、腾讯这样的科技公司进行内容上的合作。
“除此之外,我们还在创建一个针对收录不同语言的学术项目。”刘浩贤最后提到:“我们现在在谈的都是汉语和英语词典,但牛津还在不同国家不同地区有其他的辞典项目。我们还在计划做一个多语种的大型数据库。在未来,它不光能够产出辞典、电子辞典、翻译 软件,它也将会是牛津大学出版社做一个语言保护计划的一部分。我们的目标是收纳一百种不同的语言。”
题图来自:Examining the OED
喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。