
洪业(1893-1980)
【译者按】过去两年间,经哈佛燕京图书馆授权,北京大学数字人文研究中心系统地整理了该馆珍藏的七千余种善本古籍,包括稀见的宋元刻本、地方史志、宝卷、韩南教授捐赠的通俗戏曲小说等。影像与电子文本已在线上公开,供学者阅读与检索。这项浩大的工程自然依赖最新的智能工具,繁琐的校对工作却由上万名“校书官”在网上义务完成。
北大图书馆将在今年11月举办为期一个月的“燕京古籍旧藏与哈燕馆藏合璧展”,不仅展示文献本身,也梳理那段以哈佛燕京学社,以及洪业主持的引得编纂处为代表的中美学术交流史,主题之一是“从引得到数字人文”。主办单位问我有没有相关资料可提供,我想起上世纪七十年代末我在麻省康桥带了录音机到洪业的厨房,和他一起边喝茶吃叉烧包,边录他的回忆。他送了一本薄薄的册子给我,是他1930年12月12日在北平中国社会及政治学会(Chinese Political and Social Science Association)上用英语发表的报告。此学会成员大概是欧美留学归国学人及在各院校教书的外籍人士,待查。那时他得哈佛燕京学社资助,成立引得编纂处才三个月。替古籍编引得,是他在脑海中已酝酿了十多年的构想,终于有机会付诸行动,欣喜中带几分忧虑,我们可借以窥探当年的学术大环境。

《试为中国古籍编引得——1930年12月12日中国社会及政治学会上发表》
新近出现了一支新的学派叫sinology,国内称为“国学”;名称无论中西都相当别扭。顾名思义,它指一切有关古今中国的研究,但“国学”家至今聚焦于受西方文明冲击前的中国思想与制度。准确地说,所谓的sinology或国学,应被理解为以科学态度研究中国语文和历史的学问,因其一手资料不外于中国历史遗存和文献。
在中国境内,有两个原因令我们对这门学问的前景感到乐观,一是批判性研究方法的崛起,一是古籍的普及化。
校勘学在中国清代早已兴盛。卢文弨、戴震、汪中、孙星衍、严可均和顾广圻等学者把许多古籍的文本恢复原貌,功不可没。相对而言,深层历史批评却是最近才有的。此前虽说有胡应麟、阎若璩、姚际恒和崔述等少数勇者向尊崇的传统挑战,但都不敢打破砂锅问到底,而且号召力有限,跟从者不多。一直到十多年前胡适博士《中国哲学史大纲(卷上)》(商务印书馆,1919年)出版,我们才能在他的序言中看到类似西方过去一个世纪来发展的那种历史批判。胡适是中国声誉最高的学府里最出名的教授,影响波及全国知识分子。现在年轻学子纷纷用批判的眼光审视文本的作者与他们创作的动机,应归功于胡适。而追随胡适的学者中最杰出的是燕京大学的顾颉刚教授,他几乎天天都在揭发中国浩如烟海的历史资料中隐藏的骗局和圈套。
恰恰在这时候,古籍突然普及了。中国虽以发明印刷术为傲,但从西方引进新印刷技术后,尤其是引进石印后,古籍才从奢侈品变成普通人买得起的物品。有生意头脑的出版商大量复制了许多以前是珍版的稀见书目。举个例子,商务印书馆出版的《四部丛刊》,是上一代富有藏书家须花一辈子的功夫才能凑齐的,现在中上人家就能购得起一套,囊中羞涩的书生则可到图书馆借阅。根据《中华图书馆协会学报》的统计,中国的公共图书馆1925年至1930年间从五百零二所骤增至一千四百三十八所。虽然大多没有达到可供学者做研究的水平,但都在朝这一方向发展,尤其是走在前沿的大学图书馆。
总的来说,目前学者要从事学术研究基本上很少有障碍,也许最烦人的是缺乏德国人称为Hilfsmittel(直译为“辅助工具”)的学术工具;依我看,我们最急需各种书目与引得。受过学术训练的学者即使坐拥书城,找资料仍然不易,找到和他题目相关的著作后,又要花许多时间在书里寻检他所需要的段落。虽说勤奋和耐心是每位读书人都应具备的素养,然而精神长期被这种费时费事的操作消耗,研究成果也会受影响。
幸而编书目的工作已开了个头。有数所图书馆把馆藏目录出版,让学者知道书在什么地方可找得到。国立北平图书馆准备把北平数所图书馆收藏的丛书做个联合目录,将为学者提供一个很大的便利,因其中有些丛书现在已很罕见;而燕京大学的陈垣教授正着手把这些丛书涵盖的数千种书的书名另行顺序编排,让学者更容易找到他们所需要的书。至于以题材分类的书目,愈来愈多学者发表论文时列出所参考的书本和文章,而不少专业学刊,尤其是国立北平图书馆和中华图书馆协会出的刊物,不时登载些以题材分类的书目。近来还有人把不同期刊上的文章以题材分类后,将标题汇集出版,希望日后会演变成似美国Reader’s Guide to Periodical Literature(《期刊文献读者指南》)那样的参考工具。
学者找到书本后,须在书中寻检有关段落,这时若有“引得”(index)或“堪靠灯”(concordance)便事半功倍。其实书目愈齐全,提及的书愈多,引得和堪靠灯便愈有用,可为学者节省更多的时间和精力。
譬如学者要找《诗经》内某一句,如果他有大把时间,当然可把《诗经》从头读起,直到见这一句。他若想省点时间,可试查字典或类书,看看有没有提及该句,是《诗经》哪一篇,但很少会幸运碰上,只好又把《诗经》拿出来从头翻。如果他会看英文,就可用理雅各(James Legge)英译本附录的引得,那引得编排得不理想,但仍然可省许多时间。又譬如我们想找《史记》里一段话,可先查沙畹(Emmanuel-Edouard Chavanes)法译本附录的引得——虽然他只译了最初的七十五篇——然后便可据此轻易查到这话在《史记》原文的位置。可见有时最快捷的途径是绕远路,读中文书竟须借助外文译本。
当然,被译成外文的中文书非常少,而会读各种译本的中国学者也非常少。极少数古籍的西文译本附有引得,大体说来无济于事。传统中国教育基本上只要求读书人把几部经书及最有名的文艺著作背得滚瓜烂熟,无需用引得之类的工具。我们现在感到有需要,但除了蔡廷干1922年刊印的《老解老》(非卖品)之外,这种工具始终没有出现。这可归咎于替中文书编引得有许多难以克服的困难,远不如替西文书编引得那么容易。
我对克服所有的困难并不乐观,然而我也不认为这意味着我们应该放弃。许多年来,我总盼望有一批人集合起来选几本书做个试验。今天我可心存感激地向大家报告:哈佛燕京学社已同意拨一笔可观的款项让我们做这么一个试验。我在原有的职务外,主导一个包括编辑和助理的小团队从事这项工作。这三个月来,我们逐渐摸清楚应怎样处理最棘手的问题,希望半年后哈佛燕京学社汉学引得丛刊就有数种引得面世。
现在略谈我们编纂引得的十个步骤:
第一,选书。经编辑和有关领域的学者商讨后,我们定下以下几个原则:(甲)不选已有引得的书;(乙)目前不选伪书;(丙)暂不选二手资料;(丁)暂不选外文译本附有引得的书;(戊)暂不选需两个月以上处理的大书。提最后一条,是因为这既然是个试验,我们应尽快出几个样本送到国内外学者请他们评估,希望获得他们坦诚的批评,告诉我们如何改善。
第二,选择版本。我们尽量选最通行、最可靠的版本。可是为了拥有其他版本的学者也能用我们的引得,须作推算表,让他们算得出某句在他们拥有的版本里大约在哪一页。举个例子:《说苑》(著者刘向,公元前77-公元6年)我们选的版本是《四部丛刊》的单行本。仅我们所知道的,就另有十二个版本。于是我们替每个版本制造一个方程式,让读者可算出某句的相应页数。这些方程式相当精准,最多差一两页。
第三,钩标目注。这是流程中最关键而又最具挑战性的一环。先由两位编辑在各自的文本上下功夫,再由第三位编辑和他们协调商定。牵涉到三个问题:(甲)读者若知道文本中有哪些异文,往往可帮助他们了解内容,异文本身也有学术价值。一般古籍将异文在书后列出,我们所用的《说苑》版本则在另一册上,都不注明异文在文本的哪一页出现,在文本上也没有标志。我们提供读者的引得,附有加入标点符号重新排印的文本,遇上异文,就在文本上加注脚。若相关字眼被选入引得,在该录中也把异文的信息纳入括号里。(乙)传统古籍是没有标点符号的,编辑须把文本读通,明白作者的原意以及文中指涉的名物制度,才能够正确地断句。我们的编辑都是受过学术训练的大学毕业生,但每天都遇到一些怎么读都无法读得通的段落,若寻专家请教后仍无法读通,只好把这些段落列出,希望后人有所发现。标点的同时,编辑们随手做些笔记。如书上提到人物往往不用姓名,而用该人的字或号;而有些地方有两个不同的名称,都须顾及。幸而编纂处现在就设在燕京大学图书馆里,用各种参考书很方便。(丙)文本断句后,就可钩标出引得的目注,决定须不须和另一目注互见等等。我影印了经我们钩标后的《说苑》卷十五第十四页(见图一),上面的校对符号与西方用的大同小异。我们的编辑对西方引得的操作很熟悉,什么东西值得重见于引得中以供读者寻检,中西方的原则是一样的。
第四,把每一条录抄在一张卡片上。卡片上注明其录,及其录所涵盖的目注与异文,在文本的哪一卷、哪一章、哪一页出现,在版心的右边或左边。用其他版本的人可据卷码章码检到其在文本的位置。
第五,卡片经至少两位编辑细心校对。校雠这个词很有意思,就是当为仇敌频频试探的意思。我们曾三校后仍发现错误,所以坚持把每张卡片都假定为有误,有必要证明它是无辜的。
第六,编码。把卡片按次序排列,令读者可按次序便捷地找到有关段落。然而顺什么次序呢?这就是为中文书编引得最棘手的问题了。汉字不似英文字用字母拼成。英文有二十六个字母,可轻易地顺着惯常次序排下去,不懂发音不懂意思都可依序做。汉字没有简单的惯常次序。历来字典不是依诗韵排列就是依二百十四个部首排列,引发的麻烦众所周知。我十一年前便开始思虑如何解开这死结,所以一直关注他人这方面的努力,其中以上海商务印书馆王云五先生的四角号码最成功,但我认为用它来编引得仍不理想。我把自己的方法称为“中国字庋撷”,比起王先生的方法对初学的人来说更容易记,替一个字编码只须三个步骤(见图二),而且几乎每一个号码只有一个字,排列起来又较整齐,这对引得来说是相当要紧的。目前有多所图书馆已用王先生的方法编目录,所以我对要不要推广自己的方法相当犹豫,最终仍坚持用它编引得是因我深信这方法有许多优点,而没有相应的缺点。C. C. Wang去年在Chinese Political and Social Science Review(《中国社会及政治学报》)指出汉字电报码有种种问题。庋撷法几乎每一个号码只有一个字,也许亦可解决电报这个问题。言归正传,所有与“孔子”有关的目注自然都应放在“孔子”这一条录下。我们替“孔”和“子”编了码,便可依码把该录排列在他录之间。该录下所有的目注也可依码排列。若某目注在文本中多处出现,则依其在文本中出现的先后排列。我们有个“号片柜”,每个汉字的庋撷号码都写在一张卡片上,并注明该字的各种发音(用韦氏拼音法),依号码排列。替一部书编引得时,助理甲替一条录编码后,助理丙和助理丁便参照“号片柜”卡片上的汉字校对,以防有失误;之后把“号片柜”的这张卡片放在一旁,待下个步骤使用。
第七,具有庋撷号码的卡片排列整齐后便可依次抄到排版稿上,构成引得的前半部。引得的后半部是按韦氏拼音依英文字母次序排列的,用的正是“号片柜”的那些搁置的卡片,排列后也可抄到排版稿上了。而这后半部的引得虽按发音排列,但每一条都有汉字及其庋撷号码,可让读者便捷地找到文本中有关段落。这不但为习惯用韦氏拼音的西方汉学家提供了方便,并且有些学术功用,因为有些同音的汉字本来是同源的。我目前仍不确定是否应纳入古音,欢迎赐教。
第八,印刷。用什么格式什么字体,都是学问,这里就不细谈了。
第九,印本校对。印本须参照以上第三步骤所完成的稿件校对,一点都不能放松。当下许多中文书附录了很长的勘误表,一点用处都没有。
第十,加序。序里包含文本的来历,版本的源流,以及引得的用途等。
即使是优秀的学者,也得积累许多经验才能成为一位优秀的引得编纂者,因编引得涉及主观判断力。决定什么东西应录,须顾及广大读者的兴趣和研究方向,又须避免太滥,浪费了读者的时间与精神。引得编纂者必须把自己置于读者的立场上,而中国的学术范畴仍未定型,故这些决定远比在西方困难;我们乐得有西方的经验可借鉴。
我不认为哈佛燕京学社有意图或有责任资助我们替所有重要的中国古籍都编引得。这试验若不成功,事情自然不了了之。成功的话,相信将有出版商接手办。至于要多久才能证实行得通,很难说,有赖于引得编得好不好,有多少人期盼它成功。英人H. B. Wheatley曾戏称:“出版没有引得的书的人该被打入地狱底下十英里,到一个连魔鬼都害怕的地方。”在能证实引得从学术到盈利都成功之前,我们不敢奢望有出版商参与。目前这试验的目的,仅仅要证明就学术而言,替古籍编引得是值得做的。
图一:经钩标后的《说苑》卷十五第十四页。

译者按:洪业1932年12月出版的《引得说》(引得编纂处《引得特刊》之四,44-45页)对此图片有相当详细的解说:
我们读《说苑》时,防它里面的伪夺,故先取卢文弨的校勘记来参考着读。在第二行和第五行所钩标之“28b”就是指明校勘记页二十八下对于这二段文有点议论,可供参考……我们读《说苑》时,随读随标出引得中之目注。这一页上有三段:每段我们先撮取其大意,为编目注。第一段有一录,以“治道”为目,以“宜除逆贼”为注。第二段有一录,以“道”为目,以“须藉权势乃行”为注。第三段有二录:一为“子贡问孔子诛少正卯之故”,一为“孔子答子贡诛少正卯之故”。次就各段中标出应录目注,有时且须增益字句,以使其录较为明晰。
此页钩标的目注依次有:尧诛四凶、四凶被尧诛、周公杀管蔡、管【叔鲜】被周公诛、蔡【叔度】被周公诛、子产杀邓析、邓析被子产诛、孔子斩少正卯、少正卯被孔子诛、易、引、五帝、三王、孔子、颜渊、孺悲、权为道所凭藉、势为道所凭藉、孔子诛少正卯、少正卯被孔子诛、鲁、司寇、东观、【端木】赐(见子贡)、王者之五诛、五诛、王者之。
图二: 中国字庋撷

