人民網(wǎng)
人民網(wǎng)>>甘肅頻道>>人民日?qǐng)?bào)看甘肅>>人民日?qǐng)?bào)看甘肅

探訪文溯閣《四庫(kù)全書》數(shù)字化影印出版工程(人民眼·讓文物活起來(lái)③)

董洪亮 王錦濤
2024年05月31日10:24 | 來(lái)源:人民網(wǎng)-人民日?qǐng)?bào)
小字號(hào)

原標(biāo)題:探訪文溯閣《四庫(kù)全書》數(shù)字化影印出版工程(人民眼·讓文物活起來(lái)③)

引 子

登臨蘭州北山九州臺(tái),甘肅省圖書館文溯閣《四庫(kù)全書》藏書館躍入眼簾——館樓飛檐翹角,踞北山而瞰黃河。

自正門入樓,穿鞋套,做登記,進(jìn)書庫(kù)。書庫(kù)恒溫恒濕,1128個(gè)香樟木書箱層層疊疊,收錄典籍6141函、3474種、36315冊(cè)的文溯閣《四庫(kù)全書》就安放于箱中。

2023年6月,習(xí)近平總書記在中國(guó)國(guó)家版本館中央總館考察調(diào)研時(shí),詳細(xì)聽(tīng)取《四庫(kù)全書》版本源流、紙張印刷、保護(hù)收藏等介紹,叮囑工作人員:“我最關(guān)心的就是中華文明歷經(jīng)滄桑留下的最寶貴的東西。中華民族的一些典籍在歲月侵蝕中已經(jīng)失去了不少,留下來(lái)的這些瑰寶一定要千方百計(jì)呵護(hù)好、珍惜好,把我們這個(gè)世界上唯一沒(méi)有中斷的文明繼續(xù)傳承下去?!?/p>

《四庫(kù)全書》編纂于清代乾隆年間,是我國(guó)歷史上規(guī)模最大的叢書,修成后謄抄7部,分藏于紫禁城文淵閣、圓明園文源閣、盛京(今沈陽(yáng))文溯閣、承德避暑山莊文津閣、杭州文瀾閣等地。目前存世三部半,分別為文淵閣本、文溯閣本、文津閣本,以及被稱為“半部”的文瀾閣殘本。其中,文溯閣本輾轉(zhuǎn)多地,于2006年入藏現(xiàn)在的藏書館,也是“三部半”中唯一尚未完整影印出版的一部。

為了讓書寫在古籍里的文字活起來(lái),經(jīng)過(guò)長(zhǎng)期縝密的籌劃論證,2021年8月,甘肅省正式啟動(dòng)文溯閣《四庫(kù)全書》數(shù)字化影印出版工程。

目前,文溯閣《四庫(kù)全書》數(shù)字采集工作已全部完成,數(shù)據(jù)處理工作完成70%。從現(xiàn)在起至2028年,文溯閣《四庫(kù)全書》將按經(jīng)、史、子、集四部,分期分批推出全套影印版本。

數(shù)字采集

采集方案、流程規(guī)范和相關(guān)作業(yè)標(biāo)準(zhǔn)周密完善

約8億字的文溯閣《四庫(kù)全書》共有多少頁(yè)?數(shù)字化之前鮮有人知。

“換算為現(xiàn)代書籍頁(yè)碼,共488萬(wàn)多頁(yè)?!蔽乃蓍w《四庫(kù)全書》數(shù)字化影印出版專職工作組組長(zhǎng)宋學(xué)娟說(shuō)。

作為讀者出版集團(tuán)有限公司所屬的讀者古籍?dāng)?shù)字科技中心總經(jīng)理,宋學(xué)娟過(guò)去兩年多時(shí)間帶領(lǐng)團(tuán)隊(duì)把文溯閣《四庫(kù)全書》從紙上“搬進(jìn)”了電腦——逐頁(yè)掃描、存入,數(shù)據(jù)資源總量逾700TB(太字節(jié))?!叭绻贸R?jiàn)的容量32GB的U盤存儲(chǔ),需要2.2萬(wàn)多個(gè)才能裝下?!彼螌W(xué)娟說(shuō)。

文溯閣《四庫(kù)全書》既是歷史典籍,又是珍貴文物。若藏于高閣,難以活化利用;若活化利用,又有損壞之虞。如何破解“藏”“用”兩難?2021年8月,甘肅省委宣傳部制定《文溯閣〈四庫(kù)全書〉數(shù)字化影印出版工作重啟方案》,力求在保護(hù)的同時(shí)“喚醒”古籍。

古籍真本由甘肅省圖書館提供,數(shù)據(jù)采集處理、影印出版等工作由讀者出版集團(tuán)有限公司具體實(shí)施。數(shù)字化影印出版工程分為“數(shù)字采集—數(shù)據(jù)處理—影印出版及數(shù)據(jù)庫(kù)建設(shè)”3個(gè)階段。所需經(jīng)費(fèi),部分由中央文化產(chǎn)業(yè)發(fā)展專項(xiàng)資金、甘肅省財(cái)政資助,部分由讀者出版集團(tuán)有限公司自籌。

數(shù)字采集,免不了要接觸古籍真本,如何確保其安全無(wú)損?甘肅省圖書館和讀者出版集團(tuán)有限公司制定了周密完善的采集方案、流程規(guī)范和相關(guān)作業(yè)標(biāo)準(zhǔn),“54條數(shù)字化工作流程規(guī)定,涵蓋前期準(zhǔn)備、文獻(xiàn)出庫(kù)、數(shù)據(jù)處理等全部流程。”宋學(xué)娟介紹。

為保古籍安全萬(wàn)無(wú)一失,文溯閣《四庫(kù)全書》藏書館二樓會(huì)議室被改造成了數(shù)字采集室,做到原書“出庫(kù)不出館”。而從書庫(kù)到采集室,平常不到一分鐘的路程,藏書館90后館員魏?jiǎn)滩▍s要走好幾分鐘:戴上白色手套,細(xì)查一遍即將出庫(kù)的古籍,再輕輕捧起,就像捧著一碗不能灑出的水,慢慢往樓上“移”,“就怕腳下不穩(wěn)”。

“古籍出庫(kù),要填報(bào)11類表格,層層審批。歸還時(shí),所有細(xì)節(jié)都要對(duì)得上。”魏?jiǎn)滩ㄕf(shuō),以其中的《提書登記表》為例,提取古籍需詳細(xì)填報(bào)當(dāng)日采集計(jì)劃、提取數(shù)量,然后與書庫(kù)管理員共同清點(diǎn)每一函、每一冊(cè)書,包括函盒、夾板、束帶、銅扣的存缺程度,每一冊(cè)古籍的題名、卷數(shù)、頁(yè)數(shù),以及有無(wú)破損、污跡或霉斑等情況,“這些都要一一記錄在案。一送一回路上、數(shù)據(jù)采集期間,古籍若有半點(diǎn)閃失,都會(huì)被及時(shí)發(fā)現(xiàn)?!?/p>

數(shù)字采集作業(yè)班班長(zhǎng)楊旭勇告訴記者,采集時(shí)必須使用古籍專用非接觸式掃描儀高清掃描,且光源必須是冷光源。對(duì)采集人員,甘肅省圖書館的古籍專家也開(kāi)展了多輪培訓(xùn)演練,“既要保證掃描精度與進(jìn)度,還要避免傷害古籍,翻書的力道不能輕也不能重,要穩(wěn)而有力?!睏钚裼抡f(shuō)。

準(zhǔn)備周密,工作前期進(jìn)展順利,意料不到的問(wèn)題還是出現(xiàn)了?!肮偶_(kāi)本大小相同,厚薄卻不一樣?!彼螌W(xué)娟翻開(kāi)一本書,拿到一臺(tái)掃描儀前比劃道,“超3厘米厚的古籍,用這種平板掃描儀掃描,靠近訂口的部分內(nèi)容很難被有效采集?!?/p>

為啥?不按壓,無(wú)法掃描;按壓,古籍易損,且采集到的內(nèi)容會(huì)變形。怎么辦?“為保證采集質(zhì)量,我們追加預(yù)算,在已采購(gòu)10臺(tái)古籍專用平板掃描儀的基礎(chǔ)上,又購(gòu)置了兩臺(tái)V型古籍掃描儀?!彼螌W(xué)娟說(shuō),使用這種掃描儀,只需將書翻開(kāi)到90度,即可完成掃描采集,問(wèn)題迎刃而解。

2021年12月23日,開(kāi)機(jī)掃描;2022年5月23日,采集告竣?!罢?個(gè)月,經(jīng)過(guò)人員倒班,實(shí)現(xiàn)每天工作16個(gè)小時(shí)、一天未休。古籍沒(méi)有絲毫受損,函盒沒(méi)有增加一道劃痕?!标?yáng)光透過(guò)窗口,灑在黃底黑字的《文溯閣〈四庫(kù)全書〉數(shù)字化工作手冊(cè)》上,宋學(xué)娟長(zhǎng)舒一口氣。

數(shù)據(jù)處理

數(shù)字文件與古籍真本如同孿生,最大程度呈現(xiàn)古籍原貌

偌大的房間里,數(shù)十名工作人員神情專注、緊盯屏幕,只聽(tīng)見(jiàn)鍵盤敲擊聲此起彼伏。在讀者古籍?dāng)?shù)字科技中心的數(shù)據(jù)處理室,采集來(lái)的文溯閣《四庫(kù)全書》數(shù)據(jù),將被加工成標(biāo)準(zhǔn)的數(shù)字文件,供后續(xù)影印出版和數(shù)據(jù)庫(kù)建設(shè)之用。

“數(shù)據(jù)處理有4道流程,圖版處理、一校、二校和質(zhì)檢存儲(chǔ)?!彼螌W(xué)娟介紹,其中圖版處理是關(guān)鍵,主要工作是拼接完整“葉”。

葉,古籍特有的量詞。不同于現(xiàn)代書籍,古代紙張多為單面印刷,一張紙即為一葉,書冊(cè)由一葉一葉對(duì)折后裝訂而成。一葉,相當(dāng)于現(xiàn)代書籍的兩頁(yè)。所以,數(shù)字采集到的掃描件實(shí)則都是半葉,圖版處理就是讓它們合二為一。

“最初,我們先在電腦上制作一個(gè)標(biāo)準(zhǔn)葉模板,再利用智能軟件,從掃描件上提取文字,貼在模板上?!彼螌W(xué)娟告訴記者,但實(shí)際操作中發(fā)現(xiàn),智能軟件可能會(huì)漏字、識(shí)錯(cuò)字,且原本每一葉的版式不盡相同,模板統(tǒng)一后,有“失真”之嫌。

數(shù)字文件與古籍真本,如何保持孿生一般的相同面貌?“我們摒棄了標(biāo)準(zhǔn)模板,選擇了逐葉拼接,最大程度呈現(xiàn)古籍原貌。”宋學(xué)娟說(shuō)。

圖版處理不易,校對(duì)任務(wù)也很繁重。文溯閣《四庫(kù)全書》數(shù)據(jù)校對(duì)人員張靜從事古籍校對(duì)工作已有10年,但從未校對(duì)過(guò)如此海量?jī)?nèi)容。利用數(shù)字技術(shù)能夠提速,但一些訛誤很難被發(fā)現(xiàn)。

不久前,張靜在校對(duì)時(shí)發(fā)現(xiàn),一個(gè)“丸”字疑為“九”字。經(jīng)仔細(xì)核校后確認(rèn),果然是因?yàn)楣偶埨锏闹参锢w維發(fā)生霉變,掃描時(shí)多出了這一“點(diǎn)”。

起初,一天校對(duì)300葉是張靜的上限。“剛開(kāi)始時(shí)平均用力,耗時(shí)較多?!彼f(shuō),而今這個(gè)數(shù)字翻了近3倍,“慢慢地,哪里容易出錯(cuò)、哪里容易變色,心里都有了數(shù),效率提高不少?!?/p>

效率高了,膽子卻小了?!翱倱?dān)心有錯(cuò)誤沒(méi)能及時(shí)發(fā)現(xiàn)。”張靜回憶,有次下樓吃午餐,飯剛端上來(lái),她又起身趕忙回到辦公室,“以為忘了標(biāo)注一處訛誤,打開(kāi)電腦一看,其實(shí)已經(jīng)做了記錄?!?/p>

為明確權(quán)責(zé),避免誤操作,從圖版處理到一校、二校,再到最后的質(zhì)檢存儲(chǔ),文溯閣《四庫(kù)全書》數(shù)據(jù)處理是條“單行道”。電腦之間不能互相訪問(wèn),數(shù)據(jù)傳給下一流程后,前一流程的人員將無(wú)權(quán)再改。

“在數(shù)據(jù)處理程序軟件和制度流程上,我們有一套完整設(shè)計(jì),確保數(shù)據(jù)資源安全。”宋學(xué)娟輸入賬號(hào)、密碼,登錄數(shù)字化成果管理系統(tǒng),所有成品文件呈現(xiàn)在眼前,函盒編碼、書名、作者、朝代,以及長(zhǎng)、寬、高和冊(cè)數(shù)等基本信息,都有詳細(xì)記錄。“我們爭(zhēng)取今年內(nèi)基本完成圖版處理工作?!彼f(shuō)。

影印出版

不少圖書館、藏書機(jī)構(gòu)等正虛位以待,靜待“四閣四庫(kù)合璧”

文溯閣《四庫(kù)全書》影印出版,匯聚了社會(huì)各界的期待。

西北師范大學(xué)教授趙逵夫全程參與了文溯閣《四庫(kù)全書》影印出版工程專家論證會(huì)。他說(shuō),《四庫(kù)全書》現(xiàn)存不同版本在內(nèi)容、冊(cè)數(shù)、卷數(shù)上皆有不同,通過(guò)數(shù)字化影印出版,方便學(xué)者比對(duì)研究,意義重大。

蘭州大學(xué)教授汪受寬也持相同觀點(diǎn)。他曾用兩年時(shí)間,帶著學(xué)生對(duì)甘肅省圖書館編印的《影印文溯閣四庫(kù)全書四種》進(jìn)行整理、標(biāo)點(diǎn)和精細(xì)???,并將收錄其中的《易圖說(shuō)》《長(zhǎng)安志圖》《墨法集要》《璇璣圖詩(shī)讀法》這4種(每種各1冊(cè))書,跟文淵閣本進(jìn)行對(duì)比,發(fā)現(xiàn)兩個(gè)版本的文字、圖片等存在901處差異。

“4冊(cè)書就有這么多差異,3.6萬(wàn)多冊(cè)會(huì)是什么樣?”汪受寬說(shuō),“文溯閣《四庫(kù)全書》影印出版,將對(duì)文化史、史學(xué)史、文獻(xiàn)學(xué)研究等都產(chǎn)生重要影響。”

期望值高,現(xiàn)實(shí)問(wèn)題也不少。一方面,古籍實(shí)現(xiàn)數(shù)字化后,盜印現(xiàn)象難以杜絕。另一方面,超大規(guī)模古籍的影印出版投入巨大,盈利是個(gè)難題。“變古籍為現(xiàn)代書籍,背后是大量的人力、物力、財(cái)力成本?!弊x者出版集團(tuán)有限公司所屬甘肅人民出版社社長(zhǎng)、總編輯原彥平坦言。

防止數(shù)據(jù)泄露,采集區(qū)域設(shè)置嚴(yán)密安保措施。宋學(xué)娟介紹,任何人出入采集區(qū),都須經(jīng)過(guò)嚴(yán)格安檢,以防手機(jī)等電子設(shè)備進(jìn)入工作區(qū)域。同時(shí),每個(gè)工作臺(tái)均安裝了監(jiān)控設(shè)備,每臺(tái)電腦都作了加密設(shè)置。

應(yīng)對(duì)盈利難題,找準(zhǔn)盈利點(diǎn)是關(guān)鍵。原彥平給記者詳細(xì)分析:古籍影印本主要有仿真本和縮印本。前者好比是“克隆體”,從紙張到字號(hào),從排版到裝幀,與原書幾乎“一模一樣”;后者則是“迷你版”,內(nèi)容不變,但字號(hào)變小、頁(yè)數(shù)變少,冊(cè)數(shù)大幅縮減?!拔乃蓍w《四庫(kù)全書》若是出全套仿真影印本,成本過(guò)高,市場(chǎng)較小?!?/p>

原彥平說(shuō),文溯閣《四庫(kù)全書》多達(dá)3.6萬(wàn)余冊(cè),數(shù)據(jù)采集、處理、編輯、出版等投入大,且多為手工完成,成本高,發(fā)行對(duì)象則主要為圖書館、文化館、高校、研究院所等專業(yè)機(jī)構(gòu)和為數(shù)不多的研究者。

2024年1月3日,文溯閣《四庫(kù)全書》經(jīng)部影印出版專題工作會(huì)議召開(kāi),確定了出版方案——縮印、16開(kāi)本、236冊(cè)?!拔覀儗唇?jīng)、史、子、集四部,分期分批推出縮印本。如果全套出齊,預(yù)計(jì)共1500冊(cè)?!痹瓘┢秸f(shuō)。

走進(jìn)甘肅省圖書館的古籍閱覽室,其他三閣《四庫(kù)全書》的影印本旁,工作人員已為文溯閣《四庫(kù)全書》的影印本騰好了書架。

“古籍影印本看似小眾、銷路窄,實(shí)際上,版本好、印刷精美、定價(jià)合適的古籍,自有其發(fā)行空間?!睆氖鲁霭嫘袠I(yè)20多年,宋學(xué)娟對(duì)文溯閣《四庫(kù)全書》影印本的市場(chǎng)前景頗有信心——版本獨(dú)一份,價(jià)值突出,公眾期待較高;自帶流量和話題,營(yíng)銷成本較低,做到客戶明確、精準(zhǔn)供給,就能減輕銷售壓力。

今年初,宋學(xué)娟帶領(lǐng)團(tuán)隊(duì)參加2024北京圖書訂貨會(huì)。文溯閣《四庫(kù)全書》全套影印出版工作頗受關(guān)注,不僅有高校、圖書館、文博機(jī)構(gòu)的負(fù)責(zé)人,還有銷售商和個(gè)人前來(lái)咨詢?!皳?jù)市場(chǎng)調(diào)研,不少圖書館、藏書機(jī)構(gòu)等正虛位以待,靜待‘四閣四庫(kù)合璧’?!彼螌W(xué)娟說(shuō)。

“在做好保護(hù)工作基礎(chǔ)上,我們將深入挖掘文溯閣《四庫(kù)全書》價(jià)值,努力在信息服務(wù)、文化創(chuàng)意、文旅融合上求突破,讓這座資源寶庫(kù)在新時(shí)代活起來(lái)、用起來(lái)?!弊x者出版集團(tuán)有限公司黨委書記、董事長(zhǎng)梁朝陽(yáng)表示。

活化利用

首推精選本,開(kāi)發(fā)文創(chuàng)產(chǎn)品,讓更多人領(lǐng)略古籍魅力

“宣傳推廣古籍的文創(chuàng)產(chǎn)品,既要開(kāi)發(fā)周邊,更要聚焦古籍本身?!备拭C省圖書館館長(zhǎng)肖學(xué)智說(shuō),不妨跳出杯子、本子、袋子等樣式,回歸古籍做文創(chuàng),出版精選本圖書。

汪受寬介紹,《四庫(kù)全書》歷來(lái)有“典籍總匯,文化淵藪”之譽(yù),不僅囊括了從先秦至清代乾隆中期之前中國(guó)歷史上的主要典籍,而且涵蓋了中國(guó)傳統(tǒng)學(xué)術(shù)文化的各個(gè)學(xué)科門類和各個(gè)專門領(lǐng)域。

“卷帙浩繁通常也意味著無(wú)從讀起,從這個(gè)意義上講,讓‘高冷’的古籍變暢銷的書籍,就是好文創(chuàng)。”肖學(xué)智說(shuō)。

啟函盒、取夾板、解束帶,《文溯閣四庫(kù)全書影印精選》露出真容。翻開(kāi)書頁(yè),映入眼簾的楷書溫潤(rùn)大方、賞心悅目。每頁(yè)8行、每行21字,雖是手抄,可字的大小、間距幾無(wú)差異,工整如打印一般。

“共計(jì)40卷,分為3函、5種、18冊(cè)?!毙W(xué)智介紹,為突出甘肅文化特色,這套影印精選本甄選了文溯閣《四庫(kù)全書》子部所收古代隴人著作兩種——《潛夫論》和《拾遺記》,另外還有《文房四譜》《法書要錄》《畫史會(huì)要》等書畫藝術(shù)史經(jīng)典作品3種。

這樣一套精裝古籍,俘獲了不少讀者的心。“自去年5月出版發(fā)行,迄今已銷售680多套,平均每天銷售約2套,這在古籍中銷量不低?!备拭C省圖書館文創(chuàng)中心負(fù)責(zé)人介紹,甘肅省圖書館10多年前就曾出版《影印文溯閣四庫(kù)全書四種》,暢銷至今,共售出5600多套。

“優(yōu)質(zhì)的古籍,就是優(yōu)質(zhì)的文創(chuàng)?!毙W(xué)智說(shuō),近年來(lái),甘肅省圖書館以文溯閣《四庫(kù)全書》為素材,從其包裝方式、撰寫格式、用色寓意、人文理念等角度汲取靈感,推出了一系列文創(chuàng)產(chǎn)品,“目前,我們正挖掘文溯閣《四庫(kù)全書》中的龍?jiān)兀磳⑼瞥鎏厣槭侄Y。”

“古籍活化,不能止于開(kāi)發(fā)文創(chuàng)產(chǎn)品。”肖學(xué)智說(shuō),為了讓更多人樂(lè)于走近文溯閣《四庫(kù)全書》,領(lǐng)略古籍魅力,甘肅省圖書館打造了多個(gè)文創(chuàng)場(chǎng)景——線上,推出“文溯·隴跡”等專欄,在“云”上賦予古籍新話題;線下,建成甘肅省圖書館文溯閣《四庫(kù)全書》藏書館展廳,讓參觀者沉浸式體驗(yàn)纂修、流傳、保護(hù)、發(fā)展等歷史場(chǎng)景,與“書”同行……

“我們舉辦的‘千古巨制——《四庫(kù)全書》展’是國(guó)內(nèi)較早推出的《四庫(kù)全書》專題展覽,至今已在全省50多個(gè)圖書館流動(dòng)展出。”肖學(xué)智介紹,今年3月,省圖書館還啟動(dòng)了專題展覽進(jìn)校園活動(dòng),未來(lái)還將推動(dòng)展覽進(jìn)社區(qū)。

年輕讀者馬瑛正是通過(guò)這個(gè)展覽認(rèn)識(shí)了文溯閣《四庫(kù)全書》,并買了一套《影印文溯閣四庫(kù)全書四種》?!皫Щ厝ィ尭嗳肆私馕覀兊牡浼鍖?。”馬瑛說(shuō)。

今年,甘肅省出臺(tái)《關(guān)于以“八個(gè)一”文化品牌為抓手全力推動(dòng)文化傳承發(fā)展的實(shí)施方案》,其中一個(gè)“一”即為“一部《四庫(kù)全書》,讓中國(guó)古典文化活起來(lái)”。實(shí)施方案提出,加強(qiáng)文溯閣《四庫(kù)全書》保護(hù)傳承、整理研究、數(shù)字轉(zhuǎn)化、版權(quán)開(kāi)發(fā)、活化利用等,激發(fā)古籍保護(hù)利用活力。

“影印出版,是活化利用的第一步?!毙W(xué)智說(shuō),未來(lái)還將建設(shè)完整、好用的數(shù)據(jù)庫(kù),研發(fā)音視頻等產(chǎn)品,讓文溯閣《四庫(kù)全書》的“數(shù)字分身”走進(jìn)千家萬(wàn)戶。

《 人民日?qǐng)?bào) 》( 2024年05月31日 第 13 版)

(責(zé)編:周婉婷、王彤)

分享讓更多人看到

返回頂部
行唐县| 正蓝旗| 龙门县| 太康县| 鹿邑县| 广水市| 武夷山市| 淮南市| 崇州市| 金沙县| 盐边县| 普陀区| 株洲市| 甘德县| 开封县| 方山县| 澳门| 双鸭山市| 洛南县| 铁岭县| 金堂县| 宝山区| 扎囊县| 卢氏县| 逊克县| 独山县| 鹰潭市| 甘德县| 江山市| 绥芬河市| 舟山市| 资源县| 离岛区| 长治市| 巴里| 桃园市| 潞西市| 望都县| 屏南县| 和龙市|