谈当前数字图书馆的几个问题
编者按:
数字化的浪潮正在冲击全世界,包括佛教界。数字图书馆的出现正在逐步改变人们获取信息的思维方式和行为方式,是图书馆必然的發展方向。佛教典籍的数字化进程也已经开始,汉文大藏经由此进入第四个时期——数字化时期。但目前这一进程目前刚刚起步,尚存在诸多问题需要探讨和解决,如检索、标准、版权、使用、重复劳动等。本文对当前数字化图书馆的若干问题进行了深入地思考,切中时弊。使我们对现阶段全国数字图书馆的状况,有一个较为客观的、符合实际的认识。相信对我们的佛教典籍数字化的工作,也一定大有补益。
1 概念浅说
1.1 什么是数字图书馆
目前对数字图书馆的一般理解是:不需要馆舍、虚拟的、以数字转换方式贮存大量文献信息资源、方便地为公众提供数字化方式检索、阅览文献资料的图书馆。它体现为基于因特网分布式的信息存储与管理,支援信息的普遍存取,集成化、个性化信息检索与服务这三个特征。只要有电脑,任何人都可以极为便利地使用分布在全球各地的图书馆中庞大的信息资源体系。
客观地说,在全球范围内至今还没有一个大家公认的、标准的定义和理论阐述,可谓众说纷纭。其实践状况,在欧洲及美、日等發达地区和国家也还是处于研究开發阶段,并不比我们的现状先进多少。
1.2 数字化的方式
目前有图像扫描、录校排、全息数字化三种方式,见下表。
从表中可以看出,根据不同的使用需求三种方式各有长短,从制作技术和使用效果来看,前两种方式明显逊色于第三种,由于技术的成熟与普及的原因,实际上目前在国内最广泛使用的还是第一种,即初级阶段的方式。真正的数字图书馆除文字外还应包括有声影像,现在采用的光碟刻录只是初级形式,在概念的认识上不应过于把问题简单化。
现在国际上较流行的是正文、图像、视频、音频四种方式,对传统纸质书刊的数字转换主要是采用正文和图像方式,国内亦大体如此,且一般认为正文方式将是發展方向。
2 弊端分析
从目前已有的实践看,无论国外还是国内,数字化图书馆都面临著以下几个问题的困扰。
2.1 检索问题
从数字图书馆的發展来说,应该有一种统一的、标准的分类方法,让读者通过电脑网络查询、检索信息,快速准确地查到所需的数字化信息内容。但是目前的信息检索方式还处在开發摸索阶段,面对网上海量的信息源,用流览方式根本无法满足需要,所以检索的效率和速度是数字图书馆面临的最大障碍。
具体而言,面对不同的文献载体形式,可以选用不同的数字转换方式,而随著转换方式的不同,其检索状况也不相同。这就产生了一个问题,那就是数字化的目的是什么,是仅仅为了节省藏书空间,还是为了更便捷地使用?恐怕是应以后者为主。如前表所述,对古籍善本,采用图像扫描方式可以很好地保留文献原貌,但无法检索。而对一般文献采用录校排的文本方式就便于检索,但又无法保留文献的完整原貌。
在同样以「用」为主的前提下,检索就成为使用的难点。从理论上说图像扫描后进行OCR识別,再进行人工标引就可以达到检索目的,但实际上人工标引所涉及的费用和人力,无疑将提高数字化的成本,而录校排文本方式因为可以全文检索就占据了优势,将来图像扫描方式会渐次被其取代,至于全息数字化方式,因其技术要视IT业技术的發展而逐步完善,故目前尚不成熟,还未达到广泛应用的阶段。
2.2 标准问题
从概念上说,首先如果数字化标准的格式不统一,就不是图书馆的数字化。一个或若干个图书馆搞不成数字化,它应该而且必须是一大群图书馆或信息提供单位的联手运作,所有參与者都按照统一的格式、统一的标准进行数字化,其产品才能便于用户查阅使用。其次,数字图书馆是一项投资巨大的系统工程,有了标准不仅可以降低资源数字化过程中的研發成本及数字图书馆的建设成本,而且还能加强质量控制和提高生产效率,便于推广。
但是,至今国家尚无一个权威性的、统一的可供具体操作的标准。利益驱动使得一些图书馆,甚至与图书馆根本不搭界的企业都纷纷參与其中,造成彼此资源库和技术上的互不相容及浪费,在现有的数字化文献中就已经出现了人力、物力上的浪费现象,比如同一本书,已经被某一图书馆数字化了,那么其他图书馆就没有必要因自身的需要将其再次数字化,由于无法协调造成了同一本书被不同的图书馆重复数字化,等于是若干次无意义的重复劳动,形成大量的初级层次的重复建设,这种不计成本的「亏」我们在历史上是吃得太多了,但就是无法解决。再者,由于各图书馆的资源建设侧重点不同,使用户在众多的数字化文献面前难割取舍,无所适从,致使部分用户可能支付两倍或两倍以上的费用,去选择两家或两家以上的数字化产品。这也涉及相容问题,而相容问题说到底就是标准问题,如果说统一标准可以避免重复建设,那么,规㓰、制定这个标准就是首当其冲不可回避的问题。严格地说,这个标准还应当是国际性标准,參与者共同执行全球数字化的统一标准,做到世界范围内的资源分享,避免不必要的重复建设。
2.3 版权问题
目前,国内外的数字图书馆都面临著版权问题的困扰。著作权者抱怨被侵权,未经本人同意就将其作品数字化,严重损害了他的利益;出版商指责网路数字技术造成了大量的、无法统计的变相复印本,直接影响了他们的经济效益等等。但如果获取信息的主动权完全控制在版权拥有者手中,谁的出价高,就给谁数字化,势必形成有钱才能使用信息的情况,而这又与知识的创造与传播职能相悖。
保护作者、出版社的权益是极其重要和不可忽视的问题,但事物都是两方面的,若对其过分地保护则必然会影响信息的传播,实为两难之事,对此比较一致的看法是著作人授权并有偿使用其作品,这不失为一条可行之路。然而这还不是问题的全部,文献数字化的目的是便于为公众服务,即使上述问题能够得到比较妥善的解决,接下来就是要从技术上解决数字化文献本身不被盗版的问题,比如图书馆花费很大力量将文献数字化为纯文本供读者使用,在网上传播时很可能被人随意盗取,全部转过来据为己有,这就是数字图书馆自身的版权保护技术尚未解决的问题。所以说在保护不被盗版的前提下更好地提供服务,既是法律问题又是技术问题,其实质就是利益的重新整合。
现在出版界正在与法律界探讨关于文献数字化的版权问题,努力寻找两全之策,使版权的法律不断完善,既有效地保护著作者的知识产权,又便于为读者提供服务,保护他们作为使用者的利益。客观地说,版权作品的数字化,需要完善的法律去维护和保护,而要做到这一点并非易事,因为在那些数字化先行一步的發达国家,也是版权纠纷笔墨官司不断,依然存在著数字版权立法不完善,版权缺乏必要的法律保护等问题,无法从根本上解决数字化图书馆中的这些矛盾。
2.4 使用问题
(1)速度
首先,在目前国内因特网带宽的现状下,文献数字化的方式基本上是按页扫描成像的图形档,没有做OCR识別,故比相同内容的纯文字档案大数十倍以上,使得查阅速度相当慢,面对网上的这些海量无序且纷杂的信息源,读者无所适从,很难快速查到所需要的信息。其次,现阶段(包括今后相当长的一个时期)国内的多数个人用户是以家庭普通电话线的方式上网的,这种电话线是单回路入户,铜线直径细,信号传输能力差,噪音干扰大,使网路信息的错误率大为上升并被反复传递,这就自然延长了查阅的速度(时间),同时也就意味著读者要多支付网费或电话费,这肯定会影响他们使用这种从根本上说就不是完全意义上的数字图书馆的积极性。
(2)费用
文献数字化传播会给读者带来极大的方便,这是毫无疑问的,但即使是以發展的眼光看,真正物有所值并能用得起的人尚属少数。从现有情况看,那种想像中足不出户就可得到所需文献的人更是凤毛麟角。「到」图书馆去查数字化文献,这本身就是对数字图书馆的一种讽刺,也违背了数字图书馆的服务宗旨。即使如此,去查信息的人也不多,不论是高校的教授或科研机构的研究人员,不到万不得已时是不会用这种方式去获取信息的。道理很简单,那就是每查询或下载一个条目都是要支付费用的。一次、几次尚可,如长期下去,高昂的费用会令人却步,难以持久访问。纵然有课题费,如若有其他方式可以解决问题,谁也不会出此下策。
昂贵的费用影响了数字图书馆的發展,使用它的人公费多,自费少,限制了读者人数,这就是理想与现实之间不可否认的巨大差距。
(3)习惯
从多数人的实际情况来说,基本阅读方式还是比较喜欢纸质的文献载体形式,这不仅是几千年传承下来的方式与习惯,而且还是一种文化氛围的体现和反映。试想一册古籍线装书在手翻阅研读,与在萤幕上阅读,是两种完全不同的感受,后者的「书卷气」势必荡然无存。传统文化的气息是数字化体现不出来的,如纸质、印刷、版別等。这并不是说要食古不化、抱残守缺,更不是说数字图书馆与传统图书馆二者之间此消彼长,而是说要尊重客观现实,对传统文化中仍有生命力的事物不能一概否定,应该是彼此共存、互为补充、合力發展。
(4)健康
人一生中只有一对眼睛,既不能再生也不能移植。不论是阴极射线显像管(CRT),还是液晶显示器(LCD),长时间地坐在它们面前阅读,萤幕对人体尤其是眼睛都有一定程度的伤害。时间长了,不仅仅是视觉疲劳的问题,而且还会导致视力下降、身体乏力,直接影响人体健康。一般说近距离直视萤幕二十分钟后,眼睛就会有發乾、發涩、视物不清的感觉,所以喜欢大篇幅从萤幕上阅读文献的人较以往逐年减少。当然这只是经验之谈。据观察统计,多数读者还是习惯于把那些自己需要反复阅读的文献章节打印出来后带走,极少有读者,也可以说几乎没有人为了获取同一信息而反复多次在收费网上进出。
在时下一片数字图书馆热的舆论中,笔者的这些「不合谐」音符并不是要标新立异反潮流,而是想通过现象,认清弊端,找出缩小差距的办法,使真正的数字图书馆进入千家万户,使人们用得好(方便)、用得起,名副其实地达到其理想的目标。以往那种听风是雨,不顾自己的具体实际情况,盲目地一哄而上争拔头筹,各自为政,造成诸多后遗症的教训,不应在数字图书馆的实施过程中再次發生。
參考文献
1.闻生、倪光南:《质疑中国数字图书馆》,载《北京青年报》,2002年4月30日,第6、7版。
2.孙坦、辛希孟、齐柳明、吴小京:《数字图书馆让普通人学富五车》,载《光明日报》,2002年8月14日,cl版。
3.孙承鉴、刘刚:《中国数字图书馆建设的起步与發展》,《国家图书馆学刊》,2000年第三期。
【经文资讯】《藏外佛教文献》第 W09 册 No. ZW09na053 谈当前数字图书馆的几个问题
【版本记录】發行日期:2022-01,最后更新:2021-01-07
【编辑说明】本资料库由中华电子佛典协会(CBETA)依《藏外佛教文献》所编辑
【原始资料】方广锠大德提供
【其他事项】详细说明请參阅【中华电子佛典协会资料库版权宣告】
内容源自:漢文大藏經,繁转简后提供