谈当前数字图书馆的几个问题

编者按

数字化的浪潮正在冲击全世界包括佛教界数字图书馆的出现正在逐步改变人们获取信息的思维方式和行为方式是图书馆必然的發展方向佛教典籍的数字化进程也已经开始汉文大藏经由此进入第四个时期——数字化时期但目前这一进程目前刚刚起步尚存在诸多问题需要探讨和解决如检索标准版权使用重复劳动等本文对当前数字化图书馆的若干问题进行了深入地思考切中时弊使我们对现阶段全国数字图书馆的状况有一个较为客观的符合实际的认识相信对我们的佛教典籍数字化的工作也一定大有补益

1 概念浅说

1.1 什么是数字图书馆

目前对数字图书馆的一般理解是不需要馆舍虚拟的以数字转换方式贮存大量文献信息资源方便地为公众提供数字化方式检索阅览文献资料的图书馆它体现为基于因特网分布式的信息存储与管理支援信息的普遍存取集成化个性化信息检索与服务这三个特征只要有电脑任何人都可以极为便利地使用分布在全球各地的图书馆中庞大的信息资源体系

客观地说在全球范围内至今还没有一个大家公认的标准的定义和理论阐述可谓众说纷纭其实践状况在欧洲及美日等發达地区和国家也还是处于研究开發阶段并不比我们的现状先进多少

1.2 数字化的方式

目前有图像扫描录校排全息数字化三种方式见下表

方式
优点
缺点
图像扫描
生产成本低
无检索功能
可保留原始版面
占用空间大
显示效果差
不能从版面上摘录文字
录校排
可实现文本摘录和全文检索
原版面信息无法完整保留
占用空间小
生产成本高
误差率高
不能规模化生产
全息数化
可完整保留原版面的全部信息
占用空间比录校排大(但比图像扫描小)
检索手段广泛

从表中可以看出根据不同的使用需求三种方式各有长短从制作技术和使用效果来看前两种方式明显逊色于第三种由于技术的成熟与普及的原因实际上目前在国内最广泛使用的还是第一种即初级阶段的方式真正的数字图书馆除文字外还应包括有声影像现在采用的光碟刻录只是初级形式在概念的认识上不应过于把问题简单化

现在国际上较流行的是正文图像视频音频四种方式对传统纸质书刊的数字转换主要是采用正文和图像方式国内亦大体如此且一般认为正文方式将是發展方向

2 弊端分析

从目前已有的实践看无论国外还是国内数字化图书馆都面临著以下几个问题的困扰

2.1 检索问题

从数字图书馆的發展来说应该有一种统一的标准的分类方法让读者通过电脑网络查询检索信息快速准确地查到所需的数字化信息内容但是目前的信息检索方式还处在开發摸索阶段面对网上海量的信息源用流览方式根本无法满足需要所以检索的效率和速度是数字图书馆面临的最大障碍

具体而言面对不同的文献载体形式可以选用不同的数字转换方式而随著转换方式的不同其检索状况也不相同这就产生了一个问题那就是数字化的目的是什么是仅仅为了节省藏书空间还是为了更便捷地使用恐怕是应以后者为主如前表所述对古籍善本采用图像扫描方式可以很好地保留文献原貌但无法检索而对一般文献采用录校排的文本方式就便于检索但又无法保留文献的完整原貌

在同样以「用」为主的前提下检索就成为使用的难点从理论上说图像扫描后进行OCR识別再进行人工标引就可以达到检索目的但实际上人工标引所涉及的费用和人力无疑将提高数字化的成本而录校排文本方式因为可以全文检索就占据了优势将来图像扫描方式会渐次被其取代至于全息数字化方式因其技术要视IT业技术的發展而逐步完善故目前尚不成熟还未达到广泛应用的阶段

2.2 标准问题

从概念上说首先如果数字化标准的格式不统一就不是图书馆的数字化一个或若干个图书馆搞不成数字化它应该而且必须是一大群图书馆或信息提供单位的联手运作所有參与者都按照统一的格式统一的标准进行数字化其产品才能便于用户查阅使用其次数字图书馆是一项投资巨大的系统工程有了标准不仅可以降低资源数字化过程中的研發成本及数字图书馆的建设成本而且还能加强质量控制和提高生产效率便于推广

但是至今国家尚无一个权威性的统一的可供具体操作的标准利益驱动使得一些图书馆甚至与图书馆根本不搭界的企业都纷纷參与其中造成彼此资源库和技术上的互不相容及浪费在现有的数字化文献中就已经出现了人力物力上的浪费现象比如同一本书已经被某一图书馆数字化了那么其他图书馆就没有必要因自身的需要将其再次数字化由于无法协调造成了同一本书被不同的图书馆重复数字化等于是若干次无意义的重复劳动形成大量的初级层次的重复建设这种不计成本的「亏」我们在历史上是吃得太多了但就是无法解决再者由于各图书馆的资源建设侧重点不同使用户在众多的数字化文献面前难割取舍无所适从致使部分用户可能支付两倍或两倍以上的费用去选择两家或两家以上的数字化产品这也涉及相容问题而相容问题说到底就是标准问题如果说统一标准可以避免重复建设那么规㓰制定这个标准就是首当其冲不可回避的问题严格地说这个标准还应当是国际性标准參与者共同执行全球数字化的统一标准做到世界范围内的资源分享避免不必要的重复建设

2.3 版权问题

目前国内外的数字图书馆都面临著版权问题的困扰著作权者抱怨被侵权,未经本人同意就将其作品数字化,严重损害了他的利益出版商指责网路数字技术造成了大量的无法统计的变相复印本直接影响了他们的经济效益等等但如果获取信息的主动权完全控制在版权拥有者手中谁的出价高就给谁数字化势必形成有钱才能使用信息的情况而这又与知识的创造与传播职能相悖

保护作者出版社的权益是极其重要和不可忽视的问题但事物都是两方面的若对其过分地保护则必然会影响信息的传播实为两难之事对此比较一致的看法是著作人授权并有偿使用其作品这不失为一条可行之路然而这还不是问题的全部文献数字化的目的是便于为公众服务即使上述问题能够得到比较妥善的解决接下来就是要从技术上解决数字化文献本身不被盗版的问题比如图书馆花费很大力量将文献数字化为纯文本供读者使用在网上传播时很可能被人随意盗取全部转过来据为己有这就是数字图书馆自身的版权保护技术尚未解决的问题所以说在保护不被盗版的前提下更好地提供服务既是法律问题又是技术问题其实质就是利益的重新整合

现在出版界正在与法律界探讨关于文献数字化的版权问题努力寻找两全之策使版权的法律不断完善既有效地保护著作者的知识产权又便于为读者提供服务保护他们作为使用者的利益客观地说版权作品的数字化需要完善的法律去维护和保护而要做到这一点并非易事因为在那些数字化先行一步的發达国家也是版权纠纷笔墨官司不断依然存在著数字版权立法不完善版权缺乏必要的法律保护等问题无法从根本上解决数字化图书馆中的这些矛盾

2.4 使用问题

(1)速度

首先在目前国内因特网带宽的现状下文献数字化的方式基本上是按页扫描成像的图形档没有做OCR识別故比相同内容的纯文字档案大数十倍以上使得查阅速度相当慢面对网上的这些海量无序且纷杂的信息源读者无所适从很难快速查到所需要的信息其次现阶段(包括今后相当长的一个时期)国内的多数个人用户是以家庭普通电话线的方式上网的这种电话线是单回路入户铜线直径细信号传输能力差噪音干扰大使网路信息的错误率大为上升并被反复传递这就自然延长了查阅的速度(时间)同时也就意味著读者要多支付网费或电话费这肯定会影响他们使用这种从根本上说就不是完全意义上的数字图书馆的积极性

(2)费用

文献数字化传播会给读者带来极大的方便这是毫无疑问的但即使是以發展的眼光看真正物有所值并能用得起的人尚属少数从现有情况看那种想像中足不出户就可得到所需文献的人更是凤毛麟角「到」图书馆去查数字化文献这本身就是对数字图书馆的一种讽刺也违背了数字图书馆的服务宗旨即使如此去查信息的人也不多不论是高校的教授或科研机构的研究人员不到万不得已时是不会用这种方式去获取信息的道理很简单那就是每查询或下载一个条目都是要支付费用的一次几次尚可如长期下去高昂的费用会令人却步难以持久访问纵然有课题费如若有其他方式可以解决问题谁也不会出此下策

昂贵的费用影响了数字图书馆的發展使用它的人公费多自费少限制了读者人数这就是理想与现实之间不可否认的巨大差距

(3)习惯

从多数人的实际情况来说基本阅读方式还是比较喜欢纸质的文献载体形式这不仅是几千年传承下来的方式与习惯而且还是一种文化氛围的体现和反映试想一册古籍线装书在手翻阅研读与在萤幕上阅读是两种完全不同的感受后者的「书卷气」势必荡然无存传统文化的气息是数字化体现不出来的如纸质印刷版別等这并不是说要食古不化抱残守缺更不是说数字图书馆与传统图书馆二者之间此消彼长而是说要尊重客观现实对传统文化中仍有生命力的事物不能一概否定应该是彼此共存互为补充合力發展

(4)健康

人一生中只有一对眼睛既不能再生也不能移植不论是阴极射线显像管(CRT)还是液晶显示器(LCD),长时间地坐在它们面前阅读萤幕对人体尤其是眼睛都有一定程度的伤害时间长了不仅仅是视觉疲劳的问题而且还会导致视力下降身体乏力直接影响人体健康一般说近距离直视萤幕二十分钟后眼睛就会有發乾發涩视物不清的感觉所以喜欢大篇幅从萤幕上阅读文献的人较以往逐年减少当然这只是经验之谈据观察统计多数读者还是习惯于把那些自己需要反复阅读的文献章节打印出来后带走极少有读者也可以说几乎没有人为了获取同一信息而反复多次在收费网上进出

在时下一片数字图书馆热的舆论中笔者的这些「不合谐」音符并不是要标新立异反潮流而是想通过现象认清弊端找出缩小差距的办法使真正的数字图书馆进入千家万户使人们用得好(方便)用得起名副其实地达到其理想的目标以往那种听风是雨不顾自己的具体实际情况盲目地一哄而上争拔头筹各自为政造成诸多后遗症的教训不应在数字图书馆的实施过程中再次發生

參考文献

  • 1.闻生倪光南《质疑中国数字图书馆》载《北京青年报》2002年4月30日第67版

  • 2.孙坦辛希孟齐柳明吴小京《数字图书馆让普通人学富五车》载《光明日报》2002年8月14日cl版

  • 3.孙承鉴刘刚《中国数字图书馆建设的起步与發展》《国家图书馆学刊》2000年第三期

内容源自:漢文大藏經,繁转简后提供

谈当前数字图书馆的几个问题
关闭
谈当前数字图书馆的几个问题
关闭
返回首页
章节列表
分卷列表
更多