作为编委会的基础工程,网络中心怎样才能成为清史纂修工程名副其实的基础部门,怎样才能充分发挥为专家服务的职能?这是网络中心一直以来孜孜探求的途径。 基础是什么?具体修史而言,史料无疑是基础之一。完整、全面的史料占有是修史质量和重要保证;与此同时,现代数字信息及网络技术,是为专家提供高速查阅和检索的手段,是修史速度和质量的基础性保证。 服务是什么?服务是行为,是职责和任务,更是一种精神,是一种蕴含了某种奉献精神的具体而微的工作行为。只有把服务的精神贯穿于信息化数字化过程中,专心致志地做好每一件为专家所需的工作,才可能成为实实在在的基础工程。 谈到网络中心应当为专家提供怎样的服务以及怎样才能服好务,就不能不从网络中心的工作现状谈起。 网络中心当前的工作可以简单划分为五个部分,一是网络管理;二是清史纂修数据库的开发建设和日常维护;三是清史档案资料数字化加工工作;四是中华文史网栏目内容的编辑和更新等工作;五是日常服务工作(办公自动化设备以及各二级组软硬件的维护与保养)。上述各方面虽不同阶段因工作重心不同而有所侧重,但总体发展应呈现平衡、统一发展的格局,只有各部分相互协调配合,才能充分发挥基础及服务职能。 下面,拟就上述五个方面简述网络中心的工作现状、未来的发展走向以及目前尚存在的困难和问题。 一、网络管理所谓网络管理,简单说是指网络管理员通过网络管理程序对网络上的资源进行集中化管理的操作,包括配置管理、性能和记账管理、问题管理、操作管理和变化管理等。 网络管理分为两类。第一类是网络应用程序、用户帐号(文件的使用)和存取权限(许可)的管理。它们都是与软件有关的网络管理问题。第二类是由构成网络的硬件所组成。这一类包括工作站、服务器、网卡、路由器、交换机、网桥和集线器等等。 中华文史网是编委会与全国各地专家信息交流的平台,三年来,中华文史网的信息涵量日益丰富,随着档案资料数据量的不断增加,可以预期,中华文史网将日益成为全国各地专家纂修过程中不可分离的助手和工具。 中华文史网能够正常运转的背后有一个强大的网络管理系统。自五月份以来,网络中心用较大的精力投入新办公楼的综合布线和机房工程建设上。新办公楼网络控制中心将在原有基础上集成新一代64位4个CPU的服务器,使数据库快速检索有了硬件设备的保障。 新办公楼网络控制室(机房),将24小时不间断地对专家开放,随时解答资料检索中遇到的各种问题,提供各种相关服务。经编委会领导批准,网络中心正在加强技术队伍建设,增加优秀的青年技术人员,以适应新办公楼工作量加大、技术难度增加的新情况和新问题。 二、清史纂修数据库的建设开发和日常维护。作为清史纂修的基础部门,在能够为专家们提供的服务中,哪些服务是专家最需要的?这方面许多专家都有一个共识:当然是史料、档案的信息化检索手段。因为清史资料和档案浩如烟海,查找起来谈何容易。如果将档案资料数字化,就会大大提高纂修效率,几倍、几十倍甚至上百倍于手工检索。而效率和质量往往是相互联系的,有了更完整、更全面的资料档案,资料遗漏少,纂修质量自然就高。 专家的这些建设性意见对数据库建设和开发提出了明确要求。首先,是对数据库的选择。什么是数据库?如果用图书馆作比,数据库就相当于房子,数据就相当于房子里储藏的书籍。 房子固然重要,但并不是越大越好,而是要符合清史纂修工程的特殊性,其选择要适当,而不能一味地贪大,外国的数据库一定比国产的好。就清史档案而言,版本非常复杂,且多为手写善本,有的文字书写相当难以辨认;而有些较为重要的资料已出简体纸质版本;有的则是台湾的繁体版本,等等。将这些不同版本的档案史料通过现代信息技术转换为数字文本,且统一于一个数据库内,传统的关系数据库已不能胜任,由此需要采用非结构化数据库(所谓非结构化数据库,是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库。它从数据模型入手,采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的非结构化或者说任意格式的字段,从而突破了关系数据库严格的表结构,解决了关系数据库模型过于简单、不便表达复杂嵌套的问题)。其二,检索起来要方便,快捷,层次较少,这是因为要充分考虑到一些年事较高的老专家的特殊需要。其三,保证数据的安全性。 在数据库第一期开发中上仍存在一些问题,有专家反映检索起来费时、层次过于繁琐,还有目录式存取存在一定的安全隐患等等。总起来看应该着手解决以下问题: ①变目前结构化数据库为非结构化数据库。 ②服务器应在网络中心架设而不能托管在外,这在系统安全、数据安全管理上说是非常必要的。 ③数据档案的数字化加工、管理、发布平台模块没有得到一体化整合。但目前的数字化加工、管理以及发布平台处于分离,封闭的状态,这时必须解决的问题。 ④目前数据库缺少数据特色功能检索(全文、关联、同义词检索)。 ⑤没有解决附件目录存放问题,必须采用非结构全文数据库存储于数据库中(解决文献附件管理问题)。 ⑥必须解决日益增大的档案数据文献管理、检索、效率问题。 ⑦目前档案文献的操作过于繁琐,需要立即着手解决。 以上都是我们在第二期开发时应当高度重视和尽快修订和改正的。 三、清史档案资料数字化加工工作大家知道,仅有数据库而没有数据是没有意义的。正如前例,仅有房子没有图书不能称其为图书馆,对图书馆而言,图书是图书馆所以是图书馆的根本性问题。简而言之,清史数据是将与清史纂修工作联系最密切的、纸质的清史档案资料转变成在电脑中可读的电子文本,再把这些电子文本加载到专用的数据库里面,于是,这些档案资料不仅可读而且可以检索,其检索速度是人工查找的几亿分之一,其准确率也是人工不可比拟的。 正如一些专家所说:清史史料数字化对编修人员来说实在是太重要了。首先是史料很难查找,有的老师为了查找资料,花费很多时间和精力,跑遍全国各大资料馆,大海捞针般地查找所需史料;即使找到后也并不轻松,还需要聘请几个甚至十几个学生录入,必须按要求(电子版)完成项目。专家们把大量的时间消耗在清史编纂的基础工作上,而不是在纂修本身,效率很低,也是很大的浪费。其实,资料先行是修史的规律,史书编纂质量的优劣,很大程度上取决于史料占有的完整性以及史料来源的可靠性。 的确,数据、数据库和网络,是清史纂修质量和速度的一个重要保证。清史纂修工程是国家的一件大事,也是一件十分严肃、严谨的学术事业。为了保证最终成果的质量和达成预期目标的时限,网络中心必须将史料数字化这一基础工作做好,尽可能在较短时间里将史料数字化并方便专家使用。 从2006年3月至7月,网络中心尝试了自编委会成立以来的第一次数字化加工工作。工作程序如下: 第一阶段:数字化内容的调查摸底: 从四月中旬开始,网络中心着手调查,汇集了2005年10月以来的专题调查、会议、专家个人访谈、问卷调查、专家研究等500余种书目和史料等七个方面的信息,从最初的300多个条目中筛选整理出来120余种。经编委会和清史办领导批准后,网络中心2006年5月24日召开了数字化工作会议,广泛征求专家意见,以避免盲目性,增强决策的科学性。会上各二级组专家对上述11种史料进行了讨论,在此基础上,将原11种增加到15种: 历朝上谕档;圣训;起居注(康熙朝);宫中档;军机处朱批奏折;新清史;大清一统志;地方志;清代史料笔记丛刊;清经世文编;碑传集四编;国朝耆献类征;史料旬刊;明清史料;明清档案。 6月2日经编委会审批后删除了地方志和新清史2种,保留了其余13种。 第二阶段,对古籍数字化加工企业调查阶段。2006年5月下旬至2006年6月上旬,针对北京地区(乃至全国)具备古籍数字化加工能力的企业进行了初步调查。在所调查的企业中,符合本项目需求的企业共8家。 第三阶段,制定加工标准。根据加工书目的具体情况参考国际国内的数字化标准,网络中心草拟初步的加工标准。 第四阶段,转向由项目中心为主导,网络中心为辅助的招投标工作筹备工作阶段。网络中心于2006年6月中下旬,与项目中心工作人员进行沟通和磋商,确认了项目开展的各种资料、流程,并认定本项目招标方式为邀标形式。 第五阶段,组织验收工作。 上述前三个阶段工作进展顺利,进入第四阶段即招投标工作阶段,有评委对档案版权问题提出疑问而暂时搁置。这项工作主要是由于我们事前考虑不周,工作做得不够深入导致,我们正在总结经验及教训,争取扎扎实实做好每一阶段工作。但我们有理由相信,在编委会的正确领导下,一定能够跨越这一障碍和困难。 四、中华文史网栏目内容的编辑和更新等工作截止2005年4月,中华文史网开通运行已经一年多,初步得到了各方面的认可,同时也积累了各个部门、各位专家的反馈意见。各方面的意见主要集中在两方面:中华文史网的定位及其内容建设;中华文史网的技术架构和功能模块调整。在认真分析讨论各方宝贵意见后,认识到改版是最好方式。 改版准备工作从2005年5月开始筹备,通过邀标评选,选择了北京海市经纬网络公司进行改版方案实施,于2005年7月开始,历经十个月的时间,于2006年4月改版完毕,其中包含试运行3个月,基本达到了预期目标。 针对旧版中的弊病,中华文史网通过改版达到如下效果: 1、旧版的页面设置,也就是栏目设置,很难非常直观地、醒目地体现清史纂修工程这一中心任务,同时也无法充分发挥普及文史知识的功能。所以,将旧版的10个一级栏目,凝缩为新版五个一级栏目,其中又以清史纂修工程、中华文史栏目为重点建设方向。这样明确了区分,更好地执行了戴逸先生在中华文史网发刊词当中所做指示的精神。 2、中华文史网的内容建设,应当区分严肃和活泼两种不同的风格,不宜做一致处理。清史纂修作为国家重大文化工程,自当充分体现其庄重、严谨的一面;而中华文史栏目,则应当充分发挥其传播、传承中华文化的功能,它的风格是多样的、形式是活泼的。同时,这种严肃与活泼的风格又要统一起来,共同构成中华文史网的主体内容。通过网页的改版,重新设计了一种融严肃与活泼、主体与辅助一体的页面风格。史之既大方,又不失庄重;既活泼,又不失严谨。 3、旧版中华文史网的日常工作进展,在技术上缺乏有效的管理模块,因而造成了许多不必要的重复劳动,给日常的编辑工作带来了很大的不便,浪费了许多人力和时间。新版的管理模块更为灵活,根据编辑定制管理的栏目。 4、为了更好地做好与清史纂修工程有关的工作,必须采取多样化的方式来宣传自己,打造自己在学术界的品牌和形象。这一点,一方面是要通过扎扎实实的工作,一方面则要注意运用多种多样的形式、建设多种多样的渠道。改版后,中华文史网开辟了“在线调查”、“留言板”、“文化论坛”等功能性栏目,与读者进行互动,以便提高网页的建设。 中华文史网的技术架构和功能模块调整,具体调整罗列如下: 1、中华文史网数据库基于Oracel 9i,非结构化数据库选用竞标公司自有产品。 2、网站美工设计本着严谨与活泼相结合的形式,主页和首页设计了多稿,经多次会议后,选定了以蓝色为主体色,并开辟繁体中文版本。 3、新版的网站功能比旧版的功能更为强大,包括网站内容动态发布系统、信息管理平台、全文检索系统、论坛系统、在线评论模块、制定各栏目板块上传内容模板等十余个模块。 4、网站垃圾代码解决方案。将网页的动态页面转换为静态页面,提高了浏览的速度。 5、网站安全备份解决方案。采用了双机热备的方式,保证了网站可以不间断地为清史服务。 6、将旧版网站内容数据迁移到新版的网站。 7、制作了旧版中华文史网网站内容汇总光碟500份。 五、日常服务工作(办公自动化设备以及各二级组软硬件的维护与保养)各二级组的专家和领导对网络中心的日常服务工作给予了一定的好评,但我们不能满足和停留在这个水平上。下一阶段,我们将建立日常服务工作的制度和规范,使日常服务工作上一个新的水平。我们的想法是:为办公楼各二级组提供全方位的服务。服务项目包括:软件安装、硬件设备维修或报修、计算机应用及数据库检索培训等。 存在的困难和问题1、数据库的开发、建设、维护、管理脱离网络中心工作 上述四项应当是一体化的,而不能相分离和脱节。这是为什么呢?因为数据库的开发必须建立在为清史纂修工程服务的基础上。就如为某人做一件衣服需要量体裁衣,才能合用一样,数据库的开发方案应当在充分的调查研究基础上,且应当征得编委会和专家的认可;其二,作为网络管理机构,对数据库方案没有了解,会给网络管理人员的维护和管理带来一系列困难;一旦出现问题,会出现职责不清的局面;其三,为专家提供档案史料是网络中心的岗位职责,数据库的开发、维护、管理都不应也不可能脱离网络中心。 2、数据档案的数字化加工、管理、发布平台模块没有得到一体化整合 通俗一点说,目前的数据库,没有将数字化加工和管理、发布融合起来,使之成为一个有机统一的整体。加工、管理、发布分离开来的一个最大弊病就是盲目地加工,盲目地数据库开发,档案数字化加工不知道为谁加工,怎样加工。上述“量体裁衣”是一个较好的例子。而数据库开发也不知道将来载入的数据是什么样子,所以开发也一定是盲目的。就像图书馆盖房子,不知道未来会有多少书,什么样的书,该为什么样的书盖什么样的房子等等,结果自然是盖房子的,做衣服的,都一定程度地在“盲人骑瞎马”。 3、网络中心的岗位职责 无论数据库开发建设、维护、管理还是档案史料的数字化加工,按照岗位职责,都应当是网络中心的份内之事,是任务也是职责。无论怎样,都不应当将网络中心置身事外,更不应当对网络中心采用封锁、保密的态度。 这是一种管理思想,是服从于国家清史纂修工程大局的管理思想;也是一种管理职责,是有利于服务专家、有利于分清职责、有利于提高管理效率的职责。时不我待,清史纂修工程并非没有时限的项目。 总之,网络中心希望能够尽快进入有序化、正常化的工作状态。 本文由网络中心负责人吕守信提供,转载请注明出处 |