四 国内非遗数据库现状调查
(一)现状概述
在我国非遗数据库领域,中国艺术研究院最早建立了戏曲剧种音像数据库,已保存了200多个戏曲剧种的大量音像资料。在当代,非遗数据库建设与保护工作几乎同步。2005年,文化部即批复中国艺术研究院启动中国非遗数据库建设工作,2006年,非遗数据库普查管理系统软件开始在全国推广使用。针对普查制定的项目代码在全国范围内基本得到了推广,但是由于相关软件系统在前期单机版无法实现多机数据整合等原因,没有能得到很好的使用。国家非遗数据库配合保护工作不断完善其主体结构,曾召开数次非遗数据库试点会(2008年于宜昌)、研讨会(2010年、2011年于北京)等,并在山东等省进行了试点建设,总体目标是建成一个全国性的非遗数据库管理系统。近年来,我国启动了“中国非物质文化遗产数字化保护工程”,标志着非遗数字化国家标准进入制定阶段;2011~2012年,完成了山东高密扑灰年画、陕西秦腔、安徽徽派传统民居营造技艺、吴歌等4个一期项目;2013年,非物质文化遗产数字化管理系统试点启动。但是,我国至今还未正式颁布非遗数字化相关标准性文件。除此之外,“中国民间文化遗产抢救工程”以社会团体的力量建立了“中国民俗图文资料数据库”等。
与此同时,部分省级非遗保护中心也陆续启动了省级数据库建设工程,有一些已经建成或初步建成;极少数地市级也进行了非遗数据库的建设实践,其中,湖北省宜昌市数据库建立较早,在当时有一定的借鉴与推动意义,曾在当地召开国家非遗数据库的现场会。总的来说,我国非遗数据库的建设已然在摸索中全面铺开,但是,国家层面体制机制保障不到位、标准化工作滞后,使得已经建立的地域性非遗数据库差异较大,存在巨大的对接、整合与共享难度。
非遗数字化保护和数据库建设面临着许多问题。
①数字化保护较之其他保护措施,其推进速度仍旧较为缓慢。非遗保护工作在中国尚处于初级阶段,名录项目和传承人申报、非遗普查、非遗生态保护区申报等保护措施由于有较大的利益驱动和经费保障,执行情况较好,但是数字化保护和数据库建设等则未得到充分重视,同步启动但进展较缓慢。
②数据资源标准尚未统一。少部分省市由于认识到数字化保护手段的便利,开展了实践甚至建成了能用、好用的数据库,但不可否定的是,数字化保护这项工作整体已然滞后,而且,已建成的地方性数据库由于没有统一的数据标准统领,未来势必面临兼容和共享方面的困境,甚至有可能沦为一座座“信息孤岛”。
③项目数据资源分类尚未完善。现有的非遗项目分类体系存在较大争议,而非遗数字化保护分类代码理应建立在成熟的分类体系研究基础之上。目前的分类体系运用在数据库建设与运行中出现了较多问题,许多项目归属类别不清造成隶属错误或隶属于多个类别,使得大量项目的类别归属需要依赖人为判定,最终造成标准不一、查找困难、利用混乱。比如:民间歌与舞经常是不分家的,代码表中却把音乐和舞蹈分列为两个大类。在第三章中将对这些问题进行详述。此外,普查与名录为两套分类代码,数据库在资源统合中需要依赖中间表,也存在较多问题。
④各地各类工作人员对资源内涵的理解都不同,管理理念迥异,更谈不上完善的管理机制。例如,某些地区主管部门对非遗资源保存缺乏正确的价值认识,一门心思收集非遗项目制成品、工具、文献等实物,将传承人和表演、技艺晾在一边,除了保护工程实施中留下来的工作性文件和申报资料外,数字化采集的内容对象贫乏,掌握的数据片面、辅助,根本不涉及项目的代表性和核心部分。
⑤各地的资源数据库对同类或者相近资源的描述存在很大的差异性。主要原因是,没有统一的项目信息录入标准,对资源的描述程度也不同。例如,在分类体系中规定了非遗项目的主要类属名称,而在具体项目信息录入中没有提供详细操作标准,没有提供每一类属包含项目的详细命名规则、名称解释及判定依据。因此,要给不同类属的项目资源设计不同的信息著录表单,将所需的著录信息内容进行分门别类地明示,否则,对资源的描述就具有了很大的随意性。
综上所述,目前,非遗数据库在理论和技术层面都存在很多的分歧,主要问题包括:由于非物质文化遗产分类体系问题造成的数据库分类难题、非物质文化遗产数据库的核心元数据尚未建立、数字化保护的各类标准尚未统一以及技术层面非遗数据库整合的必要性问题,在当今“云”的概念之下,整合国家、地区非遗数字化资源的必要性值得探讨,在资源数字化保护标准化工作逐渐完善的前提下,分布式存储是否是顺应发展的选择,在共享没有障碍的情况下,达到非遗资源的虚拟统合。
(二)调查数据
1.数据库建设基本情况调查
本书选取河北省、陕西省、江苏省、山西省和浙江省五个省级非遗数据库建设情况作为调查对象,主要依据包括以下几方面。
①对国内非遗数据库互联网上线情况调查显示,陕西、山西、浙江省数据库相关网站已上线并可登录浏览,河北省数据库网站正在改版,改版前可登录。
②以上五个数据库都不断有关于进展情况的媒体报道或者信息发布。
③以上数据库在进度、规模等方面在国内具有典型性和代表性,如,山西与河北建成早,浙江曾作为国家非遗数字化保护中心调研对象等。
本书认为,这五个调查点基本代表了国内非遗数据库建设的实践面,将为数据库实际建构提供重要的需求信息与背景信息。
本书在这五个调查点发放了调查问卷,请见附1(《全国非物质文化遗产数据库建设基本情况调查表》)。问卷回收后,进行了汇总,统计情况请见附3(《全国非物质文化遗产数据库建设基本情况调查表回收统计表》)。
从调查统计情况,可以明显看到,这些省份都已经看到了这项工作的重要性和特殊意义,都在一定程度上推进了非遗数据库建设工作的正常开展。五个调查省份的非遗数据库工作都由省文化厅主管。
(1)建成的情况
河北省与山西省非遗数据库已经建成,建成时间分别为2010年和2008年。其中,河北省非遗数据库包括普查、名录、网上评审报备、电子分布式图集等15个主要功能模块。山西省非遗数据库包括6个子系统,分别是项目申报子系统、普查管理子系统、专家评审子系统、传承人信息子系统、保护资金管理子系统(建设中)、保护单位项目管理子系统(建设中)以及1个资源数据库系统和1个数字博物馆。
相通之处:河北省与山西省非遗数据库都由省非遗保护中心直接负责和进行运维;结构功能设置较为类似,都包含了与保护工程实施项目相对应的普查、名录项目、传承人以及评审等对应工作环节的模块;现阶段数据库主要用于内部办公;由于建立较早,都存在着与国家非遗数据库对接时兼容性的担忧。
不同之处:分类依据不同,河北省主要以数字资源格式与用途分类,而山西省主要依据普查项目分类和名录项目分类作为数据库主要分类依据;山西省数据库平台入口设在互联网,但只开放少部分内容,河北省还在升级改版之中,目前还无法在互联网上呈现。
(2)未建成的情况
陕西省、江苏省和浙江省非遗数据库尚未建成,其中,江苏省与浙江省预计在2013年底建成。
相通之处:主要由各省非遗保护中心负责。
不同之处:陕西省由省非遗保护中心与省图书馆合作建设,江苏省由省非遗保护中心与省文化馆合作建设,浙江省则由省非遗保护中心一家负责;江苏省和浙江省建设资金到位,陕西省尚未到位;资金到位的省份倾向于采取资源数字化采集统一实施的形式,而资金不足的省份主要依靠基层开展数字化基础采集工作;在资金较为充裕的情况下,相关单位做了全省资源联网、标准接口制定等方面的设想和实践;陕西省和浙江省已有数据库的互联网平台,江苏省还没有。
2.数据库互联网上线情况调查
本书还通过百度搜索引擎,对我国非遗数据库互联网上线情况进行了一次摸底。有关情况汇总请见附2(《我国非物质文化遗产数据库互联网上线情况调查》)。
调查发现,数据库以相对独立的互联网站平台上线的情况并不乐观。本书分别于2012年9月11日和2012年9月30日进行两次非遗数据库互联网上线情况调查。调查途径为百度搜索引擎,检索关键词为“非物质文化遗产数据库”。调查发现,只有11家省、市、县及媒体等单位建立的非遗数据库在互联网中可以正常开启、浏览。其中,省级的有4个,地市级的有3个,县级的有2个,企业、媒体等机构单位的有2个。目前,由于非遗数据库中数字资源的访问人群主要为政府机构人员,以及少量学术机构人员、项目传承人与从业人员,所以,数据库多以内部局域网服务的形态存在。上述提供互联网访问平台的数据库,主要有三种情况:一是主要为权限访问提供登录界面;二是提供少量数字资源供互联网访问,没有与后台数据库建立紧密的资源供给联系;三是提供少量数字资源供互联网浏览,根本没有后台数据库作支撑。
3.山西省非遗数据库实地调查
山西省非遗数据库建成较早,较为成熟,本研究选择其作为实地调查对象,于2011年11月12日和2012年3月30日2次就该数据库搭建与运行的整体情况和主要问题、山西省非遗四级名录项目的分布状况以及与现有分类体系之间的主要矛盾问题进行了实地调查。山西省非遗项目分类情况调研统计表见第三章。其中,山西省非遗数据库具体情况(见图1 -2、图1-3)。
图1-2 山西省非物质文化遗产数据库管理系统登录网页
图1-3 山西省非物质文化遗产保护网
(1)数字化前端流程
包括:对数据资源进行分类,录入非遗普查数据,采集数据的格式转换与统一,以及各级各批非遗名录项目资料的网上申报。其中,在资源分类方面,主要采取了以下四种依据。
①全国非遗普查手册分类,分为除民族语言之外的15类,并按照文化部的最新要求,对类别名称进行了修改,比如,把原来的民间音乐改为传统音乐,把原来的民间知识中的传统医药升级为一级类别。
②非遗名录项目申报分类,也就是“十分法”。
③山西省所辖地级市分类。
④数字资源保存方式分类,包括:电子文档(文本、剧目、剧本、传承人名录、编辑丛书)、图片、音像、影像、实物等。
山西省非遗数据库数据资源能够在分类调整的情况下顺利完成数据迁移。普查数据录入方面,山西省非遗普查获得的电子数据已经全部汇总到省保护中心,实体的普查表格、报告等主要在县级单位保管;非遗名录项目网上申报方面,从第二批国家级非遗项目申报开始,山西省实现了网上申报。
(2)数字化中端流程
①技术方面,采用的是关系型数据库管理系统的标准语言SQL(Structured Query Language)、Server结构化查询语言、Net开发环境、C#设计语言、部署B/S浏览器和服务器端系统。
②结构方面,包含六大子系统:项目申报、普查管理、专家评审、传承人信息、保护金管理、保护单位项目管理。
③存储方面,数据库中包含一个工作库,实质是“非遗普查库+项目申报库”,其中,非遗普查库主要包括国家规定的普查表格、山西省自行制作的简化表格信息数据;项目申报库主要包括第二批国家级非遗名录项目之后的所有国家级、省级非遗名录项目申报资料(见图1-4)。对工作库资源进行审查加工,生成的数字博物馆后台数据库,山西省保护中心称其为“资源库”,类似于发布库的概念,内容包括名录项目、濒危项目和重大发现项目的数字资源。从工作库到资源库主要经过以下加工审查步骤:10余次修改程序,修改定义问题;解决分类标准问题,按照非遗普查手册(普查码)则分类较细,按照名录申报(申报码)则分类较粗,需要在其间建立中间表实现互换和兼容。
图1-4 数据库工作导航网页截图
(3)数字化后端流程
①数据库目前的检索水平为全文模糊检索。
②未来数据库的管理功能目标:要达到非遗项目过程管理,定时进行数据更新和信息记录,发挥数据库的实时数据检测与辅助保护决策功能。
③建立互联网网站平台,以数据库作为后台资源支撑,包括电子版省级非遗资源分布图等。建立数字博物馆,随着点击量的上升,还要建立电子商务平台、网上课堂等访问界面和扩展功能平台,采取单独架构、双向互动的方式,使数字博物馆发挥更大的商业价值与媒体传播作用。
④数据库安全问题的解决方法,包括注明版权、知识产权条款,设置安全加密级别,设置操作权限,如省、市、县三级工作人员以用户名方式登录进行管理(见图1-5)。
图1-5 山西省非遗数据库各子系统登录后页面及权限登录界面
(三)定性分析
1.我国非遗数据库建设的主要情况
(1)发展阶段
现阶段,国内已然启动的非遗数据库正处于建成之初或即将建成阶段,还有不少非遗数据库处于决策动议阶段和资源采集阶段。
(2)管理体制
省级非遗数据库,一般由省级文化主管部门主管,省级非遗保护中心、文化馆、图书馆具体负责实施。现阶段,以省、自治区、直辖区作为非遗数据库搭建的覆盖范围比较符合国情与管理体制,易于实施。
(3)设计思路
①在目前实践中,非遗数据库必不可少的组成部分有:资源加工库(各类数字资源采集加工),资源发布库(为“数字博物馆”外网等平台提供资源访问)。少部分数据库考虑到了数字资源长期保存与存档的要求,建有资源存档库。
②非遗数据库数字资源业务源头与管理需求模块一般包括:非遗项目普查、保护名录、评审、项目管理、传承人管理。非遗数据库模块设置与保护工程各项主体工作相衔接。优点是便于入库,即以资源的来源为依据;便于访问,对应于保护的需要、共享的需求。但也有缺点,将在下文中论述。
③非遗数字资源主要形态包括:文字、图片、扫描件(手抄本、古籍、善本等)、音频、视频等。
④非遗数字资源的三种分类方式包括:资源格式分类、资源用途分类、项目类属分类。
(4)主要问题
①保护工程实施以来,各级保护机构记录、收集的非遗资源长期散存,由于数据库迟迟不开工,资源得不到妥善保管和科学整合。
②非遗数据库投入资金不到位,或者无法持续投入,造成数据库建设停滞不前,维护乏力。
③已建成的数据库存在最主要的担忧是与国家数据库平台信息数据兼容的问题。
④部分数据库的建设构想简单,功能模块设计不全面,非遗保护的需求与技术开发的实践脱节。
2.造成问题的原因
(1)非遗数据库缺乏足够和持续的资金投入
信息技术高速发展,软硬件淘汰速度迅猛,新技术更新要求迫切,这些都与资金投入与保障直接挂钩。因而,非遗数据库的建设和运行情况与资金的落实情况直接挂钩。前期投入部分资金所研发的数据库系统面临迅速被淘汰的危险,而资金的非持续性投入,更加剧了工作瘫痪的可能。因而,要通过引进国内外相邻相关领域的新理念、新技术,开拓非遗数据库设计思路,力求通过科学合理、简化易用、分步实施的建构方式,降低非遗数据库投建门槛。
(2)非遗数据库缺乏基于顶层设计的标准规范体系
数据库元数据、存储结构、数字资源格式标准等的统一是当务之急。正因如此,已经建成的非遗数据库差异较大,数据整合难度巨大,“信息孤岛”现象的出现不可避免。因而,将重点对数据库存储结构、核心元数据、资源技术标准进行研究,廓清非遗数据库理念实现层面的障碍。
(3)非遗数据库缺乏人才支持与科学论证
对非遗数据库的基本理论与应用需求的研究不够,具有交叉学科背景的研究人员、接受专业培训的工作人员紧缺。目前,主要采取公司招标的形式,完全委托技术人员进行数据库研发,保护理论、保护需求与技术实现无法充分结合,数据库建设项目匆忙上马,缺乏科学论证。因而,将重点研究非遗数据库的基本理论与应用需求,将非遗数据库的核心设计理念与应用需求梳理清晰,便于逻辑与物理层面的技术实现到位、适用。