数字禹贡

复旦大学人文社科“历史GIS与数字人文研究”青年融合创新团队

“数字运河”:从设想到可能

张鹏程* * 

内容提要 本文从“数字人文”领域研究现状和发展趋势出发,主要探讨“数字运河”从设想到可能的技术路线,具体包括“数字运河”的时空范畴、数据基础、平台建设与系统构架、主要工程技术难点和建设的可行性等。认为:“数字运河”是一种基于统一交互系统,引入多元数据集合,能够被公平普适使用的学术公共基础设施,“平台化、动态化、网络化、通用化”是基本要求,基于GIS的统一交互系统则是平台的核心。

关键词 数字运河 数字人文 地理信息系统(GIS)

随着大数据、文本挖掘、信息可视化、地理信息系统(GIS)、虚拟现实(VR)以及增强现实(AR)等现代信息技术的飞速发展及其在人文研究领域的深入应用,“数字人文(Digital Humanities)”以其跨学科、跨领域的特点,在研究方法和研究手段上日益成为传统人文社科研究的有力补充。进而在此基础上不断衍生出新的学术范式。[1]其中,以地理信息系统(GIS)技术为依托的“空间分析法”,在历史学、语言学、人类学以及经济学等诸多人文社科领域得到了深入应用,逐渐形成了一套以“空间”为切入点的新研究方法和学术关切,吸引了众多不同领域的研究者加入,为传统人文社会科学研究拓展了新的研究视野和空间。

“数字运河”的提出首先基于当前“数字人文”蓬勃发展的学术背景,但也与此前早就开展的国家工程层面上的“数字流域”建设有一定渊源。两者的区别是,“数字流域”主要聚焦防洪减灾、资源调配、政务管理等实务应用,强调的是工程上的时效性、预见性和科学性;[2]而“数字运河”,则聚焦于对相关历史资料和数据的理论研究,强调的是学术性、研究性以及历史本身无处不在的主体性。“数字运河”与“数字流域”间存在的种种差异,追根溯源,是由运河——“人工开凿的通航水道”[3]这一定义导致的。与自然河道不同,运河既是一种地表存在的水体,又是一种无处不体现出人为塑造及雕琢的人文地理景观。在围绕着“数字运河”所作的各类设想里,尤其不能忽视后者。“数字运河”建设的目标,只能是最终服务于历史研究,而不能成为一项纯粹的工程展示品。

  • “数字运河”相关领域的研究现状与发展趋势

目前国内已有的“数字人文”领域成果,大致可以划分为系统搭建、数据生产、历史信息挖掘与处理以及历史地理信息化专题会议这四大类。[4]但在具体实践中,这四类成果往往并不能进行严格区分,某一平台兼有各类成果的特性是一种普遍现象,“数字运河”自不例外。

具体来看,“数字运河”或类似的一些设想,在国内历史地理学界最初的尝试,肇始于复旦大学历史地理研究中心开发的中国历史地理信息系统(CHGIS系统)。经过近20年的接续努力,CHGIS不断演进,现已积累大量原始数据,英文版本推进至V6.0。[5]在该系统的开发过程中,业界形成了不少成熟有益的项目经验。以行政点数据为例,具体分析、解决了处理不同数据模型时面临的各类问题,形成了较为完整的“千年尺度完整时间序列空间基础数据”。[6]这一工作不但为未来“数字运河”建设提供了基础历史空间参考数据,也为开发中可能面临的类似问题,如河流水道的名称变化、干支流水系的统属变迁等,提供了启发;在推进具体问题上,历史地理学者以CHGIS数据为基础,对历史时期黄河下游河道内流路位置进行了多个时间段面上的复原,并将河道复原的尺度从线上升为面。[7]这是CHGIS在历史时期河流地貌研究上的典型应用。

云南大学潘威团队,近年来开发了“数字历史黄河”、“黄河云”平台,这些平台的特色在于用三维模拟、特征重建等数理方法,解决“历史时期地表水文过程及人文因素”对黄河的影响。[8]由于黄河、运河在传统时代的紧密关系,该平台的建设成果值得借鉴。

台湾“中央研究院”近代史研究所则围绕历史时期淮河水系变迁、淮河的灾害与治理、淮河流域与近代人文地理知识的产生等主题,开发了“导淮委员会档案信息平台”。该平台的主要特色在于条理分明的WebGIS交互界面,该系统依托近史所“导淮委员会”档案等史料,让用户在对历史地图、文献档案的检索、选取、阅读和交互过程中,不自觉地形成闭环工作流,思路颇为新颖。[9]

除了以上传统学界的研究成果,近年来一些民间力量也日趋活跃。[10]这主要得益于现今国内互联网软硬件条件的持续改善,以及历史人文爱好者社群在广度和深度上的不断拓展。这类群体正在自发的将“数字人文”平台与“互联网+”趋势紧密结合,令人印象深刻。[11]

这其中,比较典型的是“发现中国”网及其“地图书”平台。[12]该平台通过吸引不同兴趣方向的志愿者团队,以团队协作和项目迭代的互联网软件工程模式管理并完成各类专题研究计划。目前,该平台已经产出了“中国古旧地图集合(含明清运河舆图)”、“《中国历史地图集》矢量化”等多专题、上千组的结构化数据。另据了解,“地图书”正与部分高校的一些学术团队对接,搭建并维护属于它们自己的小规模数据集。这无疑为历史学界相当多并无“数字人文”领域实操经验的研究人员,提供了低门槛的解决方案。

从CHGIS到“地图书”,现今诸多与“数字运河”相关的研究成果,已经日益反映出本领域平台化、动态化、网络化、通用化的大趋势。

这种趋势具体到“数字人文”的基础——数据来看:首先,在数据的结构上,日趋远离静态的、线性的表单数据,而是以GIS为核心,形成一种平台式的、多信源的、可供传播的结构数据;其次,在数据的组织与管理上,日趋超越CHGIS时代,开发者只是数据“供应商”的单调局面,而有望成为交互性强而又个性化定制的动态历史资料管理平台;再次,在用户与数据的关系上,日趋摆脱离线的、一对一的、分散的交互方式,而转为充分利用Web2.0时代的诸多网络平台,以对用户更加友好的方式提供各类地理分析功能;最后,在数据的用途上,数据平台的名义用途与真实用途日益背离,“一个平台、多源数据、多种用途、多类用户”正成为一种主流模式。[13]

虽然还存在不少由来已久的问题,[14]但国内“数字人文”领域多主体蓬勃发展的态势确实是前所未有的,整个学科正处于由量变转向质变的前夜。“数字运河”作为一项设想,应当主动靠拢已有研究形成的趋势,在开发之初,就对应做好顶层设计。

  • “数字运河”的时空范畴与数据基础
  • “数字运河”的时空范畴

大运河纵横数千里,演变数千年,还与运河沿线的人口和区域社会产生过复杂的联系。因此,应该对“数字运河”工程的复杂性和长期性持有充分认识。从这个角度来看,项目开发应该是分期开展、渐进实施的。同时,出于项目未来管理、实施的现实考虑,又应该以典型区域为代表,争取早日拿出能为学界所使用、又为民间所熟知的阶段成果。

我们设想,“数字运河”工程第一期应该以明清至民国时期大运河的山东—江苏段为重点。这里主要考量有两点,其一,明清至民国大运河的总体格局接近于今京杭大运河,运河沿线的物质与非物质文化遗产留存还比较宏富,后世各类研究论著亦相当丰富。在该时段和区域内,运河研究资料基础良好,学术问题也比较聚焦,最容易以较短时间产出较大成果;其二,大运河山东—江苏段,至今都是通航条件最好,与国民经济建设、生态环境保护等领域联系最紧密的河段之一。本项目由此产出的各类成果有望产生较大的社会正面效益,并能扩大相关研究机构的学术影响力。

  • 数据基础:运河文献与明清河工图

(一)运河历史文献数据库

明清运河的文献史料浩如烟海。考虑到数据管理的结构化水平和平台建设的使用便利性,不宜将诸多分散的原始文献逐一纳入,而需要予以相当程度的集成与分类。

得益于大运河申遗成功,近几年来已有不少相关大型文化出版工程诞生。这些资料集对基本史料搜罗殆尽,分类也比较合理,非常适宜作为基本数据采录。其中典型的有王云、李泉主编的《中国大运河历史文献集成》(81册),[15]全书影印出版,划分了运河工程、运河水利、治黄保运、漕运关志等若干大类,涵盖了元代至民国初年的绝大部分运河基本文献。另外,聊城大学运河学研究院近年来研发了“运河文献数据库”、“运河民间文献数据库”等在线数据集。[16]在保障数据安全和尊重知识产权的前提下,此类结构化的在线数据集尤其适合接入“数字运河”,以提供方便的联合检索或查询功能。

除了基本历史文献,运河沿线还有庞杂的档案史料。以运河江苏段为例,收藏比较集中的就有中国第一历史档案馆藏清代黄淮运治理档案、台北故宫博物院藏清代黄淮运治理档案、台湾“中研院”藏国民政府导淮委员会档案、[17]中国第二历史档案馆及江苏省档案馆藏新中国治淮、治运档案。此外,运河沿线的碑刻、金石等材料更加宏富,其中不少都已收录在沿运各城市的诸多“地方文库”型文献集成中。这些丛书的编纂水平虽然参差不齐,但一般在结构化程度上都非常适应于文献数据库的形式,应当与前述各类文献并列,在电子化后形成单独的数据集。

(二)运河研究型文献数据库

从理路上来说,研究型数据库在文献收录上,可能与历史文献数据库产生一定重叠。可以考虑以民国为时间上限,在本数据库中主要收录民国以后至今,在西方学术研究方法推广以后产生的研究型论著。

这其中,还可以再具体的分为两类,第一类是涉及运河的水工技术论著,第二类是以历史学、人类学、社会学等人文社科研究方法写作的运河沿线水利史研究、区域社会史研究等项学术成果。由邹逸麟先生等牵头主编的九卷本《中国运河志》,是目前最全面系统的研究成果。[18]由于该书属于官修大型出版工程,编纂体例非常适合转化为相对应的结构化数据。我们设想用该书的相应分卷作为本数据库的基本架构,其后,逐一在对应架构上添加其他分散的运河研究论文、著作。最后,在所有论著上添加相应标签,如学科关键词或者研究方向关键词等,彼此间再使用关系型网络连接,并形成词云等可视化效果。这样,本数据库除了实现基本的搜索和阅览功能外,还能让用户抱有对运河研究全貌的初步印象。

(三)明清河工图数据库

明清两代中央政府一直视河务漕务为国政大端。在长期治河实践中,官私各方均形成了大量河工图或河工图档案。这类珍贵舆图资料尽管是反映当时运河沿线全貌最直接的史料,但长期藏于秘府,不得为学者所用。[19]

以明清运河节点城市之一——淮安为例,今所见诸版本《清河县志》、《淮安府志》前后所附的运河图,制作上都相当粗疏。大量反映河工及河政管理细节的原始舆图,受制于传统文献的开本、印刷技术等诸多因素,在流转和临摹过程中不断“同系退化”。对运河研究向纵深发展造成相当的制约。

自20世纪末以来,国内北大图书馆、天津图书馆、台北故宫等馆藏机构相继整理了不少专题性的古地图图录。另外,李孝聪及其团队在整理、出版海内外舆图目录、图录的同时,[20]还对一部分重要河工图做了考证分析。[21] 2019年,《中国运河志·图志·古地图卷》出版,该书全录或节录了明清运河舆图共计61种,是目前收录河工图最完善的实体出版物。[22]

实际上,与各馆藏机构的真实馆藏数相比,目前披露了运河舆图还只是很少的一部分,更无法满足构建时序完整、结构清晰的明清河工图数据库对资料的需求。

得益于近几年互联网技术的发展,尤其是Web浏览器图形支持能力的提升和存储设备成本的下降,国内外大批高清扫描化的河工图电子资料正在不断披露。无论是从地图自身的清晰、完整程度,还是从地图图说文字的结构化程度来说,电子化地图的优势都是传统图录型地图望尘莫及的。这些数据如能予以充分搜集、整理、排比、解读,并建设用户友好型的交互系统,将成为整个“数字运河”工程的一大特色,也能为学界提供重要的学术基础设施。[23]

以笔者所见,目前海内外十数家机构藏有明清河工图,据不完全统计,总图数在300幅以上。[24]这些机构绝大部分都开放了地图资料的浏览乃至下载权限,且很少设置版权门槛。至于中国国家图书馆、中国第一历史档案馆等机构,尽管设置有严格的查询和使用条件,但由于这些机构藏品的来源多与台湾方面有紧密联系,[25]因此可以在一定程度上从台湾藏品中获得弥补。总的看来,目前海内外明清河工图披露的情况已经比较完整,足以支撑相关需求。有关运河舆图收藏的基本情况可参阅表1。

表1 已知的海内外机构庋藏明清河工图基本情况[26]

庋藏机构舆图数量披露或出版情况资料 来源
中国国家图书馆61少数披露[27][28]
中国第一历史档案馆28未披露[29]
北京大学图书馆18少数披露[30]
中国科学院图书馆10图录形式,已出版[31]
国家基础地理信息中心1图录形式,已出版 
天津图书馆7全图形式,已出版[32]
联合国教科文组织5全图形式,可下载[33]
镇江市博物馆2未披露[34]
济宁市汶上县档案馆1全图形式,已出版[35]
台北故宫博物院110全图形式,可浏览[36]
台湾“中研院”待确认[37]全图形式,可下载/
日本京都大学1全图形式,可下载[38]
美国国会图书馆42全图形式,可下载[39]
美国佛利尔美术馆1全图形式,可下载[40]
美国大都会图书馆1全图形式,可下载[41]
大英图书馆12全图形式,可下载[42]
法国国家图书馆3全图形式,可下载[43]

除了对明清河工图本身进行整理。我们还设想,可以择其重要者,在考证研究后形成序列化的标准矢量数据,即明清河工图标准化数据库。综合考虑明清河图和对应历史文献的留存情况,以及复原并绘制的难易程度,可以从明代中叶潘季驯治黄开始(1578年前后),至清末漕运废除(1901)为止,依据运河变迁史上的重大节点,绘制出1:50000比例尺下的、若干标准年代的运河全线水系数据集供学界使用。

从结构上看,这类数据不仅应包含运道本身的地理形态,还应涉及运道周边闸坝、祠庙、行政机关等附属设施的定点和小地名之间的变化关系。可以想象,该数据库所涉的资料类型庞杂、地名变化多样,需要参照“千年尺度完整时间序列空间基础数据”管理维护的成熟经验,对库中数据属性、地名生存期等概念在前期认真加以考虑。

自满志敏在对京东故道的研究中率先使用数字高程数据(DEM)以来,已近15年,[44]数字高程的重要价值也早被历史地理学界公认。但目前学界使用最广泛的还是美国SRTM DEM 90M高程数据或者GDEM 30M高程数据,尽管这两类数据可以通过插值在一定程度上提高空间分辨率,但在运河研究精度逐渐变高的今天不免力有未殆。另外,由于明清运河纵贯东部平原区,研究区域内地势平坦,古今地貌变化在微尺度上易被遮盖,故而这一问题更加突出。

近年来,日本先进对地观测卫星(ALOS)形成的12M DEM数字高程数据逐渐披露,但在历史地理学界还未得到利用。使用该数据,可以辅助进行更高精度的古河道定位、微地貌复原、河工遗迹辨识乃至地表水径流路径复原、降雨特征重建等等。[45]图1至图2即展示了更高精度的数字高程数据在沿运遗址辨别中的一个简单应用。[46]

地图说明:1.图1中浅色区域为低洼地与水域,深色区域为堤坝与河岸。2.图1中从12M数字高程数据识别出的北岸缕堤、天妃坝石工,与图2中从《淮系年表》中提取的北岸缕堤、天妃坝石工完全一致,但南岸缕堤的东北部分略有不同,为我们修正运河缕堤的位置提供了重要线索。

资料来源:日本遥感技术中心: 先进对地观测系统(ALOS)L波段相控阵型合成孔径雷达(PALSAR)12MDEM,https://www.restec.or.jp/en/solution/product-alos/alos-palsar,2020年5月1日;〔民国〕武同举:《淮系年表全编·淮系年表》表11,[出版者不详],民国十八年(1929),第34页。

近代以来,运河及沿运沿线一直是列强在华经济政治活动的热点地区。日、德、美等国或自身偷测、或改绘自民国政府地图,逐渐产出大量军用级测绘地形图。[47]这些地图的比例尺从1:500左右到1:5万乃至更小不等。由于它们采用近代测绘方式绘制,地物特征描绘科学而完善,保存着极为珍贵的历史地理信息,[48]这部分地图将是近现代历史地理数据库的基本构成。除民国地形图外,1950年代中后期,国家及地方测绘部门采用航空摄影方式普测了1:50000比例尺的东部沿海地区地形图,这批资料制图水平和图内平面定位精度很高,目前均藏于国家基础地理信息中心,可以有条件获取。[49]

在以上近现代地形图外,最近几年又有一种特殊而系统的地理数据逐渐进入人文学者视野中。[50]此即美国“锁眼”系列军用侦察卫星于1960年代以后拍摄的推扫式宽幅黑白影像。[51]运河鲁苏段的锁眼影像基本摄于1965年至1968年。据笔者在ArcGIS中与Google Earth Server联动测量后发现,该批资料画幅中心附近的平面定位精度优于10米。[52]

无论是以上提到的近现代地形图还是卫星影像图,均产生于国内大规模工业建设之前或之初,记录的地物信息总体上还保留了明清以来的历史遗迹,因此在我们研判相关问题时极为便利、高效。它们是构建近现代基础地理数据库必不可少的组成部分。

在对以上数据的具体利用上,“数字运河”可在后台设置多个接口,通过后期不断接入其他网络平台数据集或离线数据集的方式,[53]实现“即插即用,一专多能”的效果。在这一方面,成熟的Web Map Service(网络地图服务)能发挥重要作用。通过使用若干WMTS(Web地图瓦片服务)URL,可以方便的将已有的各类历史地理信息层应用于主流的桌面端或Web端GIS平台上。例如,德国马克斯·普朗克科学史研究所联合日本科学书院、台湾“中研院”、上海交大历史系等学术机构,已经开发了中国土地调查地图数据集,该数据集能提供已拼合完成的、基本覆盖全国范围的民国大比例尺地形图WMTS应用地址,具有相当高的实用价值,但以笔者所知,似还未被学界注意。[54]

(二)图像史料

目前阶段,尽管图像史料还不能起到和文献史料同等的作用,但图像真实、直观的特点,仍是其他资料不可替代的。[55]图像用于数字化平台建设更是方兴未艾,“丝绸之路历史地理信息开放平台”、“西北地方文献图片数据库”、“抗战文献数据平台”等数字人文平台均将图像史料采集作为数据建设的重点。

由于运河与周边区域社会紧密的经济文化联系,反映运河形态、运河人家、生产生活的图像史料层出不穷。比较著名的是马嘎尔尼访华使团所绘水彩作品,其中反映大运河场景的就有近20种。[56]稍早于英国使团作品的还有荷兰东印度公司画家约翰·尼霍夫绘制的游记组图,也收录运河及沿线大量场景。[57]19世纪末期以后,由于摄影术的普及,涉及运河的各类图像史料更是爆发性增长。[58]

考虑到图像史料形态琐碎的固有特点,我们设想“数字运河”的图像资源需求,最好通过接入已有数据库的形式解决,例如目前收图已超过10万张的“中国近代影像资料库”等等。[59]除接入已有库外,还可以通过用户组奖励、下载权限提升等多种手段,鼓励用户上传各类公私机构收藏的,无版权纠纷的图像史料,经过平台审核后即可登载于上。

  • “数字运河”的平台建设与系统架构

数字运河项目应当尽量遵循当前“数字人文”领域“平台化、动态化、网络化、通用化”的大趋势。前文在分析本项目数据基础时,其实也在讨论各个子数据库建设的细节时渗透了这种思路。站在整个平台建设和系统架构全局来看的话,实现这一思路的主要切入点就是搭建一个基于GIS的开放式、交互式基础平台。无论是各种数据库的“即插即用”式接入,还是用户在web端界面实现地图可视化的图形操作,还是各种类型各种格式的文献、地图、图像乃至未来音频、视频的挂靠,都离不开这一基本平台。

在底层基础平台之外,我们还应该重视“数字运河”的实际工作效能。正如有学者指出的,在对历史文献数据库的整理过程中,从“数字化”到“数据化”再到“文本挖掘”是依次递进、不断深化的三个层次。[60]纯粹的历史文献数据库如此,史料复合型的“数字运河”平台更应这样。因此,一个远景的设想是,“数字运河”不应该仅满足成为数据或史料的承载工具,而应该成为专业研究人员进行无依托、长时间、闭环式深度研究的个性化工具。

基于这种设想,我们将“数字运河”平台的用户组设定为普通注册用户及授权用户两大类。普通注册用户面向全体公众,可能以文史爱好者为主体。这类用户可以无限制检索、阅览平台的所有数据集,但使用下载功能将受到下载量限制。可以通过鼓励用户上传高质量资料、写作长文等形式增加本人下载额度。这既是考虑到服务器压力,也是希望“数字运河”能成为用户黏度高、运营模式“互联网+”的大众化平台。

至于授权用户,我们设想其群体画像是高校、科研院所中日常将平台作为学术研究工具的专门研究人员。由于很难对此类群体的研究需求有定量描述,故仅仅初步设想了几类可能的用途,参见图3。另外,为了顺应学术研究日趋团队化的潮流,本系统中的授权用户也可采用实名邀请等方式,搭建适合自己研究计划的小微团队。在这点上,完全可以借鉴“地图书”、“石墨文档”乃至GitHub等软件托管平台的用户协作及迭代开发模式,从而精准高效的推进及管理科研进度。

图3 一个可能的“数字运河”平台与系统架构

  • 结语:超越基础设施——对“数字运河”性质的思考

建设“数字运河”平台的初衷无疑是对运河史料的整理研究,无论这些史料是传统文献、舆图还是近现代测绘地图、遥感影像、图像乃至未来可能引入的音频、视频等等。从这个意义上说,“数字运河”其实同已出现的若干数字人文平台一样,只是一般意义上的研究基础设施。

但是另一方面,平台史料的多元化无疑反映了真实历史进程本身的复杂性。[61]在以往学界已经开发的不少数字平台中,这些多元史料仅仅是分散存在于系统各处,需要用户通过逐一检索来获得。[62]在这种单一、线性的资料检索和平台交互过程中,用户通常或难觅资料,或迷失于资料,更不必说希望从数据库中发现新的研究视角,这就导致用户对平台的需求粘性比较低,“查完就走”成为研究者的一种典型心态。

因此,“数字运河”设想的核心关切就在于将统一基于GIS的开放和交互基础平台落到用户检索、查询、分析、研判史料的每一步。所谓“多元史料”,也即一切本平台中的子数据集,都应该挂靠于这个基础平台。在这种情况下,“多元”可以重新回归“一元”,也即重新回归到GIS平台反映的真实地理空间,也就有可能在现有史料允许的范畴内,最大限度的还原真实的历史进程。至于这一进程能否被掌握和分析,则最终仅与研究者个人的研究方向或研究能力相关。到了这一步,我们才可以认为,“数字运河”超越了一般意义的学术基础设施,成为了能够为学术界公平、普适使用的公共基础设施。

Digital Canal: From imagination to possibility

Zhang Pengcheng

Abstract   Starting from the research status and development trend of the field of ” Digital Humanity “, this article mainly discusses the ” Digital Canal ” from concept to possible technical route, including the temporal and spatial scope of ” Digital Canal “, data foundation, platform construction and system architecture, main engineering technology Difficulties and feasibility of construction, etc. It is believed that the “digital canal” is a kind of academic public infrastructure based on a unified interactive system that introduces multiple data sets and can be used fairly and universally. “Platformization, dynamics, networking, and generalization” are the basic requirements, and the GIS-based unified interactive system is the core of the platform.Key words  Digital Canal , Digital Humanity , GIS


[1] 目前国内学界对“数字人文”这一概念的界定及其发端问题并未有精确的探讨,基本是将其视为一种起源自欧美等国社会科学界的研究趋势。参见陈静:《当下中国“数字人文”研究状况及意义》,《山东社会科学》2018年第7期。

[2] 水利部黄河水利委员会:《“数字黄河”工程规划概要》,《中国水利》2003年第5期。

[3] 河海大学《水利大辞典》编委会:《水利大辞典》,上海辞书出版社,2015年,第429页。

[4] 潘威、王哲、满志敏:《近20年来历史地理信息化的发展成就》,《中国历史地理论丛》2020年第1辑,第27-30页。

[5] 哈佛大学:Harvard CHGIS Version 6, https://sites.fas.harvard.edu/~chgis/data/chgis/v6/,2020年9月7日。

[6] 路伟东:《CHGIS模型与千年尺度完整时间序列空间基础数据——以1912年至1949年县级治所点数据为例》,《历史地理》2016年第33辑,第279页。

[7] 满志敏:《北宋京东故道流路问题的研究》,《历史地理》第21辑;孙涛:《明清黄河故道流路变迁研究》,复旦大学博士学位论文,2018年,第12页。

[8] 潘威:《“数字人文”背景下历史地理信息化的应对——走进历史地理信息化2.0时代》,《云南大学学报(社会科学版)》2018年第6期,第86页。按,河南大学与云南大学共建有“黄河云”平台,其功能与“数字历史黄河”多有重复,因“数字历史黄河”暂未公开发布,不得而知其相互联系。

[9] 台湾“中央研究院”人社中心地理资讯科学研究专题中心:导淮委员会档案地图GIS,http://archwebs.mh.sinica.edu.tw/huai/mapview.php,2020年5月4日。

[10] 例如“世界数字图书馆”、“书格数字古籍图书馆”。分别参见联合国教科文组织:世界数字图书馆网,https://www.wdl.org/zh/,2020年5月1日;“书格网”团队:书格网,https://new.shuge.org/,2020年5月1日。

[11] 该平台依据《伯尼尔公约》(一种保护并限制文学艺术作品产权和时间的国际公约),又以非营利性的CC BY 4.0协议(Creative Commons,知识共享许可协议)作为产出电子数据的知识产权形式,而原始数据则多以声明形式收录其原链接。这些措施为在移动互联网时代规避产权风险而大量分发、传播数字人文知识提供了有利条件。

[12] 该平台内数据集众多,这里以收录大量明清河工图的某数据集为例。参见“发现中国”志愿者团队:中国古旧地图开放协作整理计划,“地图书”网,https://www.ditushu.com/book/10/,2020年5月1日。

[13] 如浙江大学“学术地图发布平台”,名为“学术地图”,其实含有大量经济学、农学、生态学、建筑学乃至当代社会生活内容;陕西师范大学“丝绸之路历史地理信息开放平台”,名为聚焦“丝绸之路”,其实也已含有华北地区、长三角乃至东北地区数据。又如以收录文献资料为主的“抗战文献数据平台”,名为聚焦“抗日战争”,其实对民国文献均予收录。

[14] 历史GIS领域中饱受学界诟病之处,最突出的有两点。其一是“学界内对GIS的认识普遍还专注于绘图”,其二是GIS技术应用受学者学科界限和学术背景影响,在成果评价上波动不一。参见潘威、孙涛、满志敏:《GIS进入历史地理学研究10年回顾》,《中国历史地理论丛》2012年第1辑,第13页;

[15] 王云、李泉主编:《中国大运河历史文献集成》,国家图书馆出版社,2014年。

[16] 聊城大学运河学研究院:聊大运河文献数据库,http://210.44.126.9:8080/homepage.jsp,2020年3月20日。

[17] 台湾“中央研究院”人社中心地理资讯科学研究专题中心:导淮委员会档案地图GIS,http://archwebs.mh.sinica.edu.tw/huai/mapview.php,2020年5月4日。

[18] 邹逸麟等主编:《中国运河志》,凤凰科学技术出版社,2019年。

[19] 北京图书馆善本特藏部舆图组编:《舆图要录:北京图书馆藏6827种中外文古旧地图目录》,书目文献出版社,1997年,第1页。

[20] 李孝聪:《美国国会图书馆藏中文古地图叙录》,文物出版社,2004年;李孝聪:《欧洲收藏部分中文古地图叙录》,国际文化出版公司,1996年;李孝聪:《中国运河志·图志·古地图卷》,凤凰科学技术出版社,2019年。

[21] 席会东:《〈王石谷全黄图〉研究》,《故宫博物院院刊》,2010年第1期;李孝聪:《中国古代舆图调查与研究》,中国水利水电出版社,2019年;王耀:《水道画卷:清代京杭大运河舆图研究》,2016年;王耀:《〈黄运河口古今图说〉图注》,中国社会科学出版社,2018年;

[22] 李孝聪:《中国运河志·图志·古地图卷》,凤凰科学技术出版社,2019年。

[23] 海外及港台地区馆藏机构披露的河工图都遵守《伯尼尔公约》以及CC BY 4.0协议,本数据库可任意使用而无版权纠纷。唯大陆各馆藏机构地图,除已披露的外,不得公开出版。

[24] 指总图数。由于大量舆图内有分幅,若以分幅计,则至少超过500张。

[25] 参见秦国经、刘若芳:《清代舆图的绘制与管理》,秦婉如等编:《中国古代地图集(清代卷)》,文物出版社,1997年,第74-77页;冯明珠、林国平主编:《十年耕耘,百年珍藏——国立故宫博物院数位典藏成果专刊》,台北故宫博物院,2013年,第46页。

[26] 由于明清运河与某些邻近地理要素的固有关系,所以本表统计时也包含了涉及黄河下游、淮河下游、长江下游、两淮盐运等领域的地图。

[27] 国家图书馆馆藏中,《黄河河工图》及《岳阳至长江入海及自江阴沿大运河至北京水道图》两种舆图,已传递至联合国教科文组织“世界数字图书馆”网,可下载。表2中“联合国教科文组织”一行统计也因此剔除二者。

[28] 北京图书馆善本特藏部舆图组编:《舆图要录:北京图书馆藏6827种中外文古旧地图目录》,书目文献出版社,1997年,第66-72页。

[29] 王耀:《水道画卷:清代京杭大运河舆图研究》,2016年,第180-182页。

[30] 中国高等教育文献保障系统:“高校古文献资源库”,http://rbsc.calis.edu.cn:8086/aopac/jsp/indexXyjg.jsp,2020年5月20日。

[31] 孙靖国:《舆图指要:中国科学院图书馆藏中国古地图叙录》,中国地图出版社,2012年,第224-293页。

[32] 天津图书馆编:《水道寻往:天津图书馆藏清代舆图选》,中国人民大学出版社,2007年,第2-261页。

[33] 联合国教科文组织:世界数字图书馆网,https://www.wdl.org/zh/search/?q=%E6%B2%B3,2020年5月1日。

[34] 李孝聪、席会东:《淮安运河图考》,中国书籍出版社,2008年,第51页。

[35] 济宁市档案局编:《济宁档案馆集珍》,山东美术出版社,2005年。

[36] 台湾故宫博物院:“国立故宫博物院藏明清舆图全文影像资料库”,http://npmhost.npm.gov.tw/tts/npmmeta/map/mapindex.html,2020年4月21日。参见国立“中央图书馆”特藏组编:《国立中央图书馆善本书目》,史部舆图类,国立“中央图书馆”,1986年。

[37] 该网站并无独立资源,仅是收录其他机构地图的平台。这些机构有美国国会图书馆、大英图书馆等。参见台湾“中研院”数位文化中心:“数位方舆”网,http://digitalatlas.asdc.sinica.edu.tw/,2020年5月4日。

[38] 京都大学人文科学研究所:http://kanji.zinbun.kyoto-u.ac.jp/db-machine/imgsrv/maps/,2020年4月21日。

[39] 美国国会图书馆:https://www.loc.gov/maps/?q=China,2020年4月21日。参见李孝聪:《美国国会图书馆藏中文古地图叙录》,文物出版社,2004年,第132-163页。

[40] 美国佛利尔美术馆:https://www.freersackler.si.edu/?paged=6&s=map,2020年4月21日。

[41] 美国大都会图书馆:https://images.metmuseum.org/CRDImages/as/original/DP142629.jpg,2020年4月21日。

[42] 李孝聪:《欧洲收藏部分中文古地图叙录》,国际文化出版公司,1996年,第34-53页。

[43] 法国国家图书馆:https://www.bnf.fr/,2020年4月21日。参见王耀:《水道画卷:清代京杭大运河舆图研究》,2016年,第179、183页。

[44] 满志敏:《北宋京东故道流路问题的研究》,《历史地理》2006年第21辑,第1页。

[45] 参见潘威:《“数字人文”背景下历史地理信息化的应对——走进历史地理信息化2.0时代》,《云南大学学报(社会科学版)》2018年第6期,第86页。

[46] 参见张鹏程,路伟东:《明清以来淮安清口闸坝体系考辨》,《运河学研究》2020年第1辑。

[47] 上海交通大学曹树基团队主持有“中国历史地图信息平台”,收录大量民国大比例尺地图,复旦大学历史地理研究中心亦开发有类似平台,但均为内部使用;台湾“中研院”近史所、“中研院”人社中心,美国斯坦福大学图书馆等机构也收藏有国民政府测绘和日本、美国偷改绘的大陆军用地形图。另有日本科学书院编中国大陆1比2.5万及1比5万地形图,也已出版。

[48] 关于民国大比例尺地形图的典型应用,可参见江伟涛:《近代江南的城镇化水平研究》,复旦大学博士学位论文,2013年,第12-15页;韩昭庆等:《1930S-2000年广西地区石漠化分布的变迁》,《地理学报》2016年第3期,第390-399页。

[49] 空军航空摄影测量团:“历史地形图档案”, 1955-1959年航摄,国家基础地理信息中心藏。关于这批资料的性质,参见廖克、喻沧编:《中国近现代地图学史》,山东教育出版社,2008年,第217-219页。

[50]〔美〕李旻著,王艺译:《中国考古学景观与卫星图片的利用》,《形象史学》2013年第1期,第256-257页。

[51] 如〔美〕地质调查局:《淮阴、码头镇》,锁眼卫星推扫式黑白卫星图,1968年11月9日,实体编码DS1105-1086DF104。

[52] 均基于WGS1984地理坐标系。

[53] 国内权威的离线地理数据集,参见自然资源部:“1:25万全国基础地理数据库”,全国地理信息资源目录服务系统,http://www.webmap.cn/commres.do?method=result25W,2020年5月20日。

[54] 马克斯·普朗克科学史研究所:LSMC(Land Survey Maps of China,中国土地调查地图)数据集,https://chmap.mpiwg-berlin.mpg.de/,2020年5月20日。

[55] 这里“图像”的定义,参见赵世瑜:《图像如何证史:一幅石刻画所见清代西南的历史与历史记忆》,《故宫博物院院刊》2011年第2期,第44-46页。

[56]〔英〕刘潞著,吴芳思译:《帝国掠影:英国访华使团笔下的近代中国》,中国人民大学出版社,2006年,第17-40页。

[57] 原图见〔美〕大卫·拉姆齐地图中心:《荷兰东印度公司使团觐见鞑靼可汗》(笔者注:即著名的《荷使初访中国纪》),http://www.davidrumsey.com/rumsey/download.pl?image=/171/11647060.jp2 target=_blank>Full Image Download in JP2 Format,2020年5月20日。

[58] 如海达·莫理循的晚清民国中国摄影集、菲尔曼·拉里贝的清末中国摄影集、哈里森·福尔曼的南京政府时期中国摄影集等。

[59] 中国社会科学出版社:“中国近代影像资料库”,http://www.lzp360.com/,2020年5月20日。

[60] 赵思渊:《地方历史文献的数字化、数据化与文本挖掘:以〈中国地方历史文献数据库〉为例》,《清史研究》2016年第4期,第26-27页。

[61] 张萍:《地理信息系统(GIS)与中国历史研究》,《史学理论研究》2018年第2期,第45页。

[62] 资料离散也许并不能都归咎于数字人文平台,还有可能是资料的原始形态所致。以明清河工图为例,相当多河工图在形成时本与奏章、题本、呈文等要素俱为一体。但在资料流转中,私人、图书馆、档案馆却多以现代图书分类法为据,对原资料故意拆分。参见李孝聪:《古地图作为史料的鉴定与运用》(未刊),复旦大学历史地理研究中心暑期学校第4场报告,上海,2020年8月。