概述

中国古旧地图是研究我国历史文化的重要工具,具有极高的学术价值和艺术价值。但因为种种原因,长期以来这些珍贵的文化遗产,要么束之高阁普通人无权使用,要么流失海外难以访问,实在是一大遗憾。


发现中国是2015年上线的知识地图制作分享公益平台,地图分享知识是我们的核心理念。2018年9月,网站正式上线了“中国古旧地图”专栏,由于多种原因栏目进展缓慢,截止目前总共只发布了一百张不到的在线高清古旧地图。2019年7月,发现中国开始开放运营后,志愿者团队即着手准备打造全新的中国古旧地图栏目,列入了2019年第四季度工作计划为此还进行了半年以上的开发,上线了专门的人文地理知识库协作平台“地图书”。


中国古旧地图协作翻译整理计划,旨在将国外各大图书馆、博物馆收藏,已经数字化并开放下载,涉及中国的建国前古旧地图进行搜集、整理和翻译,形成一个统一的索引目录,供任何人免费使用,并在项目最终完成后开放全部数据的下载。项目完成后,还将组织部分优秀志愿者进行长期维护,不断迭代发布版本更新。


2019年10月项目正式启动,多位团队成员参与了相关的程序开发、数据处理、协作翻译等工作,总结出了许多工作经验。进入2020年后,我们决定招募更多外部志愿者参与此项计划,任何有志于此并符合要求的朋友均可报名。参与者以项目的形式加入此项计划,可自由加入自由退出,同时我们也欢迎此项计划中的优秀自愿者,加入发现中国志愿者运营团队,长期参与各种知识库协作工作。


目前我们还在和一些研究地图学史的老师沟通,整理更加规范的术语表,制订审核规范,组织审核团队,保证多人协作的质量。


范围

  1. 将国会图书馆、大英图书馆、斯坦福大学、耶鲁大学等国外单位收藏,已进入公有领域并开放下载的高清中国古旧地图搜集汇总;
  2. 收录全部国内出版流失海外的地图;收录部分国外出版,涉及中国、亚洲或者世界范围的地图;
  3. 部分和中国相关的战争地图,如甲午战争、日俄战争、抗日战争、二战亚洲战场和太平洋战场;
  4. 部分和中国相关的,反映当时中国和世界局势的漫画地图,海报地图;
  5. 未来国内单位或者个人愿意共享的古旧地图。


流程

  1. 根据收藏单位分批进行,一次集中处理一个单位的地图,在翻译完成后发布为一个版本。
  2. 第一阶段对地图数据进行自动化分析,存储为结构化数据,对高清地图进行切片
  3. 第二阶段对数据进行翻译和校勘;
  4. 第三阶段对部分知名地图中的要素与现代地图进行对比标注。


注意事项

  1. 收录的地图图片像素不低于200万,能达到或者超过1080P清晰度。
  2. 不收录1949年及以后的地图。
  3. 为保证项目质量,要求参与人员提供附在参与人员名录上的专业背景资料(学校、专业或工作单位)和网络昵称。
  4. 参与整理资料的翻译校勘人员需具备完成任务的相关历史、地图、地理、外语、古汉语等知识。
  5. 参与爬取资料的技术人员需具备一种网络爬虫开发技术。



方法

标准


数据处理

  1. 根据项目要求,利用地图书平台进行数据库建模;
  2. 对目标平台已开放免费下载的高清地图列表资料进行抓取,生成相应格式的JSON文件、缩略图、高清大图;
  3. 将生成的结构化数据和地图图片文件上传到线上数据库和云存储;
  4. 对需要批量调整的数据进行必要的自动化处理;
  5. 下载地址至少提供jpg格式;
  6. 承接对应平台数据处理任务的技术人员,需要在一个月内完成任务,如果无法按时完成任务或者需要帮助,请主动沟通。


翻译

  1. 对自动抓取时获取的数据进行复核,对没有录入的数据和地图进行人工补充;
  2. 向技术人员反馈需要技术处理的工作;
  3. 除地图、作者的外语原名外,一律翻译为使用简体中文;
  4. 地图名称中不能包含标点和拼音;
  5. 简介限定在一句话,30字以内,如果引文简介中存在比例尺信息一律填写到介绍文字中
  6. 缩略图宽度不低于640px;
  7. 每个校勘人员每月最低需完成20条地图数据的翻译和校对工作;
  8. 任务根据图集分配,一个人完成图集中的若干个子图的翻译校对,多图图集尽可能由一个人负责;
  9. 申领任务后,首先将负责人员设置为自己;
  10. 翻译工作需要使用代理软件,请熟练使用操作方法。


标签

  1. 标签主要用于分类检索,需要添加具有普遍性的分类词,不添加个别地图独立存在的特征。
  2. 表示地理位置的标签,世界地图标注“世界”,中国地图标注“中国”,以此类推为现今的某省,某市、某县,如广东、广州,除单字城市外,不加省、市、县行政区域单位
  3. 表示地图类型的标签,如区划、城市、河道、地质、XX战争、海报、漫画等;
  4. 表示地图属性的标签,如山水图、拓本、宗教、时局等。


简介

  1. 简介是由翻译者自拟,概括地图的一句话信息,需要严格按照规范填写。
  2. 简介的格式为X国绘制XX朝代XX时期XX地方XX类型地图(集)。
  3. X国绘制代表地图绘制国家,国内绘制则不加说明,如美国绘制,日本绘制等;
  4. XX朝代代表地图绘制时的中国朝代,如清朝、明朝、民国;
  5. XX时期代表地图绘制的历史时期,不确定可以不填,如清朝前期,中期、晚期;
  6. XX地方代表能够反映全图的地域名称,如中国地图标注中国,省份地图标注河南省,城市地图标注北京市等,使用旧地名;
  7. XX类型代表地图类型的标签,如区划、战争、城市等。



翻译

报名

使用Win7以上操作系统,非IE浏览器打开https://www.ditushu.com/,点击右上角的“登录”按钮。

image.png


通过微信扫码登录后,点击右上角“申请参与协作”按钮。

image.png


根据实际情况填写并保存个人资料,QQ和微信号请务必添上,方便联系。

image.png


修改用户名和介绍。

image.png


通过https://jq.qq.com/?_wv=1027&k=5sUewzf加入中国古旧地图项目交流QQ群,将群昵称修改为刚才设置的用户名,并在QQ群内统一报名、参与讨论、发布公告、解答疑问。管理员核实填写的信息,沟通确认符合要求后,在后台发放权限并告知志愿者。


刷新地图书页面,点击右上角“进入”按钮。

image.png


点击左侧的“我参与的”菜单,找到“中国古旧地图”,点击“进入按钮”。

image.png


成功进入中国古旧地图后,此时只有浏览权限。请尝试点击页面学会基本的使用方法后,准备申领任务时,再联系管理员再开放编辑权限。

image.png


申领任务

获取编辑权限后,点击中国古旧地图中的“图集”链接打开图集。

image.png


点击顶部的“筛选”按钮,将负责人设置“--未设置--”,筛选出全部未申领任务。

image.png


新志愿者第一次申请任务需要和管理员沟通,先完成管理员手动分配的测试任务。完成测试任务后,可以按顺序自由申领任务。点击一条未申领的地图数据后,在右上角找到“负责:无”按钮,点击将负责人设置为自己。

image.png


参考国会图书馆翻译规范和文档表中的术语目录对数据进行翻译,首选完成图集部分的翻译,完成后将状态设置为“已完成”

image.png


完成图集的翻译后,需要点击“地图”选项卡,对图集所属的一到若干张分图进行翻译。“图集”表中的地图大部分并不是真正的地图集,而只是一个类似文件夹的概念,所以多数“图集”只有一张完全一样的分图。

image.png


点开分图后,只需要对名称进行翻译,同时需要根据原始网站补充宽度和高度信息,并将状态设置为已完成。

image.png



完成全部分图的翻译后,继续申领完成下一条任务。

注意事项

  1. 参与协作人员不能添加和删除任何数据,只能进行修改,如果发现收录错误的地图,或者遗漏的地图,请在QQ群内反馈。
  2. 某些地图没有自动抓取到地图图片,请不要手动上传图片,直接照国会图书馆的数据翻译即可,未来管理员会统一补图。
  3. 为了统一翻译风格,请先阅读文档表中的文档;
  4. 有问题请及时在QQ群反馈。


国会图书馆

  1. 具体的操作参见文档:https://www.yuque.com/docs/share/753d083f-b47f-4ed9-8df6-ba3adb49bd3d#
  2. 国会图书馆的网址为:https://www.loc.gov/,国内网络可正常打开,但速度较慢。
  3. 可以参考北京大学中国古代史研究中心李孝聪教授的《美国国会图书馆藏中文古地图叙录》一书中的介绍,群文件中有分享该书的PDF版本。
  4. 通过顶部搜索框设置分类为maps,关键词为china,日期排序,每页100条数据进行处理。地址模版为:https://www.loc.gov/maps/?q=china&c=100&sb=date&sp=${page}
  5. 国会图书馆大部分使用英文标题,已经自动将存在的中文标题处理为主标题,外语标题为别名;
  6. 中文标题中存在标点符号,需要校对人员手工去除;
  7. 国会图书馆有5秒防DDOS设置,导致某些地图文件没有抓取成功,需手工下载上传;
  8. 某些数量特别大的图集没有成功抓取到子图,请汇集后交于技术人员处理;
  9. 按分页处理时,有可能存在超过1949年及以后的地图,以及不适合收录的地图,请沟通后手动删除;
  10. 如果发现其它关键词下存在适合收录的地图,请手动录入或联系技术人员处理;