生物 多样性 信息 学 : 一 个 正在 兴起 的 新 方向 及 其 关键 技术 ( 摘要 生物 多样性 科学 和 生物 信息 学 是 生命 科学 中 两 个 极为 重要 也 是 十分 活跃 的 交叉 学科 。 生物 多样性 信息 学则 是 目前 正在 兴起 的 一 个 新 方向 , 其 发展 必 将 进一步 深化 信息 技术 在 生物 多样性 研究 中 的 应用 。 本 文 简要 介绍 了 国内外 该 领域 的 主要 目标 与 进展 , 讨论 了 有关 的 关键 技术 ( 如 数据 库 间 的 互 操作 与 数字 图书馆 ) , 并列出 了 两 个 原型 系统 ( Species 2000和GBIF) 和 其它 相关 系统 的 网址 。 Biodiversity Informatics: a new direction of bioinformatics and biodiversity science and related key techniques ZHONG Yang1 ZHANG Liang2 REN Wen-wei1 CHEN Jia-kuan 2 1 Ministry of Education Key Laboratory for Biodiversity Science and Ecological Engineering, School of Life Sciences, Fudan University, Shanghai 200433. E-mail: yanzhong@fudan.edu.cn 2 Department of Computer Science, Fudan University, Shanghai 200433 Abstract Biodiversity science and bioinformatics are two of most important and active fields in today's life sciences. Currently, biodiversity informatics, a new interacting direction of the two fields, has risen. Its development will deepen the application of information technology in biodiversity studies. This paper introduces the major objectives and advances of biodiversity informatics as well as related key techniques, such as database interoperability and digital library. In addition, two prototype systems, i.e., Species 2000 and GBIF are also introduced briefly and the URLs of other related systems are listed. Key words Biodiversity, bioinformatics, biodiversity informatics, interoperability, digital library 1 引言 建立 生物 多样性 信息 系统 一直 是 生物 多样性 研究 的 一 个 重要 组成 部份 , 其 作用 早已 为 国内外 大多数 研究 者 和 决策 者 所 认识 ( Bisby et al., 1993;“ 中国 生物 多样性 保护 行动 计划 ” 总 报告 编写 组, 1994;May, 1995;Burley et al., 1997) 。 然而 , 在 现阶段 生物 多样性 信息 系统 的 开发 过程 中 , 仍然 面临 如下 几 个 方面 的 问题 : 1 〕 如何 从 浩若烟 海 的 信息 资源 中 快速 有效 地 发掘出 生物 多样性 研究 信息 ? 2 〕 已 找到 的 信息 可能 来源 不同 , 它们 之间 是否 存在 可 比 性 ? 3 〕 生物 多样性 信息 系统 应 如何 整合 其它 系统 ( 如 分子 生物学 数据 库 和 非 生物 数据 库 ) 中 的 有用 信息 ? 解决 这些 问题 , 必须 依靠 生物 多样性 科学家 、 生物 信息 学家 以及 计算机 科学家 的 通力 协作 , 将 大量 新 的 信息 技术 应用 于 生物 多样性 信息 管理 , 并 致力 于 发展 新 的 交叉 学科 生长 点 。 生物 多样性 信息 学 ( biodiversity informatics) 就 是 目前 正在 兴起 的 一 个 新 方向 。 2000年9月29日 出版 的 Science杂志 在 以“bioinformatics for biodiversity"为题 的 专栏 中 发表 了 一 组 重要 文章 与 报导 , 包括 : “全球 生物 多样性 图谱□保□ilson, 2000) 、 “生物 多样性 数字 化”□□ugden and Pennisi, 2000) 、 “ 分类学 的 复苏”□□ennisi, 2000) 、 “静悄悄 的 革命 : 生物 多样性 信息 学 与 Internet”□□isby, 2000) 、 “生物 多样性 数据 库 间 的 互 操作 性”□□dwards et al., 2000) 和 “化石 数据 库 上 网 ”□□aiser et al., 2000) 等 。 该 专栏 全面 而 系统 地 评述 了 全球 范围 内 生物 多样性 信息 学 的 进展 , 并 展望 了 该 方向 的 发展 前景 。 例如 , Wilson(2000) 认为 构建 全球 生物 多样性 图谱 ( Global biodiversity map) 的 工作 应当 象“ 人类 基因 组 计划 ( HGP)” 所 构建 的 人类 基因 图谱 一样 , 受到 国际 社会 的 普遍 关注 与 支持 。 如果 可能 的话 , 项目 应 在 10-20年 内 完成 , 而 经费 资助额 应 达 50亿 美元 。 本 文 作者 之 一 在 即将 付印 的 《 生物 信息 学 概论 》 一 书 中 也 撰写 了 “整合 生物学 信息 系统 ” 的 章节 , 其中 涉及 生物 多样性 信息 学 的 内容 1 。 本 文 将 根据 上述 文献 及 其他 资料 , 简要 介绍 国内外 该 领域 的 主要 目标 与 进展 , 讨论 有关 的 关键 技术 , 例如 数据 库 间 的 互 操作 性 ( database interoperability) 与 数字 图书馆 ( digital library) 。 此外 , 介绍 两 个 原型 系统 并列出 了 部份 相关 系统 ( 网站 ) 的 网妒7d , 供 读者 参考 。 2 生物 多样性 信息 学 的 主要 任务 和 目标 目前 , 生物 多样性 的 科学 研究 、 知识 普及和 政策 制定 等等 都 与 现代 信息 技术 的 发展 密切 相关 。 这 是 因为 : 1 〕 生物 多样性 工作者 遍布 全球 , 几乎 每 个 国家 甚至 岛屿 都 在 进行 生物 多样性 研究 。 科学家 们 需要 快速 、 准确 地 交换 数据 资料 ; 2 〕 有关 生物 多样性 的 全球性 事件 与 我们 每 个人 相关 。 制定 生物 多样性 保护 的 优先 策略 更 需要 综合 整体 的 信息 并 考虑 全 世界 人类 共同 关心 的 问题 ; 3 〕 现有 的 信息 系统 尚 不能 满足 日益 增长 的 需求 , 特别 需要 针对 生物 多样性 研究 中 产生 的 一些 重大 问题 , 开发 有效 的 工具 和 技术 支撑 条件 。 例如 , 涉及 生物圈 ( biomes) 、 生态 系统 ( ecosystem) 、 “热 点 ( hotspot)” 和 遗传 衰退 ( genetic erosion) 的 研究 迫切 需要 整合 来自 各 相关 区域 的 研究 者 、 工作组 或 研究所 收集 的 信息 。 因而 , 生物 多样性 信息 学 的 中心 目标 是 : 开发 具 互 操作 性 与 知识 综合 能力 的 信息 系统 , 使得 广泛 分布 的 独立 系统 能 嵌入 全球 生物 多样性 知识 结构 体系 之中 ( Bisby, 2000) 。 Species 2000和 全球 生物 多样性 信息 系统 ( GBIF) 就 是 两 个 正在 逐步 发展 的 原型 系统 。 3 数据 库 间 的 互 操作 随着计算机 技术 的 普 及 与 发展 , 各 种 信息 电子化 程度 迅速 增加 , 信息 系统 层出不穷 。 人们 已 普遍 感到 实现 不同 数据 库 间 的 互 操作 ( interoperation) 的 必要性 。 例如 , 通过 Internet对 不同 国家 、 地区 和 部门 间 的 生物 多样性 数据 库 进行 互 操作 , 或者 更 广泛 地 , 对 不同 类型 的 信息 系统 ( 如 分子 生物学 数据 库 和 GIS系统 等 ) 进行 互 操作 , 可以 极 大地 提高 生物 多样性 科学家 的 工作 效率 。 事实 上 , 生物 信息 系统 间 的 互 操作 性 问题 已经 引起 了 生物学家 和 计算机 科学家 的 共同 兴趣 ( Blake et al., 1994; Davidson et al., 1995; Gingras et al., 1997; Zhong et al., 1999) 。 目前 , 实现 异构 数据 库 之间 互 操作 的 技术 途径 主要 有 四 种 : 1〕超文本 漫游 ( hypertext navigation) ; 2 〕 数据 仓库 ( data warehouse) ; 3 〕 多 库 查询 ( multi-database queries) ; 4〕联邦 数据 库 ( federated databases) ( Karp, 1995; Karp et al., 1996) 。 这些 技术 各 有 特点 , 但 没有 一 种 可以 完全 适合 各 种 用途 。 例如 , 在 生物 分类 信息 系统 中 , 建立 联邦 数据 库 是 一 个 极其 自然 的 考虑 。 “ 北美 植物 志”和“ 中国 植物 志” 项目 均 采用 联邦 数据 库 来 管理 标本 和 相关 的 形态学 及 地理 分布 等 方面 的 信息 。 然而 , 欲 联合 更多 的 分类 数据 库 , 联邦 数据 库途径 主要 存在 两 个 困难 : 1 〕 无法 为 数量 未知 的 信息 源 建立 合适 的 数据 模型 ; 2 〕 缺乏 集成 一般性 信息 资源 ( 如 WWW信息 源 ) 的 能力 。 此外 , 开发 费用 也 是 一 个 值得 考虑 的 问题 。 相比 之下 , 多 库 查询 则 是 一 个 简便 易行 的 方法 。 我们 开发 的 Magnolia 2000 (http://www.ibsfu.fudan.edu.cn/english/ magnolia/magnolia.htm) 即 采用 这 一 方法 ( 参见 The Newsletter of Society for Conservation Biology, 2000(5) 的 介绍 ) 。 在 相对 复杂 的 生物 多样性 信息 系统 中 实现 数据 库 间 的 互 操作 , 最早 为 ERIN(Environmental Resources Information Network, 现为 Environment Australia Online) 的 GIS数据 分析 与 建模 工作 。 欧洲 生物 标本 信息 服务 ( BioCISE) 则 应用 广泛 的 元 数据 体系 集中 管理 各 个 库 的 内容 与 位置 信息 , 利用 智能化 软件 为 用户 提供 一致 的 界面 。 美国 堪萨斯 大学 正在 开发 Species Analyst System, 应用 XML语言 实现 多 个 动植物 标本 馆 数据 库 间 的 互 操作 以 获取 较为 全面 的 物种 多样性 信息 。 澳大利亚 的 TaxaServer和 英国 自然 历史 博物馆 的 ENHSIN也 在 努力 实现 类似 的 目标 。 值得 一 提 的 是 , 作为 生物 多样性 信息 系统 基础 的 分类 数据 模型 仍然 受到 重视 。 现阶段 分类 信息 系统 的 每 一 个 基本子 系统 , 一般 只 能 建立 在 某 种 现行 分类 ( 系统 ) 的 基础 上 , 该 分类 又 需 在 基本子 系统 建立 之前 通过 专家 选定 , 很 可能 因人而异 , 这 就 使得 不同 分类 信息 系统 间 的 数据 很 难 进行 联接 、 转换 和 比较 。 因此 , 运用 新 的 数据 结构 和 比较 模型 来 实现 基于 多 分类 的 数据 库 互 操作 , 可以 有效 地 避免 分类学 信息 的 损失 , 还可以 同时 处理 不同 研究 工作 所 获得 的 结果 ( Beach et al., 1993; Berendsohn, 1995; 钟扬 , 1995;Zhong et al., 1996; Zhong et al., 1997; 钟扬 和 洪亚平 , 1997;Zhong et al., 1999; Pullan et al., 2000) 。 在 前述 的 Science专栏 文章 中 , Bisby (2000)专门 评述 了 密西根州立 大学 HICLAS组 ( Beach et al., 1993; Zhong et al., 1996) 、 德国 柏林 大学 及 IOPI组 ( Berendsohn, 1995) 和 爱丁堡 皇家 植物园 等 ( Pullan et al., 2000) 在 这 一 领域 所 取得 的 成果 , 并 指出 今后 还 需 致力 于 开发 通用 的 软件 系统 。 4 数字 图书馆 20世纪 90年代 起 , 大量 的 数字化 媒体 数据 ( 如数字化 图像 、 音 频 、 视频 、 图形 、 动画 等 ) 迅速 增长 , 并 通过 网络 ( 特别 是 Internet) 迅速 蔓延到 我们 生活 的 各 个 角落 。 数字 图书馆 就 是 一 种 对 数字化 资源 存 储 、 管理 和 利用 的 新 技术 ( Borgman, 1999; Wilensky, 2000; Greene et al., 2000; Kogalovsky and Novikov, 2000) 。 它 与 传统 图书馆 有 着 完全 不同 的 内涵 。 1 〕 数字 图书馆 是 一 种 基于 计算机 网络 ( Internet) 的 数字 资源 管理 系统 , 它 维护 分布 式 、 大规模 且 有 组织 的 数据 库 和 知识 库 , 保护 信息 资源 的 安全 和 知识 产权 , 支持 本 地 和 远程 用户 借助 计算机 网络 对 系统 内 的 数据 库 和 知识 库 进行 一致性 的 访问 , 传送 和 表现 用户 所 需 的 信息 , 实现 资源 共享 。 2〕 数字 图书馆 是 以 用户 为 中心 的 、 由 分布 式 数据 和 服务 组成 的 信息 空间 。 它 必须 具备 从 异构 的 信息 源 中 发现 相关 资源 的 资源 发现 能力 、 从 确定 的 信息 源 中 查询 多媒体 信息 的 信息 检索 能力 、 为 检索 结果 产生 有益 解释 的 信息 选择 能力 、 汇集 和 保存 选择 的 信息 维护 能力 以及 与 他人 共享 信息 的 信息 交流 能力 。 3 〕 数字 图书馆 的 典型 特徵 是 : 数字化 各 种 媒体 承载 的 信息 , 通过 多媒体 技术 将 它们 有机 结合 在一起 进行 存 储 和 管理 ; 信息 的 组织 形式 为 超链 接 的 网状 组织 方式 , 便于 构造 相互 关联 的 知识 体系 ; 信息 的 网络 传输 使 数字 图书馆 超越 时空 观念 , 跨越 馆藏 信息 的 地域 界限 , 加快 信息 交流 与 反馈 的 速度 ; 包括 友好 的 人 机界 面 与 信息 空间 导航 功能 、 内容 的 快速 传递 功能 、 强有力 的 快速 检索 工具 和 先进 的 信息 处理 与 分析 工具 、 随时 可 用 的 方法 指导 、 非 定点 全 天 无 间断 的 信息 资源 检索 、 处理 和 传递 服务 等 。 4〕 数字 图书馆 的 关键 技术 包括 : 数字 式 资源 的 采集 技术 , 即 完成 直接 的 数字化 资源 创建 或 传统 媒介 的 数字化 转换 , 也 包含 来源 于 图书馆 自动化 系统 MARC格式 的 馆藏 目录 数据 库 及 一些 专题 数据 库 ; 数字化 资源 的 存 储 与 管理 技术 , 以 支持 对 分布 式 资源 的 一致性 访问 ; 信息 访问 与 查询 技术 , 包含 对 数字化 资源 和 多媒体 的 访问 技术 ; 数字化 资源 的 传送 与 信息 发布 技术 , 重点 关注 图像 、 音 频 和 视频 等 多媒体 信息 的 传输 、 同步 和 服务 质量 控制 ; 数字 式化 资源 的 权限 管理 方法 , 为 开放 的 网络 环境 中 的 用户 提供 一致性 的 信息 共享 。 综合 各 项 专门 技术 , 以 互 操作 技术 和 多媒体 与 超媒体 技术 为 代表 的 技术 体系 构成 数字 图书馆 的 重要 基础 。 数字 图书馆 已 被 认为 是 下 一 代Internet网 上 信息 资源 的 管理 模式 , 是 信息 基础 设施 的 核心 , 也 是 国家 信息 管理 技术 水平 的 重要 体现 。 1995年 的 美国 政府 蓝皮书 就 国家 信息 基础 设施 ( NII) 列出 了 九 项 国家级 挑战 , 数字 图书馆 被 列为 挑战 技术 之 首 。 1997年 的 美国 政府 蓝皮书 中 , 数字 图书馆 被 列为 有效 技术 , 1998年 被 列为 首要 研究 发展 重点 。 1999与2000年 , 再次 被 纳入 新 的 国家级项究 项目 , 作为 新世纪 网络 基础 应用 的 具体 目标 。 数字 图书馆 技术 业已 引起 生物 多样性 科学家 和 生物 信息 学家 的 高度 重视 , 并 被 视为 生物 多样性 信息 系统 的 主要 发展 方向 。 例如 , Bisby ( 2000) 认为 Species 2000的 目标 是 为 世界 上 已 知 的 物种 构建 一 个 统一 的 合法 索引 , 而 这 个 索引 的 一 个 重要 用途 就 是 作为 世界 范围 内 的 物种 数字 图书馆 的 重要 组成 部份 , 提供 生物 物种 与 相关 的 保护 、 分子 、 种 质 资源 和 生态 方面 的 链 接 。 GBIF的 长期 目标 也 是 开发 一 个 有关 生物 多样性 知识 的 数字 图书馆 ( Edwards et al., 2000) 。 然而 , 由于 技术 上 的 复杂性 , 已 报导 的 生物 多样性 数字 图书馆 还 很少 。 Schnase 等 ( 1997) 设计 与 建立 北美 植物志 ( FNA) 数字 图书馆 的 工作 是 一 个 良好 的 开端 。 该 数字 图书馆 建 于 美国 密 苏 里 植物园 , 包含 约 20000个维管束 与 苔藓 植物 物种 的 基本 信息 ( FNA数据 库 ) , 以及 相关 的 文件 、 地图 、 图片 、 图象 和 计算 工具 等 。 5 若干 原型 系统 和 相关 系统 网址 原型 系统 1:Species 2000 “Species 2000”□ㄍ胡□: http://www.sp2000. org/) 是 1994年9月 由 国际 生物 科学 联合会 ( IUBS)组织 , 与 国际 科技 数据 委员会 ( CODATA) 和 国际 微生物学 联合会 ( IUMS) 以及 其他 生物 多样性 科学 组织 ( 如 联合国 环境 项目 的 生物 多样性 工作组 等 ) 合作 实施 的 一 个 大型 的 生物 多样性 信息 网络 项目 。 建立 Species 2000 的 主要 目的 是 : * 为 世界 范围 内 的 生物 多样性 编目 工作 提供 电子 版 的 物种 名录 ; * 为 连接 世界 范围 内 物种 数据 库 ( 网络 ) 提供 索引 ; * 为 比较 不同 编目 提供 参照 系统 ; * 为 查询 世界 范围 内 物种 的 命名 、 分类 和 现状 提供 综合 资料 。 为 了 实现 上述 目标 , 该 项目 计划 : * 建立 一 个 动态 查询 系统 ( 称为 Species Locator),用户 通过 Internet进入 该 系统 , 可 用 一 个 物种 名 找到 一 系列 的 在 线 分类 数据 库 ( 如 图 12. 5所 示 ) ; * 建立 一 个 相对 稳定 的 物种 索引 ( 称为 Species 2000 Annual Checklist) 。 该 索引 每 年 更新 一 次 , 通过 Internet或CD-ROM发布 ; * 完善 现有 的 分类 数据 库 , 并 建立 新 的 数据 库 来 填补 缺失 环节 ; * 建立 一 个 连接 系统 , 使得 物种 数据 库 能 与 其他 相关 数据 库 ( 如 种 质 资源 、 博物馆 与 标本 馆 、 生态 系统 等 ) 共享 信息 。 在 技术 上 , Species 2000主要 采用 的 方式 有 : 通过 联邦 数据 库途径 实现 现有 分类 数据 库 间 的 互 操作 , 开发 专用 的 数据 维护 与 更新 系统 , 以及 通过 与 国际 生物 命名 法 权威 的 合作 以 保证物种 名称 的 可靠 性 与 稳定性 等等 。 从1996年 起 , 第一 批 加入 Species 2000项目 的 数据 库 包括 : 病毒 、 细菌 、 珊瑚 虫 、 软体 动物 、 甲壳 动物 、 双翅目 、 姬 蜂 、 蛾 与 蝴蝶 类 、 象虫类 、 鱼类 、 鸟类 、 哺乳类 、 菌类 、 仙人掌类 、 棕榈类 、 豆科 、 伞形科 以及 化石 植物 等 , 其他 类群 的 数据 库 也 在 相继 进行 之中 。 原型 系统 2:GBIF GBIF (http://www.gbif.org/)由 德国 联邦 教育 与 研究 部 ( BMBF) 和 斯图 加特 自然 历史 博物馆 共同 建立 , 旨在 存 储 和 提供 世界 范围 内 有关 生物 多样性 研究 的 第一手 资料 。 与 其他 生物 多样性 信息 系统 所 不同 的 是 , GBIF致力 于 应用 新 的 信息 技术 对 生物 多样性 信息 进行 编辑 、 链 接 、 标准化 、 数字化 和 全球 传播 。 在GBIF即将 正式 发表 的 10年 计划 中 , 主要 包含 以下 几 个 方面 的 工作 内容 : * 投 送 数据 、 信息 和 网络 资源 ; * 开发 新 的 用户 互 操作 界面 ; * 为 新 的 或 现存 的 数据 库 建立 标准 , 包括 协议 、 有效性 、 记录 与 质量 控制 等 ; * 使用户 方便 地 连接 新 的 和 现存 的 数据 库 ; * 加强 与 相关 机构 和 项目 间 的 合作 ; * 更新 高速 网络 和 计算 设备 ; * 共享 计算 设备 , 包括 高 容量 数据 储存器 ; * 培训 研究 者 、 数据 管理员 和 技术员 。 图1示出 了 GBIF 设计 的 一 个 有关 已 知 生物 名称 的 电子 目录 框架 , 这些 生物 名称 可 用于 连接 其他 生物 和 非 生物 数据 库 。 这 有 可能 实现 目前 还 难以 想 象 的 生物 多样性 数据 挖掘 ( data mining) 工作 ( Edwards et al., 2000) 。 图1 GBIF中 有关 已 知 生物 名称 的 电子 目录 框架图(自Edwards et al., 2000) Fig. 1 A design of electronic catalog of the names of known organisms in GBIF. 其他 相关 系统 网址 : ABIF (http://www.anbg.gov.au/abrs/abif.htm) ALICE (http://dialspace.dial.pipex.com/town/) BioCISE project (http://www.bgbm.fu-berlin.de/biocise/default.html#) Biodiversity and biological corrections web server (http://www.keil.ukans.edu) BIOS (http://www-sp2000ao.nies.go.jp/bios/index.html/) CephBase (http://www.cephbase.dal.ca/) CHM (http://www.biodiv.org/chm/) CONABIO (http://www.conabio.gob. mx) Darwin Core metadata standard (http://habanero.nhm.ukans.edu/Z.X/) DIVERSITAS (http://www.icsu.org/DIVERSITAS/) ENHSIN (http://www.nhm.ac.uk/science/rco/enhsin/) Environment Australia Online (http://www.environment.gov.au/search/search.html/) ERMS (http://erms.biol.soton.ac.uk/) FishBase (http://www.fishbase.org/) FloraBase (http://florabase.calm.wa.gov.au/) HICLAS (http://aims.cse.msu.edu/hiclas/) ILDIS LegumeWeb (http://www.ildis.org/) INBio (http://www.inbio.ac.cr/) Integrated Taxonomic Information System (http://www.itis.usda.gov/) International Plant Names Index (http://www.ipni.org/) IOPI Global Plant Checklist (http://bgbm3.bgbm.fu-berlin.de/iopi/gpc/) IT IS (http://www.it is.usda.gov/) LITCHI (http://litchi.biol.soton.ac.uk/) MultiFlora (http://www.cs.man.ac.uk/ai/MultiFlora/) SINGER (http://www.singer.cgiar.org/) SPICE (http://www.systematics.reading.ac.uk/spice/) The Species Analyst (http://habanero.nhm.ukans.edu/) TreeBase (http://herbaria.harvard.edu/treebase/) Tree of Life (http://phylogeny.arizona.edu/tree/phylogeny.html/) URMO (http://www2. eti.uva.nl/database/urmo/default.html) WORLDMAP (http://www.nhm.ac.uk/science/projects/worldmap/) 致谢 感谢 John H. Beaman 教授 、 Sakti Pramanik教授 和 Sungwon Jung博士 对 我们 多 年 的 支持 与 帮助 。 赵斌 、 殷寿华 和 张 晓艳 同志 对 本 文 的 写作 提出 宝贵 意见 。 在 此 一 并 致谢 ! 参考 文献 “ 中国 生物 多样性 保护 行动 计划 ” 总 报告 编写 组. 1994. 中国 生物 多样性 保护 行动 计划 。 中国 环境 科学 出版社 。 钟扬 , 1995, 植物 分类 信息 系统 概述 。 植物学 通报 ( 增刊 ) , 1-6。 钟扬 , 洪亚平 , 1997。 交互 分类 信息 系统 和 电子 植物志 的 设计 与 实现 I。 应用 UNIC结构 、 OMES模型 和 关系 数据 库 记录 多 个 交互 分类 。 见 : 中国 植物 学会 数量 分类学 专业 委员会 , 数量 分类学 与 微机 信息 处理 研究 进展 。 云南 科技 出版社 , 87-100。 Beach, J. H., Pramanik, S., Beaman, J. H. 1993. Hierarchic taxonomic databases. In: Advances in computer methods for systematic biology: artificial intelligence, databases, computer vision. (Fortuner, R. ed.). John Hopkins University Press, Baltimore. 241-252. Berendsohn, W. G. 1995. The concept of potential taxa in databases. Taxon 44(2):207-212. Bisby, F. A. 2000. The quiet revolution: biodiversity informatics and the Internet. Science 289:2309-2312. Bisby, F. A., Russell, G. F., Pankhurst, R. J. 1993. Designs for a global plant species information system. Oxford University Press. Blake, J. A., Bult, C. J., Donoghue, M. J., Humphries, J., Fields, C. 1994. Interoperability of biological data bases: a meeting report. Syst. Biol. 43: 585-589. Borgman, C. L. 1999. What are digital libraries? Competing visions. Inform. Process. Manag. 35(3):227-243. Burley, J, Scott, P. R., Speedy, A.W. 1997. Biodiversity; the role of information technology (IT) in distributing information. In: Biodiversity information: needs and options (Hawksworth, D.L., Kirk, P.M. Dextre-Clarke, S. eds.) CAB International, Wallingford, Oxford, UK, 157-171. Davidson, S. B., Overton, C., Buneman, P. 1995. Challenges in integrating biological data sources. J. Comput. Biol. 2: 557-572. Edwards, J. L., Lane, M. A., Nielsen E. S. 2000. Interoperability of biodiversity databases: biodiversity information on every desktop. Science 289:2312-2314. Gingras, F., Lakshmanan, L. V. S., Subramanian, I. N., Papoulis, D. 1997. Languages for multi-database interoperability. Pp. 536-538 in: Proceedings of ACM SIGMOD Intl. Conf. on Management of Data. Tucson. Greene, S., Marchionini, G., Plaisant, C. , Shneiderman, B. 2000. Previews and overviews in digital libraries: designing surrogates to support visual information seeking. J. Am. Soc. Inform. Soc. 51(4):380-393. Kaiser, J. 2000. Fossil databases move to the web. Science 289:2307. Karp, P. D. 1995. A strategy for database interoperation. J. Comput. Biol. 2: 573-586. Karp, P. D. , Paley, S. 1996. Integrated access to metabolic and genomic data. J. Comput. Biol. 3: 191-203. Kogalovsky, M. R. , Novikov, B. A. 2000. Digital libraries as a new class of information systems. Program. Comput. Soft. 26(3):119-122. May, R. M. 1995. Conceptual aspects of the quantification of the extent of biological diversity. In: Hawksworth, D. F. (ed. ) Biodiversity: measurement and estimation. Chapman & Hall and The Royal Society, London. P. 13-20. Pennisi, E. 2000. Taxonomic revival. Science 289:2306-2308. Pullan, M. R. , Watson, M. F. , Kennedy, J. B. , Raguenaud, C. , Hyam, R. 2000. The Prometheus Taxonomic Model: a practical approach to representing multiple classifications. Taxon 49(1):55-75. Schnase, J. L. , Kama, D. L. , Tomlinson, K. L. , Sanchez, J. A. , Cunnius, E. L. , Morin, N. R. 1997. The Flora of North America digital library: a case study in biodiversity. J. Network Comput. Appl. 20(1):87-103. Sugden, A. , Pennisi, E. 2000. Diversity digitized. Science 289:2305. Wilensky, R. 2000. Digital library resources as a basis for collaborative work. J. Am. Soc. Inform. Sci. 51(3):228-245. Wilson, E. O. 2000. A global biodiversity map. Science 289:2279. Zhong, Y (钟扬), Jung, S, Pramanik, S, Beaman, J. H. , 1996. Data model and comparison and query methods for interacting classifications in a taxonomic database. Taxon 5(2):223-241. Zhong, Y (钟扬), Meacham, C. A. , Pramanik, S. 1997. A general method for tree-comparison based on subtree similarity and its use in a taxonomic database. BioSystems 42:1-2. Zhong, Y. (钟扬), Luo, Y. , Pramanik, S, Beaman, J. H. 1999. HICLAS: a taxonomic database system for displaying and comparing biological classification and phylogenetic trees. Bioinformatics 15(2):149-156. ( 国家 自然 科学 基金 重大 项目 “ 中国 关键 地区 生物 多样性 保育 的 研究 ”□ㄅ■己□39893360) 资助 。 1 钟 扬 等 主编 , 2000, 生物 信息 学 概论 。 科学 出版社 ( 印刷 中 〕 。