当我们开始讨论在 Opensource.com 上举办“返校”周时,我决定从字面上理解,并在本月早些时候回到北卡罗来纳州立大学,参加了 地理空间分析中心举办的首届地理空间论坛。地理空间分析和 GIS(地理空间信息科学)是一个庞大的领域,有许多开源工具可用于研究和教学,我想更多地了解这些工具如何在现实世界中被使用。
在论坛上发言的是 Markus Neteler 博士,他是意大利特伦托 Fondazione Edmund Mach (FEM) GIS 与遥感部门的负责人,也是 GRASS 开源 GIS 项目指导委员会的主席。GRASS(地理资源分析支持系统)是一款开源 GIS 软件工具,用于管理和分析地理空间数据,包括建模、可视化、图像处理以及创建自定义输出地图等功能。
虽然有一些商业实体在使用 GRASS,但 GIS 业务方面的工作仍然主要由闭源工具主导,尤其是 Esri ArcGIS。但在学术界,像 GRASS 这样的工具已经获得了相当大的关注。GRASS 项目也是 开源地理空间基金会 (OSGeo) 的创始成员,该组织旨在促进 GIS 开源工具的开发、使用和采用。
查看开源教育周的完整文章集
当我在研究生院时,我很幸运我的教授中有 GRASS 和 OSGeo 基金会成员 Helena Mitasova 博士,所以我获得了一些使用 GRASS 的经验,但我也知道我所做的工作只是触及了这个工具功能的皮毛。事实上,我饶有兴致地回顾了我的旧 GIS 作品集,发现我在 GRASS 中完成的一项作业涉及使用它来绘制从红帽大厦(位于北卡罗来纳州罗利市)顶部看到的景观,然后确定该景观中有多少比例是由各种土地利用类型组成的。
Neteler 博士谈到的项目比我学习 GRASS 时做的相当简单的作业要高级得多。Neteler 博士与我们分享了他一直在使用 GRASS 以及许多其他开源工具处理各种卫星项目收集的大量温度数据集的许多应用,处理数据以清理其准确性并填补空白,然后使用这个长期的大型数据集来了解欧洲的温度变化以及这如何影响许多公共健康问题。
您可以想象,长期高分辨率的温度读数会产生庞大的数据集。对于 Neteler 博士描述的项目,研究主要使用 MODIS 数据完成,该数据提供研究区域每日 250 米分辨率的读数,这意味着欧洲的单个快照可能超过一百万像素宽。当然,每个栅格的每个像素单元可能需要根据相邻数据或其他信息进行大量处理才能更正其内容。
为了征服这个庞大的数据集,FEM 使用 集群 计算机运行许多开源工具。总的来说,他们的集群包含 300 个节点、610 千兆字节的 RAM 和 132 太字节的磁盘空间。这些节点中的每一个都运行 Scientific Linux,它是 Red Hat Enterprise Linux 的衍生版本,针对科学用途,最初由费米国家加速器实验室创建。存储由 GlusterFS 管理,这是一个开源分布式文件系统。虽然这些单元上的分析主要由 GRASS 提供,但它是通过脚本命令行调用而不是我更熟悉的图形用户界面进行的。FEM 还使用了开源工具,包括 PROJ.4 用于投影数据,GDAL 用于提供一些额外的数据处理,以及 Grid Engine 用于调度处理。
那么,通过创建长期大区域温度数据的非常精确的图像,您可以做什么呢?Neteler 博士给出的研究示例大多侧重于追踪传染病。与我居住的美国类似,欧洲也遇到了虎蚊作为非本地入侵物种引入并逐渐扩大其在整个大陆范围的问题。虎蚊能够携带多种传染性病原体,因此公共卫生专家需要能够根据蚊子可以忍受的温度范围来了解它们的范围可能扩展到哪里。这允许将根除措施定位到正确的区域,并为气候变化影响温度模式时的范围变化做好计划。
FEM 研究中一个稍微乐观的例子是葡萄栽培,即为酿酒种植葡萄。由于农民希望选择能够耐受山区区域相对较短距离内变化很大的条件的葡萄品种,他们可以查看温度数据的预测模型,以更好地了解哪些品种最有可能在其特定的温度小气候中茁壮成长。
这些只是众多示例中的两个;Neteler 博士演讲的潜在主题是,这项研究之所以成为可能,既得益于用于进行分析的开源工具,也得益于 MODIS 卫星计划提供的开放数据。与 NASA MODIS 计划不同,欧洲机构收集的大部分数据不是免费提供的,成本高达数十万美元,对于学术和研究用途来说过于昂贵。“公共数据应该是公共的”,Neteler 说,分析工具也应该是公共的,这样任何使用它进行的研究都是可复制和可验证的。
评论已关闭。