冲浪开放数据浪潮

尚无读者喜欢此内容。
Surfing the open data wave

Jason Hibbets 拍摄

在飓风季节,我的注意力转向大西洋。我关注产生涌浪的风暴,并使用各种预测工具来找到最佳冲浪地点。但我从未真正思考过我使用的工具背后的数据。

今天的预测技术汇集了许多不同的统计数据:涌浪大小、方向和周期;风速和风向;以及潮汐预测——如果您想获得好的冲浪体验,这些都是重要的因素。这些信息从何而来?

回答这个简单的问题,让我意识到了开放数据对于我这项已经享受了近 20 年的运动的重要性。可能也有您认为理所当然的开放数据。想想您的每日天气预报或股市行情。如果这些数据的来源没有得到适当的资助怎么办?如果它突然消失了怎么办?

来自 NOAA 的开放数据

当您住在离海岸至少两个小时路程的地方时,做出正确的冲浪决定非常重要。这不是开车很快就能到达下一个冲浪地点看看情况如何,而是一次专门的公路旅行,唯一的希望是能冲到好浪。能够根据预测条件使用预测工具精确定位最佳冲浪地点是一大优势——而这一切都要归功于开放数据。

当我开始研究为冲浪预测网站提供支持的数据时,我很快意识到,许多(如果不是全部)网站都使用了来自 NOAA(美国国家海洋和大气管理局)的相同信息。由于 NOAA 是一个政府资助的机构,因此这些数据可以免费向公众提供。(请参阅他们的开放数据访问政策 [PDF]。)与其他开源项目使用开放数据的方式类似,真正的价值在于数据的解释和向用户的呈现。我研究了三种不同的服务使用和认可这些数据的方式。

Surfline

Surfline.com我使用的第一个冲浪预测网站之一是 surfline.com。他们开发了一种使用 NOAA 和其他数据源的专有波浪预测系统。他们提供免费的三天预测,但对高级服务(如延长预测和当前冲浪条件的高清流媒体视频)收费。

我过去经常使用 Surfline,但随着时间的推移,我的偏好发生了变化。我学会了如何理解原始预测数据。由于我已经积累了当地冲浪条件的知识,我开始更喜欢简化的界面,它可以给我提供我自己可以解释的数据。而且我发现他们免费报告的限制也是一种阻碍。我有时仍然使用 Surfline,但不是作为我的首选信息来源。人们愿意为高级服务付费——事实上,我曾经是他们的订阅用户。

Swellinfo

Swellinfo.com我经常用于冲浪预测的网站之一是 swellinfo.com。与其他冲浪和天气网站一样,他们使用 NOAA 数据。由于这些数据可以免费访问,因此他们可以免费为最终用户提供价值。

Swellinfo 首席预测师、首席执行官 Micah Sklut,M.S. 提供了以下关于开源数据价值以及服务提供商和最终用户从 NOAA 等开放数据源获得的益处的声明:

“如果没有这些开源数据,这个国家的大多数私人气象机构都会倒闭。在其他国家,如澳大利亚,您需要支付服务费才能访问气象机构的数据。

允许 NOAA 数据免费提供,可以促进技术方面的更多研究和进步,并带来大量的商业机会。如果 NOAA 切断对其数据的访问,那么我们将不得不完全依赖 NOAA 来提供现在使用这些数据的数千家公司的服务。

我认为 NOAA 是一个很好的公共资助项目范例,它真正帮助了整个系统,而不仅仅是系统的小部分。我们都从天气和环境信息中受益。”

开放标准和可访问性对于 Swellinfo.com 构建业务的能力至关重要。如果没有来自 NOAA 的开放数据,他们将不复存在。令人惊讶的是,从同一数据流中可以产生如此多的机会——下一个示例展示了它可以有多么不同。

Magicseaweed

magicseaweed.com我最常使用的网站是 magicseaweed.com。他们提供的价值在于数据的排列和呈现。虽然数据是开放的,但呈现方式是他们确定其知识产权所在的地方。我也喜欢它是免费的。

当我联系网站维护人员征求意见时,他们不愿透露其数据来源,但证实它是开放数据。我想知道他们为什么不愿分享?这不是很符合他们的开源精神。

他们网站上的免责声明证实,该数据“在公共领域中以无版权形式存在”。这让我相信它是基于 NOAA 的数据。

作为一名经验丰富的冲浪者,我可以浏览像 magicseaweed.com 这样的工具,并理解他们呈现的大部分数据。例如,我可以解释在轻风条件下,8 英尺涌浪,周期为 12 秒会是什么样子。(答案:胸部到头部高度的浪,干净的冲浪。)那时,就该通过口口相传开始制定冲浪计划了。

他们的五星评级系统使这些判断更加明显——并向新手用户指示条件是好还是坏。但是,了解海岸线和拥有经验肯定会影响冲浪模型的准确性。

该网站不仅仅以数字格式和一些图标呈现不同的元素。Magicseaweed 将这些数据编译成信息图,显示数据在一段时间内的变化。您可以同时在并排的三个图形中看到预测的涌浪大小、涌浪周期、风速和风向。同样,价值在于以易于理解的格式向最终用户呈现数据。

哪个工具适合您?

网络上有许多冲浪预测网站。您选择哪一个将取决于您的偏好。对我而言,Magicseaweed 是我的主要来源。只需一眼,我就可以看到我感兴趣的指标。当我开始深入研究数据时,我会使用 Swellinfo 来确认我的解释。我可能会登录 Surfline 来比较预测并观看实时视频(尽管免费用户的时间限制为 60 秒)。

所有这些网站都有一个共同点:社区。我认为这些网站都认识到最终用户的力量和作用。与当今许多公司一样,他们在网站上包含各种旨在推动社区发展的功能。  当冲浪者不在水中时,预测者希望他们在网上冲浪。构建社区功能是让人们不断回访的一种方式——并不断开发他们希望看到的工具和视图。

归根结底,没有什么比真正的现场冲浪检查更棒的了。当您扫描地平线寻找涌浪并观看它们冲击海岸时,您可以看出所有分析数据的时间是否值得。真正的问题变成了:您是在检查冲浪的地方划出去,还是去寻找另一个地点?

今天开放,明天关闭?

所有这些工具都使用来自 NOAA 的开放数据。他们获取这些复杂、难以解释的信息,并将其转换为用户友好的冲浪预测,就像气象学家为我们提供天气预报一样。您能想象尝试根据卫星图像和风矢量来预测明天的温度和风向吗?

NOAA 数据的应用范围超出了冲浪预测——就像天气预报的范围远远超出了仅仅告诉我们明天是否晴朗一样。地震学家使用相同的气候和卫星信息来预测地震,其他气象学家则使用这些信息来预测飓风或龙卷风的路径。如果像当地新闻公司这样的下游消费者不得不为这些数据付费怎么办?或者,更糟糕的是,如果某些数据根本无法获得怎么办?

围绕 NOAA 提供的数据建立起了完整的生态系统。对于那些不愿意或无法为服务付费的人来说,有很多免费的选择。但与此同时,在这些开放数据之上可以应用各种商业模式。最棒的是,用户可以选择。

最近,美国众议院正在探索 NOAA 服务私有化,这威胁到了这些数据的开放性。最近削减 NOAA 预算的举措 可能会限制他们准确预测飓风的能力。而这是我们无法承受的损失。

如果您读到这里,您应该获得一个冲浪视频。

Avatar
Jason Hibbets 是红帽公司数字社区团队的社区主管。他与 Enable Architect、Enable Sysadmin、Enterprisers Project 和 Opensource.com 社区出版物合作。

5 条评论

很抱歉,当您联系我们时,我们没有公开我们的数据来源,我们每年都会收到数百封来自人们询问相同问题的电子邮件,并且并不总是有时间详细回复——尤其是一半的咨询都以“我正在考虑建立像您这样的冲浪预测业务,您能告诉我您是如何精确构建 MSW 的吗”(我不是在开玩笑!)。然而,我们的数据主要但不完全是由 NOAA 和其他根据 WMO 义务共享的机构提供的(但最常见的是实际上由 NOAA 公开分发),这已不是什么秘密,但是我们越来越多地在我们自己基于此数据构建的模型上运行。对于像我们这样的小型私营企业来说,运行全球大气模型(提供用于强制各种涌浪模型的风数据)超出了其能力范围(并且除了私营企业可以增加的价值之外,还有令人信服的理由与在全球范围内收集输入数据的性质有关,这需要开放共享),但是我们可以并且确实运行我们自己的涌浪模型和插值风模型,以增强我们可用的数据范围,尽管这些模型本身也是开源的,因此我们能够创造的价值再次归功于共享数据和软件。因此,虽然您绝对正确,我们的主要知识产权建立在开放数据之上,但我们确实也越来越多地从中创建专有数据——尽管本着开放的精神,我们确实免费与任何有兴趣将其用于研究的人以及当然还有通过我们的网站与更广泛的公众共享这些专有数据!很高兴您觉得我们的网站有用,并感谢您将我们包含在文章中。

Ben,
感谢您分享这些信息。您收到这类咨询我并不感到惊讶。而且我几乎可以肯定,大约 95% 或更多的冲浪人群从来没有真正认真考虑过这类事情。

您如何看待可能需要为使用的 NOAA 数据付费?我在文章中没有深入探讨太多,但我很好奇这会对现在(免费)使用这些数据的企业产生什么影响。像 MagicSeaWeed 这样的企业愿意为这些数据付费吗?如果愿意,您会将其转嫁给您的消费者吗?

感谢回复,
Jason

老实说,现在必须为数据付费对我们来说是有利的(尽管这很大程度上取决于确切的价格和许可模式)。它将在我们和潜在竞争对手之间建立一道墙。当然,回顾十年,如果这些数据不是免费的,我们就不会在这里。因此,从自私的角度来看,我现在将从收费数据中受益——但我的投票(以及最广泛的利益)将永远是支持开放数据。这个行业绝对是一个完美的例子,说明了开放数据如何创造业务、价值和收入,我确信如果有人花时间调查,可能会证明它在税收方面产生的回报比数据许可所能产生的回报还要多。

过去,我使用过 NOAA 和 USGS 的数据,并对数据的数量和质量感到惊讶。国家地图集 (http://www.nationalatlas.gov/) 也是 GIS 极客的数据宝库,可以轻松地与天气数据混合使用。但是,与国家地图集不同,我发现在这个时代,在 NOAA 网站上挖掘以查找数据比看起来应该更困难。
但要向国家天气数据中心(我认为在北卡罗来纳州阿什维尔)的人们致敬,感谢他们使这一切成为可能。

Bob,

详细介绍国家地图集的故事可能会很有趣。您有兴趣撰写一篇关于此事的博客文章吗——重点关注开放数据以及您的使用经验?

谢谢,
Jason

Creative Commons License本作品采用 知识共享署名-相同方式共享 3.0 未本地化版本许可协议进行许可。
© . All rights reserved.