全球太阳能设施清单和地球分布数据集
简介
零过渡太阳能资产映射器
TransitionZero 的太阳能资产映射器是通过机器学习和人工标注相结合创建的全球公用事业级太阳能发电场卫星数据集。2024 年第一季度的数据集包括 63,616 个资产的位置和形状,以及它们的估计容量。其中超过 80% 的资产的建设日期已估算出来。该数据集涵盖 183 个国家超过 19100 平方公里的太阳能发电场,预计总发电量为 711 千兆瓦。
太阳能资产地图:利用卫星数据和机器学习建立的持续更新的全球太阳能设施清单
Solar Asset Mapper(TZ-SAM)是 TransitionZero 和 Global Energy Monitor 的合作项目,它包含了 183 个国家超过 19100 平方公里的太阳能发电场,总容量估计为 711 千兆瓦,对小型设施的覆盖率是现有项目的三倍。
通过地球观测数据和机器学习,我们可以大规模识别中小型太阳能资产,同时估算发电量和建设日期。
太阳能的快速和分散增长给预测带来了困难。TZ-SAM 将填补传统太阳能资产报告方法的空白,从而支持更有效的预测和规划。
我们计划定期更新 TZ-SAM,并将其与 Model Builder 集成,Model Builder 是我们全球首创的无代码用户界面,可用于电网容量扩展和机组调度建模。
该数据集结合了 TransitionZero 的检测数据和其他数据集的已知太阳能发电场几何图形,是全球资产级太阳能设施最全面的视图。通过整合各种来源的数据,该数据集详细而可靠地反映了全球公用事业级太阳能发电场的现状。
数据集预处理
数据集字段 constructed_before 和 constructed_after 被转换为 system:time_start 和 system:time_end,以便于过滤。这两列的空值均保留为空。
cluster_id:分析级数据集中相应项目的 ID
capacity_mw:资产的估计容量,单位为兆瓦
constructed_before:建造日期的上限(太阳能电站首次以建造状态出现在图像中的估计日期)
constructed_after:建造日期的下限(太阳能发电站开始建造的图像的估计日期)
数据集说明
我们发布了六个文件
analysis_polygons.gpkg:我们的 "分析就绪 "数据集,包含几何图形、容量估算和施工日期估算。
analysis_polygons.csv:analysis_polygons.gpkg 的一个版本,包含中心经纬度以代替几何图形,以便在没有地理空间软件的情况下进行解析。
sources.csv:将分析就绪数据集的 ID 映射到组成这些数据集的原始几何图形的表格。
raw_polygons.gpkg:用于组成 analysis_polygons.gpkg 的原始几何图形。
TZ Solar Asset Mapper Q1 2024.xlsx:analysis_polygons.csv 文件的 Excel 格式版本。
tz-sam_scientific_data.pdf:预发表文章,详细解释了研究方法。
1.2 原始数据集和数据源
分析级数据集隐藏了底层数据的一些复杂性,我们在 raw_polygons 和源文件中公开了这些数据。
我们每次运行都会生成新的多边形集。这些多边形集经常会重叠,有时重叠的方式还很复杂。
我们会将重叠和邻近的几何图形聚类在一起,这些几何图形来自我们的检测数据和外部数据源。目前这些来源包括
从 OpenStreetMap (OSM) 搜集的大型太阳能发电场
来自 Kruitwagen 等人的 "全球太阳能光伏发电装置清单 "的经过验证的几何图形。
在分析级数据集中,每个集群包含一行。为了能够跟踪每次运行的原始探测结果,并提供详细的来源信息,我们提供了所有这些原始多边形,以及一个源文件,其中列出了每个分析级多边形中包含的所有原始多边形。
raw_polygons.gpkg 包含以下字段:
id:原始源多边形的 ID
几何体:定义资产的多边形或多多边形
来源:"solar asset mapper"、"osm "或 "2019_global_pv"。
获取日期:对于太阳能资产映射器多边形,这是生成多边形的推理运行日期;对于 OSM 多边形,这是从 OSM 抓取多边形的日期;对于 2019_global_pv,这是 2019-01-01,即该数据集的大致检测日期。
Sources.csv 包含以下字段:
cluster_id:分析级数据集中相应项目的 ID
source_id:原始源多边形的 ID
source:"solar asset mapper"、"osm "或 "2019_global_pv"。
acquisition_date:对于 solar asset mapper 多边形,这是产生多边形的推理运行日期;对于 OSM 多边形,这是从 OSM 抓取多边形的日期;对于 2019_global_pv,这是 2019-01-01,即该数据集的大致检测日期。
1.3 注意事项和局限性
1.3.1 容量估算
尽管我们已尽力从已发布的数据集中删除假阳性数据,但由于在 10 米卫星图像中人工验证检测结果的难度很大,因此仍会保留一些假阳性数据。为了估算整个数据中的误报率,我们从正面标注的太阳能资产中随机选取了约 2000 个检测子集。利用高分辨率图像对每个检测结果进行更严格的审查验证。这项分析得出的误报率预计约为 1%。
1.3.2 电站形状
我们的植物轮廓并不完美。它们偶尔会比底层植物小很多或大很多。我们的测试表明,平均而言,这些影响不会太大。
1.3.3 产能更新
我们的产能估算模型应该能得出相对无偏的国家级总量,因为它是根据各国典型的工厂地面覆盖率进行训练的。该模型无法区分同一国家中非常密集和非常稀疏(如双轴跟踪)的工厂。地面覆盖率异常高或异常低的工厂将无法获得准确的产能估算。
1.3.4 建造日期估算
我们无法直接估算工厂的建设日期。我们估算了一个上限(首次看到处于建造状态的电站的图像日期)和一个下限(最后一次看到处于未建造状态的电站的图像日期)。对于在 2017 年哨兵-2 发射日期之前建成的植物,我们只估算出上限。
我们让数据使用者来解释这些界限和/或估计可能的并网日期。
2.归因
TZ-SAM 采用知识共享署名非商业性 4.0 国际许可协议(CC-BY-NC-4.0)。必须为 TransitionZero 署名。您还必须清楚地说明您是否对 TZ-SAM 数据集做了任何更改以及更改内容。请参考建议的引用格式:
"TransitionZero Solar Asset Mapper,TransitionZero,2024 年 5 月发布"。
"TZ-SAM,TransitionZero,2024 年 5 月版"。
"TransitionZero(2024 年)太阳能资产绘图仪"。
代码
代码链接
结果
引用
"TransitionZero Solar Asset Mapper, TransitionZero, May 2024 release."
"TZ-SAM, TransitionZero, May 2024 release."
"TransitionZero (2024) Solar Asset Mapper."
Phillpott, M., O'Connor, J., Ferreira, A., Max, S., Kruitwagen, L., & Guzzardi, M. (2024). Solar Asset Mapper: A continuously-updated global
inventory of solar energy facilities built with satellite data and machine learning (1.0) [Data set].
Zenodo. https://doi.org/10.5281/zenodo.11368204
许可
TZ-SAM is made available under a Creative Commons Attribution Non-Commercial 4.0 International License (CC-BY-NC-4.0). Attribution to TransitionZero is required. You must also clearly indicate if you have made any changes to the TZ-SAM dataset and what these are.
Keywords: solar energy, energy transition, open data
Provided by; Transition Zero
Curated in GEE by: Samapriya Roy
Last updated in GEE: 2024-06-01
网址推荐
0代码在线构建地图应用
机器学习
- 点赞
- 收藏
- 关注作者
评论(0)