长江中游水文站点流量数据下载及处理

  • Post author:
  • Post category:其他




流量水位数据获取途径

千里眼水雨情查询系统

网址http://113.57.190.228:8001/#!/web/Report/RiverReport

选择自己所需的站点及时间范围,点击查询即可获得,若想要将数据导出为excel表,点击右上角导出。注意:若数据超过300页导出时则会报错,每次只能导出300页以内,如何导出更多页,笔者还未探索出方法。

系统页面



下载后的数据处理

用R Studio 对下载的数据进行处理

下载好的数据为倒序排列,首先将下载好的数据按时间重新排序,保留自己想要处理的列数据,将时间列的空格全部替换为 “

X

”,方便下文代码对时间进行分割。

#设置工作路径
setwd("F:\\")
#加载所需的包
install.packages('openxlsx')
library(openxlsx)
install.packages('tidyverse')
library(tidyverse)
#按时间开始筛选
runoff <- read.xlsx("输入的文件名.xlsx", sheet = "Sheet0")
runoff
runoff2 <- separate(data = runoff, col = '报讯时间', into = c("day", "time"), sep = "_X_")
shaixuan <- runoff2[which(runoff2$time == "08:00"), ]#所取数据为每日8:00的,也可根据自己的需求修改
shaixuan
#输出处理好的excel数据
write.xlsx(shaixuan,file="输出的文件名.xlsx", rowNames = FALSE)

用Python对下载的数据进行处理

直接下载的excel文件格式需要自己调整成时间一列和流量一列,删去多余的信息

# -*- coding: utf-8 -*-
import pandas as pd
# 设置工作路径
path = "E:\\"

# 读取Excel文件
data = pd.read_excel(path + "输入的文件名.xlsx", sheet_name="Sheet1")

# 将时间列转换为日期格式
data["报讯时间"] = pd.to_datetime(data["报讯时间"])

# 筛选出每日8:00对应的流量值
filtered_data = data[data["报讯时间"].dt.hour == 8]

# 输出筛选结果
filtered_data.to_excel(path + "输出的文件名.xlsx", index=False)



版权声明:本文为weixin_45058703原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。