关键词:
海洋监测
赤潮
数据仓库
数据挖掘
聚类分析
摘要:
我国海洋资源丰富,国民经济的持续发展离不开海洋的合理开发和保护。随着我国沿海工农业的发展和人口的增加,海洋环境污染日趋严重。赤潮频发且规模不断扩大,严重破坏了沿海生态环境,危害人类生命财产安全,导致了巨大的经济损失。因此,研制实时、可靠的海洋环境在线监测系统,建立准确、高效的赤潮预测预警系统,完全符合国家海洋开发战略部署和社会发展的迫切需要。 本文首先借鉴国内外海洋立体监测系统的成功经验,依托日趋成熟的海洋监测技术,结合先进的计算机技术、网络通讯技术、控制理论、数据仓库技术和嵌入式系统,深入研究并提出了海洋环境在线监测及赤潮灾害智能预警系统的基本架构,设计了一套系统集成协议用于支持分布式、异构子系统之间的交互。其次,根据赤潮发生的复杂机理和海洋环境数据资料的特点,采用先进的数据库技术及数据仓库建模方法,规划并设计了海洋环境数据仓库,为用户提供了丰富、可靠的数据源,使用户可以从不同层次、不同视角分析和使用海洋环境数据资料。同时,海洋环境数据仓库的建立为相关的数据挖掘工作提供了强有力的保障。然后,详细介绍了数据挖掘的相关理论知识及其发展应用,重点研究了聚类分析特别是模糊c均值(FCM)聚类算法。针对传统FCM聚类算法的不足,提出了一种基于相似关系的SWFCM聚类算法,有效地提高了算法的运行速度和聚类结果的准确率。同时,将该方法应用到海洋数据的分析工作当中,在赤潮的预测预警方面取得了良好的效果。最后,以多种数据挖掘算法为支撑,设计开发了开源的、跨平台、可移植性好、可视化的海洋环境数据挖掘系统。通过可视化技术的直观性来弥补数据挖掘算法复杂性的缺陷,从可视化角度解释数据挖掘的结果,丰富完善了数据产品子系统的功能。 海洋环境数据挖掘系统由两部分组成:基于C/S模式的数据挖掘软件(MDMS)和基于B/S模式的Web数据挖掘系统。MDMS是基于Linux操作系统,使用MySQL和Qt Designer作为开发工具设计的。该软件分为软件启动、数据获取、数据挖掘、结果展示四个功能模块,模块化结构增强了软件的扩展性和可配置性;集成了海洋数据接收服务器,实时接收监测子系统采集的海洋数据并存储到海洋环境数据仓库中。MDMS可以处理多种不同类型的海洋数据源,其数据挖掘模块集成了多种数据挖掘算法,并结合赤潮灾害的特点进行了改进及优化,有效地提高了算法的实用性和预测的准确率。B/S模式的Web数据挖掘系统是基于开源组合开发平台LMAP(Linux、MySQL、Apache、PHP)开发的。在B/S模式下,用户通过浏览器将业务请求发送至服务器,服务器执行用户请求并返回结果,仅使用浏览器就可以实现查询、分析、保存数据等功能。该模式极大地提高了系统的易用性,降低了系统的部署、维护成本,提高了数据挖掘的可视化程度。 本课题来源于2004年山东省科学技术发展计划(重点项目)2004GG2205108。数据挖掘技术在海洋环境在线监测及赤潮灾害智能预警系统中的成功运用,有助于建设、改造、升级现有的监测系统和信息平台,增强赤潮灾害预报和预警能力,保障我国海洋经济的可持续发展。