准确性一直是气象预报的难点,气象预测的基础是观测数据,而观测数据理想的状态是观测点足够多,不过这在现实中无法实现,通常一个城市只有有限的几个观测点来收集气象数据,而位于观测点之间的盲点数据,只能通过推算等方式获得。
作为国内气象APP领头羊的墨迹天气,为了弥补传统气象观测的短板,将海量数据汇总,并加以研判,提升预报准确性。
墨迹天气的数据主要来源于三方面:第三方气象组织、各种设备传感器和时景社区。
首先,是和其他气象公司合作,如中国国家气象局,美国NOAA(美国国家海洋和大气管理局)的GFS,欧洲EC(欧洲中期天气预报中心),日本气象卫星数据以及中国国家气象局的数据等。这些组织有全球观测数据,这些观测数据通过卫星做遥感,所以质量相对较高,每天约有500G左右的量。
其次,就是利用各种传感器所收集的气象数据,如墨迹C端用户的手机基本都带有气压计、温度传感器;与通用汽车合作,在汽车上配置的气温、气压等传感器;还有魅族、华为等手机预装的墨迹APP。这部分数据量每天约8000万左右,但由于形式不一,每个设备上的数据都有偏差波动,导致质量参差不齐,要进行统一化的处理才能投入使用。
最后,结合时景社区,也就是实时天气社区,每天约有十万张天气照片上传至时景社区,总气象图片资源达亿级,是目前国内最大的实时天气图片社区。
墨迹天气的数据分析分为两部分,一部分是0~2两个小时的短时预报和2~8小时的短临预报。另一部分是8小时到15天的中长期预报。机器学习主要用在短时预报,主要采用业界比较先进的神经学习网络,如用FCN网络(全卷积网络)和Conv-LSTM网络(长短时记忆网络)等这些具体的分支,实现把不同来源的数据先做噪音排除,之后融合,去学习这些气象数据在历史上的变化趋势。
短时预报除C端用户可以在出门前查看实时天气之外,B端用户也可以结合气象,节省成本,提升效率。墨迹商业化VP张明明介绍,像运输、末端物流、农业等行业对短时预报的需求相对较高,例如中石油物流配送案例,双方把历史天气数据和中石油的销售数据整合,进行模型训练,帮助中石油解决周期长且跨省的资源调配问题。
墨迹天气短时预报系统是从2015年纠察小队长内测开始发展,一步步趋近成熟。下图是墨迹短时预报的发展历程:
当前,气象领域的市场竞争愈演愈烈,不知道墨迹这条基于海量气象数据分析的领先技术,为企业级用户提供企业级气象服务的吸金路能走多远,但至少墨迹从功能类App运营商向互联网综合气象服务提供商的转型,使得墨迹的路越走越宽。