分类:论文范文 发表时间:2021-11-16 10:27
摘要:该研究采用机器学习算法,明确冬小麦始花期的主要气象影响因子,并建立始花期预报模型。基于1980-2019年江苏省10个观测点冬小麦生育期观测资料和逐日气象数据,应用随机森林(RandomForest,RF)、反向神经网络(BackPropagation,BP)、多元线性回归(MultipleLinearRegression,MLR)3种算法分别建立始花期预报模型,以决定系数、均方根误差、预报准确率为评判指标,对模型模拟精度进行比较分析。结果表明,温度类因子对始花期影响的重要性明显大于降水类和日照类。基于筛选出的重要特征变量,3种算法建立的始花期预报模型均可在4月初对始花期进行预报,最迟可提前5d预报,最早可提前32d预报;RF算法模拟精度最高,BP算法次之,MLR算法相对低一些;RF算法能准确模拟出始花期波动趋势,大部分站点的始花日期预报准确率都在85.0%以上,表明RF算法在始花期预报中有较高的可靠性和业务应用潜力。
关键词:作物;气象;冬小麦;始花期;随机森林算法;神经网络算法
0引言
小麦赤霉病防治时期不同,用药效果差异较大,始花期是其最佳防治期。在小麦扬花6.0%~37.5%时施药,病指防效可达72.0%~79.0%;过早或过迟用药,病指防效均低于45.0[1-4]。赤霉病是威胁小麦产量和品质的重大流行性病害,而且已成为小麦生产可持续发展的重要影响因素之一[5-6],因此,开展小麦始花期预报研究对赤霉病精准防治具有重要意义[7]。
1资料与方法
1.1数据资料
冬小麦生育期观测资料和气象观测资料均来自于江苏省气象局,其中,江苏省冬小麦生育期观测资料普遍始于20世纪80年代初期,观测站点共10个:昆山、如皋、兴化、大丰、盱眙、滨海、淮安、沭阳、赣榆、徐州。冬小麦播种期、出苗期、三叶期、分蘖期、越冬期、返青期、起身期、拔节期、孕穗期、始穗期、抽穗普遍期、始花期、开花普遍期、乳熟期等,均由专业的农业气象技术人员按照《农业气象观测规范冬小麦》(QX/T299-2015)观测所得,一般发育期在下午观测,开花期在上午观测,其中抽穗与开花期每日观测,穗期和花期是以观测的总株(茎)数进入发育期的株(茎)数所占的百分率确定,当第一次进入开花期的株(茎)数百分率≥10%时,该日期记录为始花期。气象数据为各站点生育期观测年份对应的逐日气象观测资料,主要包括平均气温(℃)、≥0℃活动积温(℃)、最低气温≤0℃的累计日数(d)、降水量(mm)、降水日数(d)、日照时数(h)、日照百分率≥60%的日数(d)。
1.2资料预处理和区域划分
始花期数据采用日序法转换为数值型数据,即1月1日、1月2日、1月3日……分别为1、2、3……,其余类推。由于江苏南北跨度较大,气候条件的差异影响着始花期的迟早,按照气候相似性原则,结合农业区划,以淮河灌溉总渠和长江为界线,分为苏北、苏中、苏南3个区域,文中搜集到10个观测站点,按照所在地区,徐州、赣榆、淮安、沭阳、滨海可作为苏北地区的代表站点,大丰、如皋、兴化、盱眙可作为苏中地区的代表站点,昆山可作为苏南地区的代表站点。
2结果与分析
2.1冬小麦始花期基本特征
从表1可见,10个站冬小麦始花期历史最迟与最早相差天数都在21d以上,不同区域间始花期存在差异,苏北、苏中、苏南地区的平均始花期日序分别是120、115、110d。标准差大小可以表示始花期的离散度,苏北和苏中地区始花期的标准差都是5~6d,苏南地区始花期标准差是7d。有观测记录以来历史极端最早始花期是2002年4月5日,发生在昆山站,历史极端最迟始花期是2012年5月13日,发生在沭阳站。各站冬小麦始花期存在年际波动,且标准差较大,所以有必要通过建立预报模型对始花期进行预报。从总的变化趋势来看,滨海、淮安、昆山、如皋有较明显的提前趋势,线性倾向率分别为4.3、3.2、3.2、2.6d/(10a);徐州、赣榆、大丰略有提前趋势,主要集中在2010年以来;沭阳、兴化、沭阳变化趋势不明显。采用偏度和峰度检验法[26],对各站历年始花期出现的时间序列进行正态分布性检验,首先计算出始花期时间序列的偏度、偏度标准误差、峰度、峰度标准误差,然后计算相应的Z评分(Z-score),即偏度Z-score=偏度值/标准误差,峰度Z-score=峰度值/标准误差,在α=0.05的检验水平下,发现10个站的偏度Z-score和峰度Z-score均在±1.96之间,则表明各站冬小麦始花期资料符合正态分布的特征,说明可以通过建立多元线性回归模型对始花期进行预报。
2.2影响始花期的预报因子筛选及其评价
冬小麦在生长过程中需要具备一定的热量、光照和水分,光温水条件的匹配程度影响着生育进程的快慢,因此,为了筛选出对始花期有影响且符合生物学意义的气象因子,将温度、降水、日照3类因子均作为预报因子的初选因子。考虑到所选预报因子距离实际始花期应有一定提前量,因此预报因子的统计终止日期设定为3月末,选用的具体气象因子见表2。利用建立的始花期预报模型在4月1日对各站的始花期进行预测,由于始花期历史极端最早日期是4月5日,因此所建立的预报模型可以提前5d进行预测;最迟始花期中兴化站日期最早,为5月2日,预报模型最早可以提前32d。另外,考虑到播种期的早晚对生育进程也会有一定影响,因此将播种日序(记为D)也作为预报因子。
3讨论
预报因子的初步筛选是冬小麦始花期预报模型建立的基础,RF算法具有筛选重要特征变量的优势,得出的预报因子重要性排序与预报因子和始花期相关系数的高低相吻合,经过比较,3种算法下,将筛选出的重要特征变量作为预报因子,均可降低不重要变量对模型精度的干扰,从而提高模型模拟性能,因此,特征变量的筛选是训练始花期预报模型的基础和提升预报模型精度的有效方法,这与刘峻明等[33]、岳继博等[34]的研究结论一致。RF和BP两种机器学习算法的模拟精度要高于MLR算法的模拟精度,因为预报因子和始花期之间的关系并不是简单的线性关系,而是存在较为复杂的非线性关系,所以MLR算法中入选的自变量个数普遍偏少,过少的自变量无法较好表征对始花期的影响。RF算法收敛规则遵循大数定律、泛化误差具有收敛性,训练速度快,且不易产生过拟合;BP算法采用梯度下降的原理,收敛速度慢,易陷入局部极值点,导致神经网络的分类精度下降,所以RF算法下的建模速度要快于BP算法,且精度更高,但对于始花期极端年份的模拟过于“保守”,而BP算法则存在始花期波动幅度模拟过大的问题。RF算法中的树节点个数Mtry、BP算法中的神经节点个数Net是这两种机器学习算法中的重要参数,两种算法在训练模型时均是采取了随机抽样的方法,每次建立的模型精度存在差异,RF算法下训练样本的模拟精度均很高,BP算法下训练样本的模拟精度则不稳定,选取每个节点数对应的最优模型,对其预报结果集成能有效提高模型精度、减小随机误差。由于冬小麦始花期不仅与气象因子、播种期有关,实际还与田间管理、肥料的施用、作物品种等因素有关,因此,机器学习算法下的预报结果仍然存在一定的偏差,在实际应用时还需要结合田间实际情况。综合而言,文中利用机器学习算法建立始花期预报模型的思路为预报冬小麦始花期提供了新的方法和思路,而且对RF、BP、MLR三种算法的模拟精度的对比分析结果,可为选用更合理的预报模型提供依据。RF机器学习算法可在冬小麦始花期预测中进行应用,建立的预报模型较BP和MLR算法更具可靠性和准确性。预报结果可为农业部门抓住用药最佳时机提供指导,增强防治效果,保障小麦质量安全,减少盲目用药,减轻农药面源污染。
4结论
本文以冬小麦始花期为研究对象,利用随机森林机器学习算法,以精度平均减少值为评价指标,结合冬小麦生育期生长发育特点,筛选出对始花期影响较为重要的因子,分别利用随机森林算法和反向传播神经网络算法,随机选取训练样本和测试样本,经过成百上千次的学习,建立最优预测模型,并进行模型模拟精度的验证;同时还利用多元线性回归算法进行建模,比较了3种算法下模型的模拟精度,得到以下主要结论:
1)冬小麦始花期存在较为明显的年际波动,大部分地区有提前趋势,各地冬小麦始花期历史最迟与最早相差天数都在21d以上,不同区域间始花期存在差异。
2)随机森林算法重要性度量表明,温度类因子对始花期影响的重要性明显大于降水类和日照类,重要性排在前5位的因子是:上年12月-当年3月日均温≥0℃活动积温、上年12月-当年3月平均气温、上年12月当年3月最低气温≤0℃的累计日数、当年3月平均气温、上年12月-当年2月日均温≥0℃的活动积温。
3)3种算法建立的始花期预报模型,均可在4月初对冬小麦始花期进行预报,按照历史上始花期的极端年份,则最迟可以提前5d预报,最早可以提前32d预报。RF算法模拟精度最高,BP算法次之,MLR算法相对低一些。
[参考文献]
[1]李东明,王玉国,徐东祥,等.不同小麦品种、施药时期对赤霉病、白粉病的影响[J].农业开发与装备,2018(2):108-109.LiDongming,WangYuguo,XuDongxiang,etal.Effectsofdifferentwheatvarietiesandsprayingtimeonscabandpowderymildew[J].AgriculturalDevelopmentandEquipment,2018(2):108-109.(inChinesewithEnglishabstract)
[2]刁春友,朱叶芹.农作物主要病虫害预测预报与防治[M].南京:江苏科学技术出版社,2006:389.
[3]王国平,潘川之,任新国,等.植物源作物诱抗剂对小麦赤霉病的抑制效果[J].湖南农业大学学报:自然科学版,2001,27(1):50-52.WangGuoping,PanChuanzhi,RenXinguo,etal.Controleffectsofinducedresistanceonwheatscabbyplantpharmaceuticals[J].JournalofHunanAgriculturalUniversity:NaturalSciences,2001,27(1):50-52.(inChinesewithEnglishabstract)
徐敏1,赵艳霞2※,张顾3,高苹1,杨荣明4
相关阅读
论文常识
期刊知识
著作出版
教材出书
专利申请
出版社