Hiányos ismeretekkel rendelkezünk a halközösségek szerkezetét meghatározó abiotikus
tényezők jelentőségéről nagy folyókban. Kutatásunkban a Duna magyarországi szakaszán
2004. és 2022. között végzett halfaunisztikai felmérésekben szereplő 20 leggyakoribb
halfaj előfordulásaihoz rendeltünk vízügyi adatsorokból, illetve hidrodinamikai szimulációkból
adatokat és ezek között gépi tanulás (Machine Learning-ML) segítségével kerestünk
összefüggéseket. Az elemzésben független változóként feltüntetett 9 abiotikus tényező
közül a sodrás sebessége, a vízmélység és a mederanyag összetétele bizonyultak a legmeghatározóbb
változóknak, ami összecseng a korábbi kutatások eredményeivel. Emellett, az általunk
készített Random Forest modell alkalmasnak bizonyult adott körülmények mellett az
elemzett halfajok számosságának prediktálására a Duna teljes hazai szakaszán. Ezek
a becslések az egyes halfajok számára optimális élőhelyeket számszerűsítik. A ML elemzés
mellett lehetőségeket mutattunk a nagy teret és időt lefedő halfaunisztikai adatbázis
populációs kapcsolatok vizsgálatában (mint például invazív és őshonos fajok viszonya)
való használatára klasszikus statisztikai módszerekkel. Az itt kapott eredmények sok
esetben összecsengtek a random forest modellel, azonban okot adnak a modell további
független változókkal való bővítésére a dunai halfajok ökológiájának jobb megértése
érdekében.