Fuzija podataka u predikciji prinosa useva

Milica Brkić

Istraživač-pripravnik, Institut Biosens

Danas se podaci mnogo lakše generišu zahvaljujući brojnim pametnim uređajima. Prikupljanje podataka nastalih iz različitih izvora, njihovo objedinjavanje i izučavanje posebno je važno u predviđanju prinosa useva jer mnogo promenljivih (vremenski uslovi, zemljište, hemijska i mehanička obrada…) utiče na konačan ishod. Povezivanjem izolovanih podataka dobija se detaljnija slika od one koju pruža bilo koji pojedinačni izvor.

Tim istraživača sa Instituta BioSens radi na modelu predviđanja prinosa useva koristeći fuziju podataka. Algoritam Data Fusion by Matrix Factorization (DFMF) je korišćen kako bi pomogao industriji semana da proizvodi bolje hibride. Nisu sve sorte pogodne za sva polja. Izbor semena je veoma važan, jer pomaže u smanjenju troškova i povećanju prinosa. Testiranje hibrida u različitim uslovima pomaže nam da shvatimo koji hibrid je pogodan za koje zemljiše i za koje uslove kako bi obezbedio visok i kvalitetan prinos. Ali njihovo ispitivanje u različitim scenarijima je nemoguće zbog eksperimentalnih troškova, vremenskih troškova i ograničenog broja lokacija na kojima uzgajivači mogu saditi hibride.

Slika 1: Data fusion configuration

Podaci koji su analizirani potiču sa takmičenja Syngenta Crop Challenge 2019, i to je jedan od najvećih javno dostupnih skupova podataka za istraživanje prinosa useva. Skup podataka se sastoji od prinosa različitih hibrida kukuruza, koji su gajeni u različitim okruženjima/njivama. Za svaku lokaciju bili su poznati podaci o zemljištu i meteorološki podaci. Cilj našeg rada bio je predvideti performanse svakog hibrida u svakom okruženju koristeći DFMF algoritam. Obogaćivanje istorijskog skupa podataka pomaže nam da na osnovu prinosa, koji je jedan od najboljih pokazatelja za pametan izbor semena, predvidimo koji je hibrid najbolje posaditi na određenoj lokaciji. Dobijeni rezultati su obećavajući. Imajući na umu da je predviđanje prinosa kukuruza vrlo izazovan zadatak jer postoji velika varijabilnost prinosa. Slika 2 prikazuje varijabilnost prinosa za 2015. godinu, gde je minimalni prinos bio 25,15, a maksimalan 198,25 kvintila po hektaru.

Slika 2: Histogram prinosa za 2015. godinu

Istraživanje u ovoj oblasti je veoma važno, jer je optimizacija useva važan izazov u budućnosti. Algoritmi kao što je gore pomenuti mogu nam pomoći da prevaziđemo ovaj problem.