Phenology/Doc/Documents/Papers/2.md

8.1 KiB
Raw Permalink Blame History

2

Crop: tomato Date of Lecture: 16 de julio de 2025 Link: https://arxiv.org/abs/2503.05568?utm_source=chatgpt.com Name: TomatoScanner: fenotipado de la fruta de tomate basado solo en una imagen RGB Type: Morphologic

1. Introduzione e motivazione

Nell'agricoltura in serra, l'ottenimento rapido e preciso delle caratteristiche fenotipiche (come diametro, area e volume del frutto) è fondamentale per gestire la temperatura, l'umidità e il CO₂, ottimizzando così la qualità e la resa del raccolto. I metodi manuali (calibratori, serbatoi di misurazione) sono precisi ma lenti e difficili da scalare, oltre ad esporre l'operatore ad ambienti potenzialmente nocivi. Gli approcci basati sulla visione artificiale si dividono in:

  • 2D, che utilizzano solo immagini RGB ma richiedono calibrazioni esterne o danneggiano il frutto, oppure misurano caratteristiche poco rilevanti.

  • 3D, che utilizzano telecamere con sensore di profondità e offrono un'elevata precisione ma rendono la soluzione più costosa e complicano l'implementazione.

    TomatoScanner propone un metodo basato al 100% su immagini RGB, senza hardware aggiuntivo, ottenendo risultati paragonabili ai metodi 3D e migliori rispetto ad altri metodi 2D esistenti .

2. Architettura generale di TomatoScanner

Il flusso consiste in cinque fasi principali:

  1. Separazione individuale: rileva ogni frutto nell'immagine con un rilevatore YOLO11s e ritaglia finestre indipendenti, per elaborarle una per una .
  2. Correzione della posizione: individua due punti chiave (corpo e peduncolo) tramite YOLO11s, calcola il vettore di posizione e ruota il frutto in modo che sia verticale (peduncolo in alto), garantendo misurazioni coerenti .
  3. Segmentazione dell'istanza (EdgeYOLO):
  • EdgeBoost (pre-elaborazione): migliora il contrasto e l'acutanza per evidenziare i bordi.
  • EdgeAttention: modulo di attenzione focalizzato sulle regioni di bordo, che moltiplica le caratteristiche per una mappa di attenzione che enfatizza i contorni.
    • EdgeLoss: funzione di perdita aggiuntiva che quantifica la discrepanza tra i bordi previsti e quelli reali (tramite gradienti Sobel), migliorando la precisione del contorno.
    • EdgeBoost, EdgeAttention e EdgeLoss combinati riducono l'errore medio di bordo (mEE) dal 5,64% al 2,96% senza penalizzare in modo sostanziale la velocità o le dimensioni .
  1. Stima della profondità: utilizza “Depth Pro”, un modello monoculare di Apple che genera una mappa di profondità a partire dall'RGB, senza necessità di ulteriore addestramento .
  2. Fusione pixel-profondità: converte le unità pixel in centimetri mediante calibrazione inversa (regola di 10 cm a distanze controllate). Successivamente, regola larghezza, altezza, area e volume (l'integrale dei diametri orizzontali lungo l'asse verticale) in base alla profondità stimata .

3. Dataset e configurazione sperimentale

  • Tomato Phenotype Dataset: 25 coppie immagine-misura manuale (calibratore, conteggio griglia, spostamento acqua), risoluzione 4000 × 4000 px, Sony Alpha 7C .
  • Set di dati di rilevamento pomodori: 448 immagini con caselle annotate, divisione 298/100/50 per addestramento/valutazione/test.
  • Set di dati di segmentazione pomodori: 381 maschere segmentate, divisione 261/80/40.

Tutti i modelli sono stati addestrati su GPU NVIDIA RTX4090 per 300 epoche, con Python3.11 .

4. Risultati

  • Precisione fenotipica:
  • Larghezza e altezza: mediane di errore relativo rispettivamente del 5,63% e del 7,03%.
    • Area verticale: 0,64% (quasi perfetta).
  • Volume: 37,06% (maggiore variabilità, a causa dell'accumulo di errori nell'integrale) .
  • Confronto con metodi precedenti:
  • Rispetto a Gu et al. (2D calibrato) e Zhu et al. (3D con telecamera di profondità), TomatoScanner raggiunge la completa automazione e semplicità di input (qualsiasi immagine RGB), mantenendo la qualità delle misurazioni e con un carico computazionale intermedio .
  • Confronto tra segmentatori:
  • MaskRCNN, YOLACT, RTMDet, SAM2, YOLO11n/xseg vs. EdgeYOLO.
    • EdgeYOLO offre un eccellente compromesso: 48,7M pesi, 76FPS, mAP50 0,955 e mEE 2,963%, eccellendo nella precisione dei contorni .
  • Ablazione: ogni modulo (EdgeBoost, EdgeAttention, EdgeLoss) apporta riduzioni significative di mEE e la loro combinazione ottimale massimizza la precisione (P=0,986) con mEE minimo (2,963%) .

5. Conclusioni e prospettive

TomatoScanner dimostra che è possibile misurare automaticamente e in modo non distruttivo il fenotipo del pomodoro con un semplice RGB, integrando la segmentazione focalizzata sui bordi e la stima monoculare della profondità. I suoi principali vantaggi sono:

  • Semplicità di implementazione: è necessaria solo una telecamera RGB.
  • Automazione totale: senza calibrazioni o posizioni fisse.
  • Elevata precisione nelle misurazioni lineari: diametro e area con errori inferiori al 7%.

Tra i limiti figurano la minore precisione nel volume (accumulo di errori) e una certa instabilità in altezza se la correzione della posa non è perfetta. Come lavoro futuro, si prevede la sua integrazione in un robot mobile per monitorare le serre in modo completamente autonomo

2503.05568

Ulteriori informazioni:

1. Misurazione con calibro (o piede di regno)

Che cos'è?

Un calibro, chiamato anche vernier o piede di regno, è uno strumento di precisione che consente di misurare lunghezze esterne, interne e profondità con una risoluzione tipica di 0,01 mm.

Come si usa sui pomodori?

  1. Diametro equatoriale: posizionare le “mascelle” esterne del calibro sui bordi opposti del frutto, proprio nella zona più larga (asse equatoriale).
  2. Altezza o asse polare: misurare la distanza tra il peduncolo (o dove si trovava) e la base opposta del frutto.
  3. Altri spessori: se necessario, è possibile misurare lo spessore delle pareti o di zone specifiche, utilizzando le punte interne del calibratore.

Vantaggi e limiti

  • Elevata precisione (±0,010,05 mm).
  • Semplicità e basso costo.
  • Richiede la manipolazione di ogni singolo frutto, il che lo rende molto lento per grandi volumi. Inoltre, può deformare leggermente la buccia quando si stringono le ganasce e dipende dall'abilità dell'operatore nel posizionare sempre lo stesso piano di misurazione .

2. Volumetria per spostamento d'acqua (“serbatoio di misurazione”)

In cosa consiste?

Si basa sul principio di Archimede: il volume d'acqua spostato quando si immerge un oggetto è uguale al volume dell'oggetto stesso.

Protocollo tipico

  1. Preparazione del recipiente
  • Un bicchiere o un serbatoio graduato con acqua fino a un livello noto (ad esempio, 500 ml).
  1. Immersione del frutto
  • Con attenzione, si introduce il pomodoro completamente immerso (senza toccare le pareti).
  1. Lettura dello spostamento
    • Annotare il nuovo livello dell'acqua (ad esempio, 580 ml).
  2. Calcolo del volume
  • Volume del frutto = livello finale - livello iniziale (580 ml - 500 ml = 80 ml).

Varianti e precisazioni

  • È possibile utilizzare un sistema di rubinetto sottile per misurare il livello con maggiore precisione, oppure una buretta al posto di un misurino graduato.
  • La precisione tipica è di ±0,5 ml (a seconda della graduazione del recipiente).
  • Limitazione principale: richiede di asciugare bene il frutto dopo la misurazione e comporta un ulteriore passaggio di preparazione e pulizia.
Metodi Medida obtenida Precisión típica Velocidad Consideraciones
Calibro Diametro, altezza, spessori ±0,010,05mm Lento (1 frutto ≈ 30 sec.) Può deformare il frutto
Spostamento dacqua Volume (mL ≈ cm³) ±0,5mL Moderato (1 frutto ≈ 1 minuto) Richiede l'essiccazione e la pulizia del frutto

Questi metodi sono stati per decenni lo standard “sul campo” per caratterizzare la forma e il volume dei frutti, ma risultano poco scalabili quando si desidera analizzare centinaia o migliaia di esemplari, da qui l'interesse per soluzioni automatiche basate sulla visione artificiale.