8.1 KiB
2
Crop: tomato Date of Lecture: 16 de julio de 2025 Link: https://arxiv.org/abs/2503.05568?utm_source=chatgpt.com Name: TomatoScanner: fenotipado de la fruta de tomate basado solo en una imagen RGB Type: Morphologic
1. Introduzione e motivazione
Nell'agricoltura in serra, l'ottenimento rapido e preciso delle caratteristiche fenotipiche (come diametro, area e volume del frutto) è fondamentale per gestire la temperatura, l'umidità e il CO₂, ottimizzando così la qualità e la resa del raccolto. I metodi manuali (calibratori, serbatoi di misurazione) sono precisi ma lenti e difficili da scalare, oltre ad esporre l'operatore ad ambienti potenzialmente nocivi. Gli approcci basati sulla visione artificiale si dividono in:
-
2D, che utilizzano solo immagini RGB ma richiedono calibrazioni esterne o danneggiano il frutto, oppure misurano caratteristiche poco rilevanti.
-
3D, che utilizzano telecamere con sensore di profondità e offrono un'elevata precisione ma rendono la soluzione più costosa e complicano l'implementazione.
TomatoScanner propone un metodo basato al 100% su immagini RGB, senza hardware aggiuntivo, ottenendo risultati paragonabili ai metodi 3D e migliori rispetto ad altri metodi 2D esistenti .
2. Architettura generale di TomatoScanner
Il flusso consiste in cinque fasi principali:
- Separazione individuale: rileva ogni frutto nell'immagine con un rilevatore YOLO11s e ritaglia finestre indipendenti, per elaborarle una per una .
- Correzione della posizione: individua due punti chiave (corpo e peduncolo) tramite YOLO11s, calcola il vettore di posizione e ruota il frutto in modo che sia verticale (peduncolo in alto), garantendo misurazioni coerenti .
- Segmentazione dell'istanza (EdgeYOLO):
- EdgeBoost (pre-elaborazione): migliora il contrasto e l'acutanza per evidenziare i bordi.
- EdgeAttention: modulo di attenzione focalizzato sulle regioni di bordo, che moltiplica le caratteristiche per una mappa di attenzione che enfatizza i contorni.
- EdgeLoss: funzione di perdita aggiuntiva che quantifica la discrepanza tra i bordi previsti e quelli reali (tramite gradienti Sobel), migliorando la precisione del contorno.
- EdgeBoost, EdgeAttention e EdgeLoss combinati riducono l'errore medio di bordo (mEE) dal 5,64% al 2,96% senza penalizzare in modo sostanziale la velocità o le dimensioni .
- Stima della profondità: utilizza “Depth Pro”, un modello monoculare di Apple che genera una mappa di profondità a partire dall'RGB, senza necessità di ulteriore addestramento .
- Fusione pixel-profondità: converte le unità pixel in centimetri mediante calibrazione inversa (regola di 10 cm a distanze controllate). Successivamente, regola larghezza, altezza, area e volume (l'integrale dei diametri orizzontali lungo l'asse verticale) in base alla profondità stimata .
3. Dataset e configurazione sperimentale
- Tomato Phenotype Dataset: 25 coppie immagine-misura manuale (calibratore, conteggio griglia, spostamento acqua), risoluzione 4000 × 4000 px, Sony Alpha 7C .
- Set di dati di rilevamento pomodori: 448 immagini con caselle annotate, divisione 298/100/50 per addestramento/valutazione/test.
- Set di dati di segmentazione pomodori: 381 maschere segmentate, divisione 261/80/40.
Tutti i modelli sono stati addestrati su GPU NVIDIA RTX 4090 per 300 epoche, con Python 3.11 .
4. Risultati
- Precisione fenotipica:
- Larghezza e altezza: mediane di errore relativo rispettivamente del 5,63 % e del 7,03 %.
- Area verticale: −0,64% (quasi perfetta).
- Volume: 37,06% (maggiore variabilità, a causa dell'accumulo di errori nell'integrale) .
- Confronto con metodi precedenti:
- Rispetto a Gu et al. (2D calibrato) e Zhu et al. (3D con telecamera di profondità), TomatoScanner raggiunge la completa automazione e semplicità di input (qualsiasi immagine RGB), mantenendo la qualità delle misurazioni e con un carico computazionale intermedio .
- Confronto tra segmentatori:
- Mask R‑CNN, YOLACT, RTMDet, SAM2, YOLO11n/x‐seg vs. EdgeYOLO.
- EdgeYOLO offre un eccellente compromesso: 48,7 M pesi, 76 FPS, mAP50 0,955 e mEE 2,963 %, eccellendo nella precisione dei contorni .
- Ablazione: ogni modulo (EdgeBoost, EdgeAttention, EdgeLoss) apporta riduzioni significative di mEE e la loro combinazione ottimale massimizza la precisione (P = 0,986) con mEE minimo (2,963 %) .
5. Conclusioni e prospettive
TomatoScanner dimostra che è possibile misurare automaticamente e in modo non distruttivo il fenotipo del pomodoro con un semplice RGB, integrando la segmentazione focalizzata sui bordi e la stima monoculare della profondità. I suoi principali vantaggi sono:
- Semplicità di implementazione: è necessaria solo una telecamera RGB.
- Automazione totale: senza calibrazioni o posizioni fisse.
- Elevata precisione nelle misurazioni lineari: diametro e area con errori inferiori al 7%.
Tra i limiti figurano la minore precisione nel volume (accumulo di errori) e una certa instabilità in altezza se la correzione della posa non è perfetta. Come lavoro futuro, si prevede la sua integrazione in un robot mobile per monitorare le serre in modo completamente autonomo
Ulteriori informazioni:
1. Misurazione con calibro (o piede di regno)
Che cos'è?
Un calibro, chiamato anche vernier o piede di regno, è uno strumento di precisione che consente di misurare lunghezze esterne, interne e profondità con una risoluzione tipica di 0,01 mm.
Come si usa sui pomodori?
- Diametro equatoriale: posizionare le “mascelle” esterne del calibro sui bordi opposti del frutto, proprio nella zona più larga (asse equatoriale).
- Altezza o asse polare: misurare la distanza tra il peduncolo (o dove si trovava) e la base opposta del frutto.
- Altri spessori: se necessario, è possibile misurare lo spessore delle pareti o di zone specifiche, utilizzando le punte interne del calibratore.
Vantaggi e limiti
- Elevata precisione (±0,01–0,05 mm).
- Semplicità e basso costo.
- Richiede la manipolazione di ogni singolo frutto, il che lo rende molto lento per grandi volumi. Inoltre, può deformare leggermente la buccia quando si stringono le ganasce e dipende dall'abilità dell'operatore nel posizionare sempre lo stesso piano di misurazione .
2. Volumetria per spostamento d'acqua (“serbatoio di misurazione”)
In cosa consiste?
Si basa sul principio di Archimede: il volume d'acqua spostato quando si immerge un oggetto è uguale al volume dell'oggetto stesso.
Protocollo tipico
- Preparazione del recipiente
- Un bicchiere o un serbatoio graduato con acqua fino a un livello noto (ad esempio, 500 ml).
- Immersione del frutto
- Con attenzione, si introduce il pomodoro completamente immerso (senza toccare le pareti).
- Lettura dello spostamento
- Annotare il nuovo livello dell'acqua (ad esempio, 580 ml).
- Calcolo del volume
- Volume del frutto = livello finale - livello iniziale (580 ml - 500 ml = 80 ml).
Varianti e precisazioni
- È possibile utilizzare un sistema di rubinetto sottile per misurare il livello con maggiore precisione, oppure una buretta al posto di un misurino graduato.
- La precisione tipica è di ±0,5 ml (a seconda della graduazione del recipiente).
- Limitazione principale: richiede di asciugare bene il frutto dopo la misurazione e comporta un ulteriore passaggio di preparazione e pulizia.
| Metodi | Medida obtenida | Precisión típica | Velocidad | Consideraciones |
|---|---|---|---|---|
| Calibro | Diametro, altezza, spessori | ±0,01–0,05 mm | Lento (1 frutto ≈ 30 sec.) | Può deformare il frutto |
| Spostamento d’acqua | Volume (mL ≈ cm³) | ±0,5 mL | Moderato (1 frutto ≈ 1 minuto) | Richiede l'essiccazione e la pulizia del frutto |
Questi metodi sono stati per decenni lo standard “sul campo” per caratterizzare la forma e il volume dei frutti, ma risultano poco scalabili quando si desidera analizzare centinaia o migliaia di esemplari, da qui l'interesse per soluzioni automatiche basate sulla visione artificiale.