# 2 Crop: tomato Date of Lecture: 16 de julio de 2025 Link: https://arxiv.org/abs/2503.05568?utm_source=chatgpt.com Name: TomatoScanner: fenotipado de la fruta de tomate basado solo en una imagen RGB Type: Morphologic ## **1. Introduzione e motivazione** Nell'agricoltura in serra, l'ottenimento rapido e preciso delle caratteristiche fenotipiche (come diametro, area e volume del frutto) è fondamentale per gestire la temperatura, l'umidità e il CO₂, ottimizzando così la qualità e la resa del raccolto. I metodi manuali (calibratori, serbatoi di misurazione) sono precisi ma lenti e difficili da scalare, oltre ad esporre l'operatore ad ambienti potenzialmente nocivi. Gli approcci basati sulla visione artificiale si dividono in: - **2D**, che utilizzano solo immagini RGB ma richiedono calibrazioni esterne o danneggiano il frutto, oppure misurano caratteristiche poco rilevanti. - **3D**, che utilizzano telecamere con sensore di profondità e offrono un'elevata precisione ma rendono la soluzione più costosa e complicano l'implementazione. TomatoScanner propone un metodo basato al 100% su immagini RGB, senza hardware aggiuntivo, ottenendo risultati paragonabili ai metodi 3D e migliori rispetto ad altri metodi 2D esistenti . ## **2. Architettura generale di TomatoScanner** Il flusso consiste in cinque fasi principali: 1. **Separazione individuale**: rileva ogni frutto nell'immagine con un rilevatore YOLO11s e ritaglia finestre indipendenti, per elaborarle una per una . 2. **Correzione della posizione**: individua due punti chiave (corpo e peduncolo) tramite YOLO11s, calcola il vettore di posizione e ruota il frutto in modo che sia verticale (peduncolo in alto), garantendo misurazioni coerenti . 3. **Segmentazione dell'istanza (EdgeYOLO)**: - **EdgeBoost** (pre-elaborazione): migliora il contrasto e l'acutanza per evidenziare i bordi. - **EdgeAttention**: modulo di attenzione focalizzato sulle regioni di bordo, che moltiplica le caratteristiche per una mappa di attenzione che enfatizza i contorni. - **EdgeLoss**: funzione di perdita aggiuntiva che quantifica la discrepanza tra i bordi previsti e quelli reali (tramite gradienti Sobel), migliorando la precisione del contorno. - **EdgeBoost**, **EdgeAttention** e **EdgeLoss** combinati riducono l'errore medio di bordo (mEE) dal 5,64% al 2,96% senza penalizzare in modo sostanziale la velocità o le dimensioni . 1. **Stima della profondità**: utilizza “Depth Pro”, un modello monoculare di Apple che genera una mappa di profondità a partire dall'RGB, senza necessità di ulteriore addestramento . 2. **Fusione pixel-profondità**: converte le unità pixel in centimetri mediante calibrazione inversa (regola di 10 cm a distanze controllate). Successivamente, regola larghezza, altezza, area e volume (l'integrale dei diametri orizzontali lungo l'asse verticale) in base alla profondità stimata . ## **3. Dataset e configurazione sperimentale** - **Tomato Phenotype Dataset**: 25 coppie immagine-misura manuale (calibratore, conteggio griglia, spostamento acqua), risoluzione 4000 × 4000 px, Sony Alpha 7C . - **Set di dati di rilevamento pomodori**: 448 immagini con caselle annotate, divisione 298/100/50 per addestramento/valutazione/test. - **Set di dati di segmentazione pomodori**: 381 maschere segmentate, divisione 261/80/40. Tutti i modelli sono stati addestrati su GPU NVIDIA RTX 4090 per 300 epoche, con Python 3.11 . ## **4. Risultati** - **Precisione fenotipica**: - *Larghezza* e *altezza*: mediane di errore relativo rispettivamente del 5,63 % e del 7,03 %. - *Area verticale*: −0,64% (quasi perfetta). - *Volume*: 37,06% (maggiore variabilità, a causa dell'accumulo di errori nell'integrale) . - **Confronto con metodi precedenti**: - Rispetto a Gu et al. (2D calibrato) e Zhu et al. (3D con telecamera di profondità), TomatoScanner raggiunge la completa automazione e semplicità di input (qualsiasi immagine RGB), mantenendo la qualità delle misurazioni e con un carico computazionale intermedio . - **Confronto tra segmentatori**: - Mask R‑CNN, YOLACT, RTMDet, SAM2, YOLO11n/x‐seg vs. EdgeYOLO. - EdgeYOLO offre un eccellente compromesso: 48,7 M pesi, 76 FPS, mAP50 0,955 e mEE 2,963 %, eccellendo nella precisione dei contorni . - **Ablazione**: ogni modulo (EdgeBoost, EdgeAttention, EdgeLoss) apporta riduzioni significative di mEE e la loro combinazione ottimale massimizza la precisione (P = 0,986) con mEE minimo (2,963 %) . ## **5. Conclusioni e prospettive** TomatoScanner dimostra che è possibile misurare automaticamente e in modo non distruttivo il fenotipo del pomodoro con un semplice RGB, integrando la segmentazione focalizzata sui bordi e la stima monoculare della profondità. I suoi principali vantaggi sono: - **Semplicità di implementazione**: è necessaria solo una telecamera RGB. - **Automazione totale**: senza calibrazioni o posizioni fisse. - **Elevata precisione nelle misurazioni lineari**: diametro e area con errori inferiori al 7%. Tra i limiti figurano la minore precisione nel volume (accumulo di errori) e una certa instabilità in altezza se la correzione della posa non è perfetta. Come lavoro futuro, si prevede la sua integrazione in un robot mobile per monitorare le serre in modo completamente autonomo [2503.05568](https://arxiv.org/pdf/2503.05568) # Ulteriori informazioni: ## 1. Misurazione con calibro (o piede di regno) **Che cos'è?** Un calibro, chiamato anche vernier o piede di regno, è uno strumento di precisione che consente di misurare lunghezze esterne, interne e profondità con una risoluzione tipica di 0,01 mm. **Come si usa sui pomodori?** 1. **Diametro equatoriale**: posizionare le “mascelle” esterne del calibro sui bordi opposti del frutto, proprio nella zona più larga (asse equatoriale). 2. **Altezza o asse polare**: misurare la distanza tra il peduncolo (o dove si trovava) e la base opposta del frutto. 3. **Altri spessori**: se necessario, è possibile misurare lo spessore delle pareti o di zone specifiche, utilizzando le punte interne del calibratore. **Vantaggi e limiti** - **Elevata precisione** (±0,01–0,05 mm). - **Semplicità** e basso costo. - **Richiede la manipolazione di ogni singolo frutto**, il che lo rende molto lento per grandi volumi. Inoltre, può deformare leggermente la buccia quando si stringono le ganasce e dipende dall'abilità dell'operatore nel posizionare sempre lo stesso piano di misurazione . ## 2. Volumetria per spostamento d'acqua (“serbatoio di misurazione”) **In cosa consiste?** Si basa sul principio di Archimede: il volume d'acqua spostato quando si immerge un oggetto è uguale al volume dell'oggetto stesso. **Protocollo tipico** 1. **Preparazione del recipiente** - Un bicchiere o un serbatoio graduato con acqua fino a un livello noto (ad esempio, 500 ml). 1. **Immersione del frutto** - Con attenzione, si introduce il pomodoro completamente immerso (senza toccare le pareti). 1. **Lettura dello spostamento** - Annotare il nuovo livello dell'acqua (ad esempio, 580 ml). 2. **Calcolo del volume** - Volume del frutto = livello finale - livello iniziale (580 ml - 500 ml = 80 ml). **Varianti e precisazioni** - È possibile utilizzare un sistema di rubinetto sottile per misurare il livello con maggiore precisione, oppure una buretta al posto di un misurino graduato. - La precisione tipica è di ±0,5 ml (a seconda della graduazione del recipiente). - **Limitazione principale:** richiede di asciugare bene il frutto dopo la misurazione e comporta un ulteriore passaggio di preparazione e pulizia. | Metodi | Medida obtenida | Precisión típica | Velocidad | Consideraciones | | --- | --- | --- | --- | --- | | **Calibro** | Diametro, altezza, spessori | ±0,01–0,05 mm | Lento (1 frutto ≈ 30 sec.) | Può deformare il frutto | | Spostamento d’acqua | Volume (mL ≈ cm³) | ±0,5 mL | Moderato (1 frutto ≈ 1 minuto) | Richiede l'essiccazione e la pulizia del frutto | Questi metodi sono stati per decenni lo standard “sul campo” per caratterizzare la forma e il volume dei frutti, ma risultano poco scalabili quando si desidera analizzare centinaia o migliaia di esemplari, da qui l'interesse per soluzioni automatiche basate sulla visione artificiale.