Phenology/Doc/Documents/Papers/2.md

114 lines
8.1 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 2
Crop: tomato
Date of Lecture: 16 de julio de 2025
Link: https://arxiv.org/abs/2503.05568?utm_source=chatgpt.com
Name: TomatoScanner: fenotipado de la fruta de tomate basado solo en una imagen RGB
Type: Morphologic
## **1. Introduzione e motivazione**
Nell'agricoltura in serra, l'ottenimento rapido e preciso delle caratteristiche fenotipiche (come diametro, area e volume del frutto) è fondamentale per gestire la temperatura, l'umidità e il CO₂, ottimizzando così la qualità e la resa del raccolto. I metodi manuali (calibratori, serbatoi di misurazione) sono precisi ma lenti e difficili da scalare, oltre ad esporre l'operatore ad ambienti potenzialmente nocivi. Gli approcci basati sulla visione artificiale si dividono in:
- **2D**, che utilizzano solo immagini RGB ma richiedono calibrazioni esterne o danneggiano il frutto, oppure misurano caratteristiche poco rilevanti.
- **3D**, che utilizzano telecamere con sensore di profondità e offrono un'elevata precisione ma rendono la soluzione più costosa e complicano l'implementazione.
TomatoScanner propone un metodo basato al 100% su immagini RGB, senza hardware aggiuntivo, ottenendo risultati paragonabili ai metodi 3D e migliori rispetto ad altri metodi 2D esistenti .
## **2. Architettura generale di TomatoScanner**
Il flusso consiste in cinque fasi principali:
1. **Separazione individuale**: rileva ogni frutto nell'immagine con un rilevatore YOLO11s e ritaglia finestre indipendenti, per elaborarle una per una .
2. **Correzione della posizione**: individua due punti chiave (corpo e peduncolo) tramite YOLO11s, calcola il vettore di posizione e ruota il frutto in modo che sia verticale (peduncolo in alto), garantendo misurazioni coerenti .
3. **Segmentazione dell'istanza (EdgeYOLO)**:
- **EdgeBoost** (pre-elaborazione): migliora il contrasto e l'acutanza per evidenziare i bordi.
- **EdgeAttention**: modulo di attenzione focalizzato sulle regioni di bordo, che moltiplica le caratteristiche per una mappa di attenzione che enfatizza i contorni.
- **EdgeLoss**: funzione di perdita aggiuntiva che quantifica la discrepanza tra i bordi previsti e quelli reali (tramite gradienti Sobel), migliorando la precisione del contorno.
- **EdgeBoost**, **EdgeAttention** e **EdgeLoss** combinati riducono l'errore medio di bordo (mEE) dal 5,64% al 2,96% senza penalizzare in modo sostanziale la velocità o le dimensioni .
1. **Stima della profondità**: utilizza “Depth Pro”, un modello monoculare di Apple che genera una mappa di profondità a partire dall'RGB, senza necessità di ulteriore addestramento .
2. **Fusione pixel-profondità**: converte le unità pixel in centimetri mediante calibrazione inversa (regola di 10 cm a distanze controllate). Successivamente, regola larghezza, altezza, area e volume (l'integrale dei diametri orizzontali lungo l'asse verticale) in base alla profondità stimata .
## **3. Dataset e configurazione sperimentale**
- **Tomato Phenotype Dataset**: 25 coppie immagine-misura manuale (calibratore, conteggio griglia, spostamento acqua), risoluzione 4000 × 4000 px, Sony Alpha 7C .
- **Set di dati di rilevamento pomodori**: 448 immagini con caselle annotate, divisione 298/100/50 per addestramento/valutazione/test.
- **Set di dati di segmentazione pomodori**: 381 maschere segmentate, divisione 261/80/40.
Tutti i modelli sono stati addestrati su GPU NVIDIA RTX4090 per 300 epoche, con Python3.11 .
## **4. Risultati**
- **Precisione fenotipica**:
- *Larghezza* e *altezza*: mediane di errore relativo rispettivamente del 5,63% e del 7,03%.
- *Area verticale*: 0,64% (quasi perfetta).
- *Volume*: 37,06% (maggiore variabilità, a causa dell'accumulo di errori nell'integrale) .
- **Confronto con metodi precedenti**:
- Rispetto a Gu et al. (2D calibrato) e Zhu et al. (3D con telecamera di profondità), TomatoScanner raggiunge la completa automazione e semplicità di input (qualsiasi immagine RGB), mantenendo la qualità delle misurazioni e con un carico computazionale intermedio .
- **Confronto tra segmentatori**:
- MaskRCNN, YOLACT, RTMDet, SAM2, YOLO11n/xseg vs. EdgeYOLO.
- EdgeYOLO offre un eccellente compromesso: 48,7M pesi, 76FPS, mAP50 0,955 e mEE 2,963%, eccellendo nella precisione dei contorni .
- **Ablazione**: ogni modulo (EdgeBoost, EdgeAttention, EdgeLoss) apporta riduzioni significative di mEE e la loro combinazione ottimale massimizza la precisione (P=0,986) con mEE minimo (2,963%) .
## **5. Conclusioni e prospettive**
TomatoScanner dimostra che è possibile misurare automaticamente e in modo non distruttivo il fenotipo del pomodoro con un semplice RGB, integrando la segmentazione focalizzata sui bordi e la stima monoculare della profondità. I suoi principali vantaggi sono:
- **Semplicità di implementazione**: è necessaria solo una telecamera RGB.
- **Automazione totale**: senza calibrazioni o posizioni fisse.
- **Elevata precisione nelle misurazioni lineari**: diametro e area con errori inferiori al 7%.
Tra i limiti figurano la minore precisione nel volume (accumulo di errori) e una certa instabilità in altezza se la correzione della posa non è perfetta. Come lavoro futuro, si prevede la sua integrazione in un robot mobile per monitorare le serre in modo completamente autonomo
[2503.05568](https://arxiv.org/pdf/2503.05568)
# Ulteriori informazioni:
## 1. Misurazione con calibro (o piede di regno)
**Che cos'è?**
Un calibro, chiamato anche vernier o piede di regno, è uno strumento di precisione che consente di misurare lunghezze esterne, interne e profondità con una risoluzione tipica di 0,01 mm.
**Come si usa sui pomodori?**
1. **Diametro equatoriale**: posizionare le “mascelle” esterne del calibro sui bordi opposti del frutto, proprio nella zona più larga (asse equatoriale).
2. **Altezza o asse polare**: misurare la distanza tra il peduncolo (o dove si trovava) e la base opposta del frutto.
3. **Altri spessori**: se necessario, è possibile misurare lo spessore delle pareti o di zone specifiche, utilizzando le punte interne del calibratore.
**Vantaggi e limiti**
- **Elevata precisione** (±0,010,05 mm).
- **Semplicità** e basso costo.
- **Richiede la manipolazione di ogni singolo frutto**, il che lo rende molto lento per grandi volumi. Inoltre, può deformare leggermente la buccia quando si stringono le ganasce e dipende dall'abilità dell'operatore nel posizionare sempre lo stesso piano di misurazione .
## 2. Volumetria per spostamento d'acqua (“serbatoio di misurazione”)
**In cosa consiste?**
Si basa sul principio di Archimede: il volume d'acqua spostato quando si immerge un oggetto è uguale al volume dell'oggetto stesso.
**Protocollo tipico**
1. **Preparazione del recipiente**
- Un bicchiere o un serbatoio graduato con acqua fino a un livello noto (ad esempio, 500 ml).
1. **Immersione del frutto**
- Con attenzione, si introduce il pomodoro completamente immerso (senza toccare le pareti).
1. **Lettura dello spostamento**
- Annotare il nuovo livello dell'acqua (ad esempio, 580 ml).
2. **Calcolo del volume**
- Volume del frutto = livello finale - livello iniziale (580 ml - 500 ml = 80 ml).
**Varianti e precisazioni**
- È possibile utilizzare un sistema di rubinetto sottile per misurare il livello con maggiore precisione, oppure una buretta al posto di un misurino graduato.
- La precisione tipica è di ±0,5 ml (a seconda della graduazione del recipiente).
- **Limitazione principale:** richiede di asciugare bene il frutto dopo la misurazione e comporta un ulteriore passaggio di preparazione e pulizia.
| Metodi | Medida obtenida | Precisión típica | Velocidad | Consideraciones |
| --- | --- | --- | --- | --- |
| **Calibro** | Diametro, altezza, spessori | ±0,010,05mm | Lento (1 frutto ≈ 30 sec.) | Può deformare il frutto |
| Spostamento dacqua | Volume (mL ≈ cm³) | ±0,5mL | Moderato (1 frutto ≈ 1 minuto) | Richiede l'essiccazione e la pulizia del frutto |
Questi metodi sono stati per decenni lo standard “sul campo” per caratterizzare la forma e il volume dei frutti, ma risultano poco scalabili quando si desidera analizzare centinaia o migliaia di esemplari, da qui l'interesse per soluzioni automatiche basate sulla visione artificiale.