Computer Vision per le Infrastrutture: Vantaggi e Applicazioni Pratiche
Computer Vision per le Infrastrutture: Vantaggi e Applicazioni Pratiche


Oggi affrontiamo una tecnologia di cui molto si parla e di cui spesso vengono fraintese le capacità e sottostimate le possibili applicazioni: la Computer Vision. Nel nostro mondo sembra ancora poco utilizzata, ma in realtà la computer vision per le infrastrutture ha non solo un grande potenziale, ma anche applicazioni concrete che già oggi portano un grande valore aggiunto. Ne parliamo con Gabriele Galatolo, CTO di Kode, società che offre soluzioni di Intelligenza Artificiale, e partecipata da EBWorld.
Ciao Gabriele, come primo punto, cosa si intende quando si parla di Computer Vision?
Come prima cosa partiamo da un punto di vista tecnico: la computer vision è una branca dell’informatica e della statistica, che sfrutta modelli e algoritmi che analizzano immagini (siano esse foto o frame di video) per analizzare e/o ottenere informazioni dal dato visivo. La Computer Vision può essere applicata per due obiettivi differenti: supportare e sviluppare compiti di l’Intelligenza Artificiale, dall’altra supportare l’elaborazione delle immagini.
La Computer Vision ha le sue radici nell’Image Processing dove processi matematici (kernel, filtri, convoluzioni) trasformano l’immagine di partenza in un’immagine elaborata secondo le esigenze del compito specifico. Si tratta di tutte quelle tecniche complesse, ma deterministiche, che già utilizziamo quotidianamente – si pensi ai filtri Instagram – che utilizzano appunto processi matematici o statistici per produrre l’output desiderato. Sempre per parlare del caso Instagram, applicare filtri che modificano la tonalità e la struttura dell’informazione presente nell’immagine originale per ottenere un’immagine differente.
Per essere più specifici, prendiamo ad esempio un’operazione che facciamo frequentemente: il ridimensionamento di un’immagine. Nel caso di un ingrandimento aumentando la grandezza dell’immagine si aumentano di conseguenza il numero dei pixel che compongono l’immagine: essendo l’immagine finale più grande, e con più pixel, il problema sta nel fatto che i pixel aggiuntivi non hanno di base un colore assegnato e bisogna capire come “colorarli” sfruttando l’informazione di colore dei pixel vicini, dell’immagine di partenza, per riempire questi “buchi”.
Per affrontare questo problema si utilizzano normalmente metodi di interpolazione matematica, con cui, a partire dai punti disponibili si genera il colore dei nuovi pixel in base a quelli esistenti (informazione nota) nell’intorno dell’informazione mancante. La specifica equazione elabora le informazioni note per determinare l’informazione mancante, in modo deterministico. Quando questa operazione è guidata da un essere umano, l’immagine finale risulterà più o meno sgranata in base al metodo di interpolazione prescelto, e molto sta alla sensibilità dell’operatore e dalla selezione del metodo e dei parametri che l’operatore sceglie. Lo stesso processo, svolto da un algoritmo di Computer Vision, elabora l’informazione dopo aver passato una prima fase di training di molte immagini, apprendendo i pattern più comuni per generare un pixel mancante in base all’intorno noto, applicando quindi un metodo più statistico e basato su una qualche ‘esperienza’ sviluppata in fase di apprendimento. L’operatore così, anziché occuparsi dell’operazione su ogni singola immagine, gestirà il modello affinché apprenda quali filtri applicare.
L’attuale potenza di calcolo dei computer permette – in tempi ragionevoli – l’applicazione di tecniche e modelli basati su reti neurali per l’automazione di task complessi, propri della visione umana (nella relazione occhio-cervello), permettendo il salto da Image Processing all Computer Vision. Parliamo ad esempio di riconoscimento di immagini (classificazione) o identificazione di elementi all’interno di un’immagine (image detection), ma anche del tracciamento di uno specifico elemento in un video o anche della generazione di nuove immagini così realistiche da sembrare fotografie.

Tutte queste applicazioni della Computer Vision sono affascinanti, puoi spiegarci quali le ricadute concrete nel quotidiano? La guida autonoma è una di queste?
Quando si parla di computer vision la guida autonoma è subito la prima idea che balza in mente, come se fosse un brillante futuro che concretizzerà l’utilità di questa tecnologia – fino a qui branca di ricerca scientifica di cui utilizziamo solo tecniche e tecnologie derivate.
È come la ricerca spaziale, che tutti pensano sia orientata esclusivamente ai viaggi verso altri pianeti. Al contrario la ricerca che sta alla base dei viaggi spaziali ha dato vita a nuove tecnologie e conoscenze con ricadute e applicazioni reali enormi. Allo stesso modo la guida autonoma è una cosa molto complicata, ma sognarla sostiene la ricerca, generando applicazioni che già utilizziamo nella quotidianità, come il controllo degli accessi in ZTL, i contapersone con le telecamere di sorveglianza, le casse ai self-service dove basta inquadrare il vassoio per avere il conto, o il controllo qualità in ambito industriale, che è uno degli ambiti su cui, in Kode, abbiamo lavorato molto.


Ci sono moltissimi campi di applicazione che quasi non ci accorgiamo della loro presenza già nelle nostre vite: ci siamo dentro, non è più un passaggio, e questa cosa succede perché il grande vantaggio dei modelli di Computer Vision, come di tutto il Machine Learning sta nell’automazione che riduce drasticamente quella parte di errore umano non legato alla competenza, ma al fatto di essere umani: come la distrazione in primis, ma anche semplicemente la necessità di raggiungere o lavorare in luoghi impervi e contesto critici, e.g ambienti contaminati o tubazioni sotterranee. In questo senso la computer vision per le infrastrutture, in cui parliamo di contesti di grandi dimensioni con caratteristiche molto varie, può svolgere un ruolo chiave per la loro gestione.
Ci puoi fare qualche esempio di applicazione della Computer Vision per le Infrastrutture?

La Computer Vision per le infrastrutture ha grandi potenzialità: partendo dalla semplice rete stradale, (e autostradale, in particolare), per arrivare alle infrastrutture idriche o le reti elettriche o per la connettività (telefonica e non solo). Il controllo e la gestione di queste reti è un lavoro oneroso, in termini di tempo e di risorse, che potrebbe trarre grande vantaggio dall’impiego di tecnologie AI-based.
Basta pensare a quei casi in cui un punto chiave dell’infrastruttura risiede in zone remote o di difficile accesso, in cui un sistema di controllo e alerting da remoto, ottimizzerebbe sicuramente il lavoro delle squadre.
Resta, però, un tema legato ai costi, che frena nell’applicazione massiva della Computer Vision per le infrastrutture. Parlare di immagini, significa infatti parlare di procedure e dispositivi, e nel caso di reti infrastrutturali (di per sè molto estese), bisogna pensare ad un grande numero di installazioni. Il monitoraggio dello stato di degrado di un intero sistema, ad esempio, sia esso idrico, elettrico, telefonico o altro, richiede una rete molto fitta di immagini.
A tal proposito citavo le autostrade come caso emblematico opposto per il livello di automazione estrema che si può raggiungere grazie ad una importante presenza di telecamere sull’intero reticolo autostradale. Con una struttura del genere non solo si può automatizzare il pedaggio (con il riconoscimento della targa al casello in ingresso e uscita), ma si può persino tracciare l’intero percorso di un’auto, e così controllare gli eventuali errori del sistema.
Perché, è importante ribadirlo: essendo le tecnologie AI legate a doppio filo alla statistica, gli errori succedono ed è importante essere consapevoli che possano accadere e come affrontarli. A volte si verificano casi particolari (in cui, ad esempio, la vista della telecamera è in qualche modo impedita- questo ci tengo a sottolinearlo: ciò che l’occhio umano non può vedere, neppure l’AI può farlo).


Altre volte l’errore è dovuto al semplice fatto che essendo queste tecnologie basate sulla statistica, difficilmente o in casi molto particolari raggiungiamo quote vicine all 100% di accuratezza, in termini di risposte e risultati prodotti, del sistema. In quel caso parleremmo saremmo di fronte ad automazione pura.

Queste considerazioni non devono portarci a ritenere la Computer Vision una tecnologia troppo complessa o costosa per prenderla in considerazione, tanto che anche nel settore delle infrastrutture le applicazioni sono varie. Persino nell’ambito del monitoraggio è sufficiente identificare l’esigenza concreta che può riguardare ad esempio, anziché l’intera rete, solo i suoi punti nevralgici. Oppure il monitoraggio per la manutenzione può non essere necessario che sia a ciclo continuo, ma periodico, quindi è sufficiente, ad esempio se parliamo di strade, una telecamera installata su un’auto che registra il percorso di interesse. Sono tante le soluzioni e tante le aree di applicazione.
Con l’ingresso di EBWorld nel capitale di Kode, stiamo affrontando diversi tavoli di lavoro in cui abbiamo iniziato a riflettere sulle applicazioni possibili dell’Intelligenza Artificiale e della Computer Vision in particolare, sia nel mondo delle infrastrutture, per quel che riguarda tutta la parte dei servizi a supporto della progettazione di reti, ma anche in maniera più ampia al GIS – al dato geografico – in cui la computer vision può basarsi sull’analisi di immagini di altro genere, come ad esempio quelle satellitari. Con questa fonte di informazione, la Computer Vision è in grado di confrontare la stessa area in due epoche diverse o confrontare lo stato dell’ultima immagine satellitare con le informazioni presenti in un database (finanche quelli catastali).
C’è un mondo, e noi siamo pronti a scoprire e contribuire a sviluppare soluzioni che consentano di godere dei vantaggi che la Computer Vision può portare alla gestione delle infrastrutture.
Kode è una società di sviluppo software specializzata nella creazione di soluzioni tailor-made che, mediante tecniche di Intelligenza Artificiale e partendo dai dati, rispondono alle esigenze dei propri clienti. Dal 2012 i nostri prodotti e soluzioni accompagnano aziende di vari settori (logistica, industria, chimica, utility, sport) nella trasformazione digitale, efficientando il loro business.
