martedì 8 marzo 2011

Un OCR per Ubuntu

Sono uno di quelli che di solito si lamenta, anche per la poca voglia di impegnarsi a fondo, riguardo ad alcune operazioni che su linux possono risultare difficile da fare, o meno meccaniche ed intuitive. Sebbene possa sembrare che sia così, lo è sempre. Di alternative valide, ai vecchi sistemi tradizionali (od a cui siamo abituati) ce ne sono, anche per operazioni che possono sembrare più complicate.
L'Optical Character Recognition, al secolo OCR, è quella utilissima tecnica che permette ad un computer di riconoscere testi e parole in un documento scannerizzato. Con Windows generalmente non ci sono problemi di sorta nel trovare buoni software (anche freeware) che permettono ciò. Con Ubuntu.... Idem. C'è bisogno di qualche passaggio in più è vero, ma solo inizialmente. Poi anche questa operazione potrà essere svolta con buoni risultati anche su questo sistema operativo.  Possiamo utilizzare il riconoscimento con Tesseract-OCR  avviabile dal gestore pacchetti.(anche per la lingua italiana).
Ed ora le mani nei capelli per strapparseli... Manca l'interfaccia grafica!! Magari c'è ancora chi dice che è più immediato e semplice tramite riga di comando (ne dubito fortemente), ma è possibile utilizzare la GUI di GImageReader (scaricando ed installando il pacchetto). Se non vi limitate a far riconoscere documenti digitalizzati o se avete anche bisogno di un software per la scannerizzazione sempre dal gestore pacchetti installate xsane.
Insomma alla fine anche questa operazione viene fatta su Ubuntu senza troppa fatica.

Nessun commento:

Posta un commento