PDF2HTML GUI

(convertire da PDF a .doc, Word, RTF, HTML) 


Come ho già spiegato in varie parti di Programmifree, se convertire da qualsiasi formato (testo o grafica) verso il PDF è un'operazione molto semplice, utilizzando i programmi appositi per creare PDF, l'operazione inversa, cioé il convertire da PDF a un formato editabile (.doc, .html, ecc.) può rivelarsi, in svariati casi, un'operazione estremamente complessa.

Come infatti ho già scritto per Free PDF to Word Converter, ci sono due possibilità:
a) il testo in origine è stato convertito in PDF da un documento di testo già esistente sul computer (.odc. .txt, .rtf, ecc.).
b) il testo è stato acquisito da uno scanner (o fotocamera digitale, o altre unità ottiche), oppure proviene da un'immagine (per esempio una schermata video catturata da un programma apposito, ecc.).

Nel primo caso, PDF2HTML funzionerà in maniera molto buona.

Nel secondo caso, è impossibile convertire un documento PDF in qualunque formato di testo senza un riconoscimento ottico dei caratteri  (OCR), e i migliori programmi OCR (Omnipage, FineReader) sono in genere a pagamento, e pure abbastanza costosi (anzi, spesso PDf2HTML darà anche errore).
((( Si può però utilizzare TopOCR, come descritto in questa guida da PDF a Word, o meglio ancora FreeOCR. )))

In questa circostanza, questi semplici programmini fanno più danni che altro, creando un documento di alcune decine di MB, limitandosi a convertire il tutto in una serie di inutili immagini grafiche.

PDF2HTML Gui, come dice il nome, è un programma open source che converte i documenti PDF in normali file HTML, che possono essere letti da qualunque browser (Explorer, Opera, Firefox, ecc.), oppure caricati da Word o anche da Open Office (ma anche FrontPage, Kompozer, ecc.), e modificati da questi (e salvati nei rispettivi formati).

Nel complesso è un programma abbastanza buono (per quanto non aggiornato da anni), pur considerando le distinzioni fatte prima (cioé se abbiamo un PDF del caso b non funzionerà affatto o darà errore).

IMPORTANTE: PDF2Html Gui richiede che GhostScript sia installato sul computer per lavorare al meglio (altrimenti funziona in maniera ridotta, cioé le immagini non saranno inserite nel testo): anche GhostScript è open source e si può scaricare da qui (prelevare la versione .exe).

download

GIUDIZIO: BUONO -
 

 

Categoria: PDF