Come ho già spiegato in varie parti
di Programmifree, se convertire da
qualsiasi formato (testo o grafica)
verso il PDF è un'operazione molto
semplice, utilizzando i programmi
appositi per
creare PDF, l'operazione
inversa, cioé il convertire da PDF a
un formato editabile (.doc, .html,
ecc.) può rivelarsi, in svariati
casi, un'operazione estremamente
complessa.Come infatti ho già
scritto per
Free PDF
to Word Converter, ci sono due possibilità:
a) il testo in origine è stato
convertito in PDF da un documento di
testo già esistente sul computer
(.odc. .txt, .rtf, ecc.).
b) il testo è stato acquisito da uno
scanner (o fotocamera digitale, o
altre unità ottiche), oppure
proviene da un'immagine (per esempio
una schermata video catturata da un
programma apposito, ecc.).
Nel primo caso, PDF2HTML
funzionerà in maniera molto buona.
Nel secondo caso, è impossibile convertire un
documento PDF in qualunque formato
di testo senza un riconoscimento
ottico dei caratteri (OCR), e
i
migliori programmi OCR
(Omnipage, FineReader) sono in
genere a pagamento, e pure
abbastanza costosi (anzi, spesso
PDf2HTML darà anche errore).
((( Si può però
utilizzare TopOCR, come descritto in
questa
guida da PDF a Word, o meglio
ancora
FreeOCR. )))
In questa
circostanza, questi semplici
programmini fanno più danni che altro,
creando un documento di alcune
decine di MB, limitandosi a
convertire il tutto in una serie di
inutili immagini grafiche.
PDF2HTML Gui, come dice il nome,
è un programma open source che
converte i documenti PDF in normali
file HTML, che possono essere letti
da qualunque browser (Explorer,
Opera, Firefox, ecc.), oppure
caricati da Word o anche da Open
Office (ma anche FrontPage,
Kompozer, ecc.), e modificati da
questi (e salvati nei rispettivi
formati).
Nel complesso è un programma
abbastanza buono (per quanto non aggiornato da anni),
pur considerando le distinzioni
fatte prima (cioé se abbiamo un PDF
del caso b non funzionerà affatto o
darà errore).
IMPORTANTE:
PDF2Html Gui richiede che GhostScript sia
installato sul computer per lavorare
al meglio (altrimenti funziona in
maniera ridotta, cioé le immagini
non saranno inserite nel testo):
anche GhostScript è open source e si
può scaricare da
qui (prelevare la versione
.exe).
download