Det skjer av og til at tekst i en pdf-dokumentet, kan ikke velges i en pdf-leser, for eksempel Adobe Reader eller Foxit Reader. Dette er vanligvis tilfellet med skannede dokumenter som er innebygd i pdf-filen.
Ett av alternativene for å arbeide med teksten i disse pdf-dokumenter er å bruke OCR-teknologi for å konvertere informasjon til tekst du kan jobbe med.
OCR betyr optical character recognition, som bruker en algoritme for å identifisere de tegnene som vises i en pdf-fil for å eksportere dem til en ren tekst-dokument eller en annen fil som støttes format.
PDF OCR er et gratis program for Windows-operativsystemet, som kan konvertere pdf-dokumenter til redigerbar tekst.
Oppdatering: Den nyeste, gratis versjonen av PDF OCR er sterkt begrenset. PDF OCR-verktøyet kan kun behandle tre sider, og bildet til pdf-verktøyet viser en stor vannmerke på den resulterende PDF-dokument. Dette gjør den gratis versjonen av programmet er ubrukelig for de fleste oppgaver.
Grensesnittet er delt inn i to områder som er uavhengige av hverandre. Det første vinduet laster pdf-dokumentet og viser innholdet i grensesnittet. Alle sidene vises på venstre side, og det er mulig å lese pdf-filen til høyre på skjermen.
Start OCR-knappen viser en konfigurasjonsvinduet for OCR-prosessen. Det er mulig å gjøre alle sider, et utvalg av sider eller bare gjeldende side.
Fremdrift og status vises til høyre i vinduet, og alle behandlet sider som er vist i det andre vinduet etterpå.
PDF OCR Editor er en enkel tekst editor som kan teoretisk brukes til å redigere tekst med en gang. OCR-prosessen naturlig feiltolker noen av de tegn som skal redigeres etterpå.
Tekst editor kan du eksportere den konverterte teksten som en tekst-eller doc dokument som angir den andre muligheten for redigering av teksten.
Det er vanligvis fornuftig å spare bearbeidede pdf-filen som et dokument (doc) og legg det inn i en tekst tekstbehandlingsprogram som Microsoft Word som tilbyr stave-og grammatikkontroll.
PDF OCR er et praktisk program som gir sine brukere en rask og enkel måte å gjøre pdf-dokumenter til tekst. Programmet støtter ti ulike språk og er kompatibel med alle 32-biters og 64-biters versjoner av Microsoft Windows-operativsystemet.
Et annet alternativ er Gratis for OCR-Skanning, som er en online tjeneste som kan behandle pdf-filer, blant andre.