Sziasztok.Szeretnék pdf-ből bármilyen text fájlt készíteni(word,txt stb). Nem nagyon találtam semmi kézzelfoghatót ebben a témában, esetleg ha lenne valakinek valamilyen ötlete szívesen fogadnám.Előre is köszönöm a hozzászólásokat, javaslatokat.
Tök mindegy, képpé is átalakíthatod, de az ocr meg nem lesz tökéletes, főleg, ha rossza a beolvasás minősége.Szóval több, mint valószínű, hogy szükség lesz előzetes képátalakításra és utólagos szövegjavításra.
Feltelepíted a popplert, képpé alakítod át – pdf2akármi/pdftoakármi (nem emlékszem pontosan) – (azt már olyan képpé, amit az adott ocr fel tud dolgozni – ha szükséges a változtatás), és/vagy be egy gimpbe, hogy feldolgozhatóbb legyen. Ocr ráuszít, aztán bármely szövegszerkesztőbe be… no itt kezdődik a kemény munka, mert végig kell olvasni és kijavítani a hibákat. Biztos, hogy lesznek… még a profi cuccoknál is vannak hibák.