Je to veľký problém, previesť pdf súbor do formátu wordu .doc. Tu článok .:
Skoro na 100% dobre funguje iba plná verzia
Adobe Acrobatu 6 CZ, CE. Ale aj tak je s tým ešte celkom dosť práce. O tom, ako z pdf dostanete von text a grafiku, píšu na
www.grafika.cz, konkrétne o
extrahovaní grafiky tu a o
extrahovaní textu tu.
Pri malých obrazovkách je dobré používať funkciu
Reflow /Zobrazení, Změnit natékání Ctrl+4/, vtedy sa dokáže text prispôsobiť veľkosti stránky. Samozrejme, príslušný pdf tak musí byť upravený, musíte na to mať plnú verziu Acrobata a stiahnuť si
MakeAccesible plugin. Výsledný súbor bude o niečo väčší a v originálnom dokumente nesmiete používať delenie slov, lebo potom sa to považuje za pomlčku.
Dlhodobá úspešnosť pri prevode je zhruba 20%, pri množstve textov Acrobat skončí na hláške - Príliš veľa fontov, prípadne je vo výsledku iba zmäť znakov. Ale ak to ide, tak má najlepší výstup - podmienkou je výstup do html verzie 3 bez kaskádových štýlov.
O niečo lepšie výsledky dosahuje
SolidConverterPDF, úspešnosť skoro 50%. Nevýhodou je veľmi veľké množstvo štýlov líšiacich sa iba desatinkovými číslami. Obvykle je najlepšie po prevode dokument zbaviť všetkého formátovania /vtedy sa aj scvrkne zhruba na štvrtinu/ a podľa originálu ho naformátovať, vyhádzať čísla strán, prípadne čo bolo pôvodne uvedené v záhlaví.
Ja som používal solidconverterPDF, ten dokázal vyrobiť nejaký schopný word súbor, ale bolo tam dosť chýb