Kabaka123
14.10.20,11:44
Ako skonvertovať pdf dokument do docx, aby bol čitateľný.
Konverzia alebo klasické kopírovať a prilepiť má taký istý účinok... Takisto aj ked priamo v pdf použijem voľbu uložiť ako text.

Vybrala som len jedno meno, v zozname je ich cez 2000 (38 strán)
Chobot
14.10.20,09:59
Na to nie je jednoznačný návod. PDF dokumenty sú rôzneho formátu. Niektoré sú konvertované do pdf z rôznych zdrojov (word, excel, obrázky), pričom pri konverzii do pdf je možné ponechať text ako rozpoznateľný. V mnohých prípadoch je text nahradený obrázkom, nejakou bitmapou a potom sa písmená nedájú prekonvertovať späť na text.

Treba vyskúšať viac pdf konvertorov, na nete sú mnohé a sú on-line. Treba vyskúšať, ako skonvertujú pdf súbor. Uspokojivý výsledok nie je zaručený. Je to systém pokus - omyl.
Kabaka123
14.10.20,10:06
Ja predpokladám, že zdroj tohto dokumentu je v exceli resp. (vo worde) a následne uložený ako pdf.
ivka70
14.10.20,10:21
Tak ho skus otvarat v Exceli alebo Worde priamo, ak bol ulozeny ako pdf v nich, tak ti ich dokaze nacitat. Ak vsak bol vytlaceny do pdf cez nejaku pdf tlaciaren, to uz je problem
Kabaka123
14.10.20,10:23
To som už skúšala. Už som to otvárala ja v google doc. To isté.
Konvertovala som to aj ces Simpo portable sotware.
Kabaka123
14.10.20,10:32
Presne to robím pokus-omyl.

Teraz som sa dočítala vo vlastnostiach, že PDF vytvoril: GPL Ghostscript 9.05.
Možno moja pôvodná úvaha, že to bol najprv word alebo excel nebola správna.
dmc
14.10.20,11:27
na kvalitnu konverziu sluzia OCR (rozpoznavanie znakov) programy. Ja osobne mam dobre skusenosti s Abby Finereader -om
ivka70
14.10.20,11:32
V takom pripade asi nenajdes konvertor, ktory by ti to hodil do formatu Excelu ci Wordu 100% spravne.
misoft
14.10.20,16:28
Ak je tam GPL Ghostscript - ten PDF súbor bol asi vytvorený v GhostPDF.
https://www.ghostscript.com/
Len toľko ťa viem nasmerovať.

P.S.
Ešte toto som našiel
http://ghostword.sourceforge.net/
https://www.codeproject.com/Articles/32274/How-To-Convert-PDF-to-Image-Using-Ghostscript-API (treba si prečítať) a
https://forum.ghost.org/t/how-to-render-doc-or-pdf-files/2357 - tiež prečítať a vyhľadať riešenie.
marjankaj
14.10.20,17:10
Neviem, či je na hieroglygy nejaký konverzný program.
PotPalo
14.10.20,23:24
To zasa bude chýb... Ja mám s ním zlé skúsenosti, keď to v nadpise s 3 cm písmenami preložilo veľké G ako C.
Kabaka123
15.10.20,07:14
Našla som toto a zafungovalo mi to.
https://online2pdf.com/convert-pdf-to-xlsx-with-ocr

20 strán mi urobilo rýchlo. Ostatné nie a nie. Tak som ich rozdelila a spravila jednotlivo.

VYRIEŠENÉ
sthruskahe
15.10.20,08:52
Ja som s ním mal len dobré skúsenosti. Ale až od verzie 9-10.
Ešte existuje jedna finta. Zobraziť stránku, urobiť snímku obrazovky a obrázok hodiť do OCR. Stále to bude rýchlejšie než ručne.
Mimochodom, FineReader dokáže priamo konvertovať obsah obrazovky. A veľmi dobre.
Kabaka123
15.10.20,09:21
Ahoj Ivka. Vedela by si prosím vymazať ten obrázok, čo mám v otázke?
Mne sa nedá upraviť otázka (len koment). Vďaka.
dmc
15.10.20,13:03
zalezi od kvality scanu.....ak mas kvalitu...cca 300 DPI funguje paradne. 150 stranovy dokument - chybovost okolo 20-30 znakov. Myslím že je to dost slušné
Chobot
15.10.20,14:31
Síce nie som ivka, ale obrázok som odstránil...
Kabaka123
16.10.20,04:15
Ďakujem Chobot.