PDF exchange editor vs.OCR

Dobrý večer,dnes som si zakúpil a stiahol prehliadač pdf dokumentov PDF exchange editor verzia 8 s OCR.No a zaujímalo by čo je to vlastne to OCR.Našiel som o tom na youtube nejaké video s týmto softverom,ale tak rýchlo tam pán ukazuje že vobec neviem o čo ide.Prosím čo je to vlastne to OCR aby som to pochopil aj ja ako laik.Ďakujem,pekný večer

Předmět	Autor	Datum
https://cs.m.wikipedia.org/wiki/Optick%C3%A9_rozpozn%C3%A1v%C3%A1n%C3%AD_znak%C5%AF Wikan 14.12.2020 17:14	Wikan	14.12.2020 17:14
Neber tieto americké, kapitaľistické pojmy a západné slangové skratky či skomoleniny v "potaz". Však… Nuda 14.12.2020 17:20	Nuda	14.12.2020 17:20
Ďakujem vám za odpovede.Takže rozumiem tomu tak,že si napr. stiahnem z netu návod na obsluhu práčky… pista 54 14.12.2020 18:18	pista 54	14.12.2020 18:18
Jedná sa výhradne o prevod obrázkov s rozpoznanými znakmi fontov na text. Obrázky musíš vyňať, vylú… Nuda 14.12.2020 18:31	Nuda	14.12.2020 18:31
V manuálech obvykle bývá text opravdu jako text a není potřeba to prohánět přes OCR. Wikan 14.12.2020 18:39	Wikan	14.12.2020 18:39
Jestli to něco udělalo nebo ne, poznáš jednoduše. Pokud PDF obsahuje obrázek, nejde označit a zkopír… Jan Fiala 14.12.2020 19:03	Jan Fiala	14.12.2020 19:03
Nechápem takže stiahol som si pdf Podrobný návod na použitie práčky gorenje - 60 strán,čiste náhodne… pista 54 14.12.2020 19:32	pista 54	14.12.2020 19:32
V manuálech obvykle bývá text opravdu jako text a není potřeba to prohánět přes OCR. Wikan 14.12.2020 19:35	Wikan	14.12.2020 19:35
Bol by nejaký typ čo prehnať cez OCR,nejaká stránka?Lebo naozaj nerozumiem tomu.Alebo to necháme tak… pista 54 14.12.2020 20:40	pista 54	14.12.2020 20:40
Pokud je v pdf text jako text, tak s tím nic dělat nemusíš. Pokud je v pdf obrázek textu, OCR rozpoz… snco1301 14.12.2020 21:02	snco1301	14.12.2020 21:02
OCR se používá na naskenované dokumenty. Wikan 14.12.2020 21:16	Wikan	14.12.2020 21:16
Už som na to asi prišiel.Mám tlačiareň,taktiež mám vytlačený nejaký dokument na papiery.Ten som cez… pista 54 14.12.2020 22:20	pista 54	14.12.2020 22:20
človeče, na tieto prevody textov sú hotové SW, digitálne prepojené medzi úložiskami podľa jednotlivý… Nuda 14.12.2020 22:36	Nuda	14.12.2020 22:36
Pokud ten text o Vánocích už máš pomocí OCR převeden z obrázku do vektorů, pak ano. Zvol Editor, vyb… L-Core 15.12.2020 07:37	L-Core	15.12.2020 07:37
Dikens pista 54 15.12.2020 11:07	pista 54	15.12.2020 11:07
Dobrý večer,vid váš obrázok mne to tak vobec nefunguje.S možností vyberiem Editácia obsahu - rozklik… pista 54 15.12.2020 19:40	pista 54	15.12.2020 19:40
Mám nejaké staršie poznámky v zošite to myslíš jako psané rukou? Tak to umí jen některé OCR program… jirka44 16.12.2020 08:01	jirka44	16.12.2020 08:01
OCR je nutný jen na převod bitmapy do textu. Nějaké pdf manuály nejsou kromě fotek bitmapy, tam stač… Karel04 14.12.2020 23:17	Karel04	14.12.2020 23:17
Případně existují i plnohodnotné manuály, https://help.tracker-software.com/ L-Core 15.12.2020 07:48	L-Core	15.12.2020 07:48
Dikens,a čo konkrétne je tá bitmapa,alebo ako to vypadá.Može to byť napr.PDF faktúra Orange?Ďakujem pista 54 15.12.2020 11:09	pista 54	15.12.2020 11:09
Bitmapa je prostě obrázek, třeba fotka nebo scan. Složená z jednotlivých bodů-pixelů. Tu nemůžeš něj… Karel04 15.12.2020 11:30	Karel04	15.12.2020 11:30
ďakujem všetkým za rady pista 54 13.01.2021 19:09	pista 54	13.01.2021 19:09
Je to jednoduché, stačí jenom pochopit, že obrázek "A" je jenom obrázek a počítač si jej neztotožní… poslední jege 13.01.2021 20:25	jege	13.01.2021 20:25

https://cs.m.wikipedia.org/wiki/Optick%C3%A9_rozpozn%C3%A1v%C3%A1n%C3%AD_znak%C5%AF

Neber tieto americké, kapitaľistické pojmy a západné slangové skratky či skomoleniny v "potaz". Však im sľušní, pracovití, boľševikmi dlhoročne prevychovávaní občania, nerozumejú.

OCR prevedie skenovaný text z nejakého formátu, napríklad z obrázku jpg. pdf, gif a spol. do textovej podoby, že si ho môžeš ľubovoľne upravovať, dopisovať, prepisovať, dopĺňať svojim textom pod nastavenými fontami ho volne korigovať priamo v hociktorom textovom editori, napríklad v MS Word a spol.

Napr. moje obľúbené kúzlo, čaro v hornej lište; Abbyy finereader12, pod MS Word.

Hustýýý.

Ďakujem vám za odpovede.Takže rozumiem tomu tak,že si napr. stiahnem z netu návod na obsluhu práčky Whirpool,ktorý má príklad 20 strán.No a sú tam rozne obrázky,cez návody ako sa žmýka,perie odstreďuje,to uvádzam len ako príklad.No a pomocou OCR ho prehodím do napr.Wordu a tam si to už upravujem.Niečo som si stiahol z netu na skúšku - návod na obsluhu práčky gorenje - navolil som OCR že rozpoznať text v skenovaných dokumentoch pomocou OCR,voľačo robilo asi 5 minút,neviem čo a či to niekde uložilo neviem.No asi mi to bude dlhšie trvať kým to pochopím,a ak nepochopím,budem ho používať len ako prehliadač PDF

Jedná sa výhradne o prevod obrázkov s rozpoznanými znakmi fontov na text.

Obrázky musíš vyňať, vylúčiť, eliminovať, lebo sa OCR zblbne aj na Aurel, či budúci najrýchlejší PC roka v diere eštébakov na Sľovesnku si naprdne.

S bežnými free programami takýto prevod nedostihneš.

Lenže samotný zmysel, význam nejakých tutorial spotrebičov stráca logiku pokiaľ nie si korektor, prekladateľ návodov do kodifikovaného jazyka.

Už sa po americky, následne po čínsky, vec sa zíde než dosiahneš veku geronta, budeš drobčiť ako gejša, aby ti maternica nevypadla.

V manuálech obvykle bývá text opravdu jako text a není potřeba to prohánět přes OCR.

Jestli to něco udělalo nebo ne, poznáš jednoduše.
Pokud PDF obsahuje obrázek, nejde označit a zkopírovat text. jestli se OCR povedlo, bude PDF obsahovat i text, ten pak pujde označit a zkopírovat.

Nechápem takže stiahol som si pdf Podrobný návod na použitie práčky gorenje - 60 strán,čiste náhodne.Prvá strana veľký obrázok automatyckej práčky spredu plnenej.2 - 9 strana text,potom znova volajaké obrázky.No a vpohode označím text pod obrázkom a dám skopírovať aj ked nezrobím ocr

V manuálech obvykle bývá text opravdu jako text a není potřeba to prohánět přes OCR.

Bol by nejaký typ čo prehnať cez OCR,nejaká stránka?Lebo naozaj nerozumiem tomu.Alebo to necháme tak a budem PDF exchange editor používať len na prehliadanie PDF a OCR si nebudem všímať,pekný večer

Pokud je v pdf text jako text, tak s tím nic dělat nemusíš.
Pokud je v pdf obrázek textu, OCR rozpozná text na obrázku, takže pak budeš mít text jako text. Většinou po OCR je dobré text projít a opravit chyby.

OCR se používá na naskenované dokumenty.

Už som na to asi prišiel.Mám tlačiareň,taktiež mám vytlačený nejaký dokument na papiery.Ten som cez skener tlačiarne dal do notebooku a následne prehnal cez OCR a čuduj sa svete možem si s tým dokumentom už v OCR robiť čo chcem,napr.digitálne podpísať,zvýrazniť text,kopírovať napr.do word.Len neviem či je možné v tom dokumente aj niečo mazať,myslím keď to už mám v tom OCR.Dajme tomu je tam veta Vianoce sú tu zas......toto chcem zmazať a napísať tam príklad Vianoce sú až o rok.

človeče, na tieto prevody textov sú hotové SW, digitálne prepojené medzi úložiskami podľa jednotlivých formátov s konkrétnymi príponami.

Nač bola tvoja onánia cestou tlačenia dokumentu za použila skeneru? Sú v samotnom OS prednastavené digitálne tlačiarne získaných skenov z úložiska v podobe rôznych formátov do RAM a ich následného uloženia do zložky podľa zvolenej prípony.

Keby si sem dal konkrétny link na stránku s tvojim priblblým prianím, máš to s návodom, použitým SW, prípadne patch, funkčným crackom, ozrejmené.

Pokud ten text o Vánocích už máš pomocí OCR převeden z obrázku do vektorů, pak ano. Zvol Editor, vyber text a můžeš jej začít měnit. Máš přece editor nejen prohlížeč.

[91874-pdf-png]

pdf.png 45.43 KiB

Dikens

Dobrý večer,vid váš obrázok mne to tak vobec nefunguje.S možností vyberiem Editácia obsahu - rozkliknem mám tam je to po anglicky: All Content,Text,Images,Shapes a Edit text a elements as blocks.Potom je tam Selection - rozkliknem - Transformovať výber,Duplicate,Vystrihnúť,Kopírovať,Zmazať,Deselect,Zoom to selection,New stamp from selection,New document from selection,OCR selected region.Mám nejaké staršie poznámky v zošite,ktoré som oskenoval,a na skúšku som tam chcel prepísať text napr.V meste to zmazať a napísať V dedine.Mam v Editácii obsahu zaškrtnuté Text,orámujem to ako je to na vašom obrázku,no a mne to V meste rovno píše V dedine,proste to prekrije,dokument uložím,výsledok nečítatelné.

Mám nejaké staršie poznámky v zošite

to myslíš jako psané rukou? Tak to umí jen některé OCR programy a ještě blbě (a češtinu/slovenštinu možná neumí číst žádný).

OCR je nutný jen na převod bitmapy do textu. Nějaké pdf manuály nejsou kromě fotek bitmapy, tam stačí potřebný text nebo odstavce označit a překopírovat třeba do Wordu.
A na ten program je taky manuál, netřeba postupy luštit z Youtube.
https://www.pdfxchange.cz/user/documents/verze/editor_manual_V8.pdf

Případně existují i plnohodnotné manuály, https://help.tracker-software.com/

Dikens,a čo konkrétne je tá bitmapa,alebo ako to vypadá.Može to byť napr.PDF faktúra Orange?Ďakujem

Bitmapa je prostě obrázek, třeba fotka nebo scan. Složená z jednotlivých bodů-pixelů. Tu nemůžeš nějak třeba přepisovat nebo vnitřně upravovat.
https://www.google.com/search?client=firefox-b-d&q=bitmapa
Faktury a jiné dokumenty jsou vektory, tam lze přepisovat text, upravovat a měnit i části, jako třeba ve Wordu fonty písma, velikost, barvu, mezery apod.
Ale i v těchto dokumentech můžeš vložit bitmapy- obrázek, graf apod. a pak to vše uložit jako jeden soubor.
A OCR je na převod textu viditelného v bitmapách na vektory, které si můžeš pak upravit jak chceš.
Jednoduše: když máš uložený text, můžeš si s ním v počítači dělat co chceš a pak třeba vytisknout. Když ho ale pak ofotíš, je ta fotka už bitmapa a upravit v ní text nejde. Kromě gumování, výřezů apod.triků. OCR program to převede zpět na text, který můžeš opět editovat. Co přečte blbě, musíš opravit ručně.

ďakujem všetkým za rady

Je to jednoduché, stačí jenom pochopit, že obrázek "A" je jenom obrázek a počítač si jej neztotožní s písmenem A. Ovšem v dnešní době už jsou rozpoznávací algoritmy na takové úrovni, že obrázek "A"
ve standardním fontu umí rozeznat a ztotožnit s písmenem A. Čím je font standardnější, tím je takové rozpoznání jednodušší, rychlejší a přesnější. U nestandardních fontů a ručně psaného písma rychlost a úspěšnost rozpoznávání rapidně klesá. Stejně tak funguje i rozpoznávání registračních značek aut u mýtných brán, vah a měření rychlosti.

U PDF je to složitější, daný formát se používá pro publikování a může obsahovat jak text, tak i obrázky. Text se dá běžně kopírovat, pokud to není zakázáno autorem při generování PDF dokumentu, ale často je i text vložený jako obrázek, takže jej kopírovat nejde, byť je to PDF. Je to vlastně grafika v PDF obálce. Často takto fungují jednodušší generátory PDF, které celou stránku dokumentu interně "oskenují" a daný obrázek zabalí do PDF obálky, takže byť je původní dokument v textové podobě a výsledek v PDF, meziprodukt je grafika a text z takového PDF již nelze zkopírovat, ale max. jenom rozpoznat OCR programem.

Zpět do poradny Odpovědět na původní otázku Nahoru