
Lze zachránit vybledlý text?
Dobrý den,
Podařilo se mně najít jedny hodně staré papíry, které bych potřeboval naskenovat a někomu poslat. Bohužel za ty roky je to extrémně špatně čitelné a kopírka to moc nezachránila.
Lze to, prosím Vás, nějak opravit? Klidně si doinstaluji nějaký dodatečný software, ale nic placeného použít nechci.
Nebo to lze vyřešit nějakým programovacím jazykem případně AI?
Moc děkuji
PS. PDF sem dát nemůžu, ale jen pro představu, jak je text asi špatný (takhle je většina, ale část je bohužel ještě horší)
Čitelnost se dá vylepšit v jakýmkoliv grafickém editoru vhodným nastavením jas/kontrast/gama, ale zázraky se čekat nedají.
Tři kliknutí v Irfanview:
Super, ale fotky jsem nikdy neupravoval, tak popravdě vůbec nevím, jaké je ideální nastavení?
Ideální nastavení je takové, při kterém se ti bude libit výsledek.
Nedají se určit nějaké konkrétní univerzální hodnoty. Když "šoupeš" s posuvníkem jasu/kontastu, tak hned vidíš, co to dělá s obrázkem a vybereš si nejlepší výsledek vzhledem k čitelnosti.
Nebo klidněš zkus i tu AI - předhoď jí obrázek a poruč si "vylepší čitelnost textu"....
Zkoušel jsem IrfanView - Pro dostatečnou čitelnost stačí pouze snížit Gamma correction.
Bohužel pro text, který je téměř nečitelný, to nepomůže. Když ho snížím na takovou hodnotu, aby byl text vůbec vidět, tak to vypadá hrozně.
Ty první dvě si lze domyslet, ale to třetí vůbec netuším.
No tak v první řadě je nutné předlohu kvalitně naskenovat.
Na obrázku 90×47 px není nic vidět ani nejde rozumně upravit.
Pokud je text vybledlý úplně, tak logicky snížením gamy se zázračně neobjeví.
Takové kdy to pak jde lépe přečíst... Zkusil by to prohnat AI.
Zkusil jsem Chatgpt a nic moc. Možná neumím správně rozkazovat nebo by to chtělo zkusit jinou AI.
AI jsou už zkoušel. A to má bohužel jeden zásadní problém - české znaky. Možná je to líp čitelné, ale s diakritikou (primárně háčky) si často vůbec nerozumí a buď to vykreslí špatně nebo to zamění za úplně jiné písmeno.
Tys použil AI pro převod na text (OCR) nebo co?
Když jde o zlepšení čitelnosti obrázku (grafického textu), tak české znaky na to nemají vliv. Je to bitmapová grafika, ne textový soubor a jednotlivými znaky.
No tak přesně takhle to ale v AI nefunguje. Ta generuje každý obrázek znovu a diakritika dělá problém. Nejnovější NanoBanana od Google už je na tom docela dobře.
Když jde o zlepšení kontrastu, tak je přece jedno, jestli je v obrázku diakritika nebo ne? Pracuje se s bitmapou, nepotřebuju rozpoznávat text.
Jasně, to jo. Jen když se to dává na vylepšení do AI chatbota (ChatGPT, Gemini...), tak to přepracuje jako nový obrázek a generuje to znovu. A tam už roli diakritika hraje. :)
Mimo AI v editoru je to samozřejmě jako píšeš.
Nějak se mi to nezdá. Můžeš dát příklad nějakého obrázku, kde má AI problém s diakritikou při vylepšení čitelnosti? Zkusil bych to.
Ano, nový obrázek. A v obrázku přece diskritika nehraje žádnou roli.
Jenže v těch ukázkách nejde o obrázek ...
Je to "obrázek" textu, vygenerovaného jako "rozpoznání" textu na původním obrázku. A přitom diakritika roli hraje
Nějak se v tom začínám ztrácet.
PNG je přece obrázek, ne?
Je to vygenerovaný .png obrázek, simulující (rozpoznaný) text
v podobě dle zadání pro AI.
Není to v žádném případě upravený původní obrázek !!! Pouhým pohledem (na ty ďubky) je to jasné
A o kterém obrázku teď mluvíš?
O těch 2 krásných ukázkách z AI přece (png a jpg) ... a o tom původním. Alespoň jsem předpokládal, že je řeč o tomhle v souvislosti s diakritikou.
Tak to jsme se nepochopili.
Ani jeden nemáme znalosti, abychom věděli, jak to přesně funguje pod pokličkou. Já jen mám reálné zkušenosti, když se modely vyvíjely (používám to od prvních verzí Midjourney) a diakritika VŽDYCKY dělala problémy.
On dělal problémy obecně text, protože generátor obrázků vůbec nic jako text neznal. Pozdější modely už fungovaly relativně dobře, ale zase byly nějak naučeny na text bez diakritiky.
Až poslední modely zvládají i český text s diakritikou.
Tohle udelala Gemini pomocí NanoBanana 2
Prompt:
Na obrázku je vybledlý český text. Zvládneš jej vylepšit, aby byl čitelný? Pouze zvyrazni, zachovej vzhled termotisku.
To je vážně z toho originálu? To je pecka!
To už nemá s originálem nic společného. Je to nově vygenerovaný text (obrázek). Mně taky Chatgpt nabídl text z toho obrázku (OCR), to si pak můžu zkopírovat třeba do Wordu a budu to mít ostré a čitelné....
ChatGPT udělá skoro totéž, s parametrem "rekonstrukce".
Dost často s minimem úsilí irfanwiev když se dá image/auto-adjust colors občas udělá zázraky (vzkřísí i vybledlou termoúčtenku, což vypadá daleko hůř). A jinak si pohrát s jasem a kontrastem a vůbec těmi hejblátky (ještě je tam gama, akorát na vyvážení barev bych nešahal, ale spíš kdyžtak použil separované barevné kanály). Většinou bylo potřeba přidat kontrast, ubrat jas a gama. Dost jsem tyhle úpravy dělal na vysoké s obrázky z osciloskopu. On čerstvý výtisk z jehličkovky nevypadá o moc lépe (zvlášť když se v ní barvicí páska používá do roztrhání). Pak někdo někde sehnal aplikaci na přenos do počítače a tohle přestalo bejt potřeba (taky novější osciloskopy měly slot na disketu).
este by som skusil gogle lens, ze by si to nescanoval v scanneri, ale skusis to telefonom
No určitě bych zkusil při skenování nastavit ručně expozici (směrem dolů, ať je to celkově tmavší). Nebo to "fotit" místo skenu, tam se to dá snáze/operativněji nastavit.