Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailem excel - automatizovane vkladani pdf

ahoj vsem,

rad bych se poradil, jak udelat nasledujici.

mam slozku s nekolika desitkami souboru ve formatu pdf. potrebuji je v excelu. kazdy mesic se soubory pdf meni a ja je vzdy potrebuji do excelu, kde s nima dale pracuji. dosud to delam tak, ze kazdy mesic otevru tolik pdf souboru, kolik je kalendarnich dni, vyberu vse, vyberu kopirovat a vyberu vlozit. verim, ze by to urcite slo nejak automatizovane, jen, ja to neumim. muzete mi s tim, prosim, pomoci? zkusil jsem chat gpt, ale on je programator a ja nevim, co delam, kdyz opakuju jeho kroky. kazdopadne, cilem je, aby vsechny soubory ve slozce se nakopirovali do jednoho jedineho souboru a i listu v excelu tak, jak jsou v pdf a aby se nakopirovali pod sebe. to znamena kazdy dalsi soubor se kopiruje pod predchozi den. v idealnim pripade by ve sloupci A byl nazev vkladaneho souboru a to ve vsech radcich, ktere se ze souboru vkladaji. resp., jde mi o to, abych u vlozenych dat ze souboru mel datum dne, ktery se vlozil. proto je nazev souboru v dane slozce ve formatu RRRR-MM-DD.

dekuji moc za pomoc

Předmět Autor Datum
To opravdu potřebuješ desítky *pdf narvat do jednoho listu Excelu? Respektive to v Excelu jednoznačn…
L-Core 20.12.2024 10:09
L-Core
samozrejme data z tech pdf souboru, nikoli soubory pdf jako takove.
mayerrs 20.12.2024 10:26
mayerrs
AI ti nepomůže, dokud jasně neřekneš, co vlastně chceš (a příp. proč). A rádci nejspíš taky ne.
dsa 20.12.2024 10:28
dsa
chci, aby se data z *pdf souboru, ktere jsou v dane slozce, automatizovane vlozila do jednoho jedine…
mayerrs 20.12.2024 10:40
mayerrs
Je to pěkná divočina... První otázka mě napadá, proč jsou zdrojová data v PDF? Lepší by byl např. f…
host 20.12.2024 11:01
host
pracuji jen s tim co mam, a to je bohuzel *pdf. taky by me to bavilo vic s jinym formatem, idealne r…
mayerrs 20.12.2024 11:16
mayerrs
OK, ty to musíš vědět nejlíp, jestli nelze data získat v jiném formátu. Někdy se jen stačí domluvit…
host 20.12.2024 11:32
host
No a tohle už bych předhodil vhodné AI :-) Já EXCEL zrovna neovládám, takže bych si to předzpracova…
dsa 20.12.2024 12:53
dsa
Tohle bych viděl na použití doplňku PowerQuery, ale neumím s ním moc zacházet, tak doporučuji zeptat…
Zdenál 20.12.2024 11:30
Zdenál
jak jsem dohedal, jeste s tim souvisi jina vec. mozna je na novou otazku, ale ponecham to zde. v exc…
mayerrs 20.12.2024 12:55
mayerrs
Tak můžeš zkusit verzi 4.5 nainstalovat, tím nic nezkazíš. Nainstalované verze .NET zjistíš pomocí…
host 20.12.2024 13:03
host
ne, podpora otevírání PDF je od určité verze Office.
touchwood 20.12.2024 14:39
touchwood
Ten *.pdf súbor obsahuje riadky a stĺpce ako tabuľka ??? Alebo je to len čistý text? Bolo vhodné sem…
pme 20.12.2024 16:15
pme
Chápem, že Ctrl+C v pdf a následne Ctrl+V v exceli - každý mesiac, to bude asi otrava... Může to st…
L-Core 20.12.2024 16:22
L-Core
Ak má tých súborov 30 /podľa počtu dní v mesiaci/, mňa by to asi tiež nebavilo...ak by som to naozaj…
pme 20.12.2024 16:32
pme
je to gulas textu a jakoby tabulek. tim jakoby tabulek myslim to, je v kazdem souboru ruzny pocet ta…
mayerrs 20.12.2024 17:02
mayerrs
Ja to chápem...žiadna sranda...:-) čiže stĺpcov je v pdf osem a všetkých osem "stĺpcov" potrebuješ…
pme 20.12.2024 17:18
pme
no, ono jak je to v pdf, tak je to oddeleno nepravidelnym poctem mezer:-) a jsou v tom nepravidelne…
mayerrs 20.12.2024 17:51
mayerrs
Keď je to nepravidelné, zahlavi, zapati... a je v tom guláš, potom to chceš ako automatizovať? ::) J…
pme 20.12.2024 18:04
pme
no, slo mi o automatizovane kopirovani dat z vice souboru bez ohledu na obsah. nicmene, z hlediska G…
mayerrs 20.12.2024 18:08
mayerrs
Samozrejme cez ss - ak sa jedná o dôverné data. Poši mi to do správy, ja sa Ti ozvem.
pme 20.12.2024 18:12
pme
Možná by mohl použít na odstranění některých částí program, který to samé zvládne odstranit napříč v…
Jako 21.12.2024 08:41
Jako
Ono by to fakt chtělo zkusit dodavatele těchto takto zpracovaných dat přinutit, aby to dodával nějak…
L-Core 20.12.2024 18:39
L-Core
popravde receno, tahle varianta uz byla, uz jsem za ni:-) vic v dohledne dobe necekam, ani v te nedo…
mayerrs 20.12.2024 19:18
mayerrs
a když to PDF otevřeš ve Wordu (pokud máš dostatečně nový Office), je to použitelné? Pak by to mělo…
touchwood 20.12.2024 19:25
touchwood
mam office 2016, word to otevre. bohuzel, ale ty zdrojove soubory jsou fakt jedna velka mizerie, pro…
mayerrs 20.12.2024 19:47
mayerrs
ale právě to ctrl+A - C -V můžeš velmi jednoduše zautomatizovat...
touchwood 20.12.2024 19:50
touchwood
akorat nevim jak
mayerrs 20.12.2024 20:41
mayerrs
Doporučuju zaznamenat makro a pak se kouknout na kód a případně jemně upravit...
touchwood 21.12.2024 07:13
touchwood
Rezignovat, to je špatné. Pokud oni chtějí něco po mě, tak ať mi dodají zdrojová data ve standardněj… poslední
Jako 21.12.2024 08:44
Jako
Souhlasím s pány: L-Core Moderátor 20.12.2024 18:39 https://pc.poradna.net/questions/3280911-excel-a…
Jako 21.12.2024 08:30
Jako

To opravdu potřebuješ desítky *pdf narvat do jednoho listu Excelu? Respektive to v Excelu jednoznačně potřebuješ? Ty pracuješ s *pdf uvnitř Excelu?
Vždyť je to zvěrstvo; Excel na tohle ani náhodou není určen.

Nebo chceš kopírovat jen data z *pdf?

Asi bys měl přiložit nějaký vzorek; z tvého popisu není moc jasné, co a jak přesně chceš.
Já ti s tím ale asi pomoci nedokážu…

chci, aby se data z *pdf souboru, ktere jsou v dane slozce, automatizovane vlozila do jednoho jedineho listu souboru excel. aby zacatek vkladani dat z prvniho soubotu byl v bunce B1. aby ve sloupci A v kazdem radku byl nazev souboru. to znamena, jestli je v prvnim souboru, ktery se jmenuje 2024-12-12, a ma 215 radku, budou data vlozena do B1 az B215. v A1 az A215 bude 2024-12-12. data z druheho souboru, ktrery se jmenuje 2024-12-13 a ma 156 radek, se analogicky vlozi do B216 az B371 a v A216 az A371 bude 2024-12-13. a tak dale se vemi daty vsech souboru v danem adresari. v adresari je kazdy mesic tolik souboru, kolik je kalendarnich dni, tedy 2024-12-01 az 2024-12-31.

No a tohle už bych předhodil vhodné AI :-)

Já EXCEL zrovna neovládám, takže bych si to předzpracoval (třeba .vbs skriptem), a udělal nějaký texťák či .csv soubor, který by byl pro EXCEL stravitelnější. Ale chce to prostě nějaké to programování (i kdyby se to dělalo nějakým makrem přímo v EXCELu).

jak jsem dohedal, jeste s tim souvisi jina vec. mozna je na novou otazku, ale ponecham to zde. v excelu je moznost ZÍSKAT DATA Z.. jsou verze, kde je Z PDF. ja tuhle moznost v excelu nemam. dohledal jsem, ze to souvisi s .NETframework. vyzaduje to 4.5 a vyssi. ja mam v pocitaci 4.8. muze to souviset?

tuto informaci mam odsud:

https://techcommunity.microsoft.com/discussions/excelgeneral/excel-2016-get-data-from-pdf-missing/1627037

je to gulas textu a jakoby tabulek. tim jakoby tabulek myslim to, je v kazdem souboru ruzny pocet tabulek s ruznym poctem radku. sloupcu je vzdy 8, z nichz jeden je vetsinou prazdny:

zkusim sem vepsat vzor: nejdriv je nejaky sahodlouhy zbytecny text, pak nasleduji tabulky zahlavi tabulek oznacim pismeny A B C D E F G H, data pod zahlavim nejaka (ctvrty sloupec je vetsinou prazdny, data oddelim mezerou. ve skutecnosti je tam spousta mista (je to proste PDF

qphqfhqidnqhn nxdoiqd xqdnqd pqocq q pqxmqiq
qpopqx qouqxuen§iunqxeu

qxeqpe

tabulka 1
A B C D E F G H I J
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200

tabulka 2
A B C D E F G H I J
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200

zhruba takhle nejak to vypada. kdyz to nakopiruju do excelu, rucne si dam text do sloupcu a pak se s tim da pracovat.

no, ono jak je to v pdf, tak je to oddeleno nepravidelnym poctem mezer:-) a jsou v tom nepravidelne texty, nazvy tabulek, zahlavi, zapati. proste gulas. pointa je, ze kdyz si to nakopiruju do excelu, uz s tim dokazu pracovat. takze jde skutecne jen o tu automatizaci vlozeni dat. ikdyz by stacilo vlozit jen ta data z tech osmy sloupcu, text je zbytecny a excel akorat hizdi:-)

Možná by mohl použít na odstranění některých částí program, který to samé zvládne odstranit napříč všemi PDF. Může tak odstranit např. vodoznak, logo které je na stejném místě a pravděpodobně i to záhlaví a zápatí dokumentu. Holt by musel tá PDF nejprve předpřipravit pro další a snad už automatické zpracování.

mam office 2016, word to otevre. bohuzel, ale ty zdrojove soubory jsou fakt jedna velka mizerie, protoze nektere otevre celkem dobre, jine otevre tak ze cast tabulek je jako tabulka a da se s ni pracovat a cast tabulek otevre jako obrazek. netusim, jak ty soubory vznikaji, ale dosude se mi skutecne osvedcilo jen rucni kopirovani. ctrl A, ctrl C, ctrl V. a 30x v mesici:-)

Rezignovat, to je špatné.
Pokud oni chtějí něco po mě, tak ať mi dodají zdrojová data ve standardnějších a použitenějších formátech.

Pokud oni po mě nic nechtějí a chci něco jen já, tak by mohli být ochotnější ke zpracovateli se zrakovým omezením. Většinou se těmto lidem nehází klacky pod nohy.

Souhlasím s pány:
L-Core Moderátor 20.12.2024 18:39 https://pc.poradna.net/questions/3280911-excel-automatizovane-vkladani-pdf#r3280985
touchwood Administrátor 20.12.2024 19:50 https://pc.poradna.net/questions/3280911-excel-automatizovane-vkladani-pdf#r3280990

Když se vžiju do situace při zadání dotazu, tak je nutné prioritně žádat poskytovatele zdrojových dat o "editovatelnu formu dat". To je priorita a tím směrem musí být vynakládána maximální snaha v komunikaci s poskytovatelem.

K tomu bych se snažil seznámit a naučit pracovat s placeným programem ABBYY FineReader. Je nejepší z dostupných. Zvládne dostat data z PDF a je šance, že se je podaří dostat do podoby editovatelné v MS Word a MS Excel. Má smysl se s tím seznámit a získat alespoň základní dovednosti převodu. Výstupem bude "věrná kopie" PDF, kterou bude možné následně zpracovat v MS Office pro požadovaný záměr.
Texty bude možné dostat do TXT formátu, do DOC-DOCX, tabulky do XLS-XLSX, nebo data z tabulek do CSV formátu.

Pokud je možné poskytnout na ukázku některá PDF, aby bylo patrné co vše obsahují a zkusit to prakticky realizovat, jsem ochotný se pokusit o výše uvedený postup a data vytěžená z PDF poskytnout k dalším pokusům.

Případně stačí zdrojová PDF nahrát na uschovna.cz a sem dát odkaz.

Přeji ať se to podaří a hlavně, směřovat své úsilí správným směrem. Hlavně si na začátku uvědomit zátěž v podobě četnosti úkonů a objemu dat, protože na začátku nemusí být zřejmé, že to bude manuální otročina. Automatizace zpracování dat je zvládnutí na vyšší úrovni a někdy až mistrovství.

Zpět do poradny Odpovědět na původní otázku Nahoru