excel - automatizovane vkladani pdf
ahoj vsem,
rad bych se poradil, jak udelat nasledujici.
mam slozku s nekolika desitkami souboru ve formatu pdf. potrebuji je v excelu. kazdy mesic se soubory pdf meni a ja je vzdy potrebuji do excelu, kde s nima dale pracuji. dosud to delam tak, ze kazdy mesic otevru tolik pdf souboru, kolik je kalendarnich dni, vyberu vse, vyberu kopirovat a vyberu vlozit. verim, ze by to urcite slo nejak automatizovane, jen, ja to neumim. muzete mi s tim, prosim, pomoci? zkusil jsem chat gpt, ale on je programator a ja nevim, co delam, kdyz opakuju jeho kroky. kazdopadne, cilem je, aby vsechny soubory ve slozce se nakopirovali do jednoho jedineho souboru a i listu v excelu tak, jak jsou v pdf a aby se nakopirovali pod sebe. to znamena kazdy dalsi soubor se kopiruje pod predchozi den. v idealnim pripade by ve sloupci A byl nazev vkladaneho souboru a to ve vsech radcich, ktere se ze souboru vkladaji. resp., jde mi o to, abych u vlozenych dat ze souboru mel datum dne, ktery se vlozil. proto je nazev souboru v dane slozce ve formatu RRRR-MM-DD.
dekuji moc za pomoc
To opravdu potřebuješ desítky *pdf narvat do jednoho listu Excelu? Respektive to v Excelu jednoznačně potřebuješ? Ty pracuješ s *pdf uvnitř Excelu?
Vždyť je to zvěrstvo; Excel na tohle ani náhodou není určen.
Nebo chceš kopírovat jen data z *pdf?
Asi bys měl přiložit nějaký vzorek; z tvého popisu není moc jasné, co a jak přesně chceš.
Já ti s tím ale asi pomoci nedokážu…
samozrejme data z tech pdf souboru, nikoli soubory pdf jako takove.
AI ti nepomůže, dokud jasně neřekneš, co vlastně chceš (a příp. proč). A rádci nejspíš taky ne.
chci, aby se data z *pdf souboru, ktere jsou v dane slozce, automatizovane vlozila do jednoho jedineho listu souboru excel. aby zacatek vkladani dat z prvniho soubotu byl v bunce B1. aby ve sloupci A v kazdem radku byl nazev souboru. to znamena, jestli je v prvnim souboru, ktery se jmenuje 2024-12-12, a ma 215 radku, budou data vlozena do B1 az B215. v A1 az A215 bude 2024-12-12. data z druheho souboru, ktrery se jmenuje 2024-12-13 a ma 156 radek, se analogicky vlozi do B216 az B371 a v A216 az A371 bude 2024-12-13. a tak dale se vemi daty vsech souboru v danem adresari. v adresari je kazdy mesic tolik souboru, kolik je kalendarnich dni, tedy 2024-12-01 az 2024-12-31.
Je to pěkná divočina...
První otázka mě napadá, proč jsou zdrojová data v PDF? Lepší by byl např. formát CSV, s kterým se dá lépe pracovat a autopmatizovat.
Jinak možná by ti pomohl program AutoIt, ale nebude to hotové za deset minut....
pracuji jen s tim co mam, a to je bohuzel *pdf. taky by me to bavilo vic s jinym formatem, idealne rovnou v excelu, ale nemam ani CSV, jena a pouze *pdf
OK, ty to musíš vědět nejlíp, jestli nelze data získat v jiném formátu. Někdy se jen stačí domluvit s odesílatelem nebo požádat autora programu, aby doplnil export. Ale to asi není tenhle případ....
No a tohle už bych předhodil vhodné AI
Já EXCEL zrovna neovládám, takže bych si to předzpracoval (třeba .vbs skriptem), a udělal nějaký texťák či .csv soubor, který by byl pro EXCEL stravitelnější. Ale chce to prostě nějaké to programování (i kdyby se to dělalo nějakým makrem přímo v EXCELu).
Tohle bych viděl na použití doplňku PowerQuery, ale neumím s ním moc zacházet, tak doporučuji zeptat se na https://wall.cz/ms-excel-diskuse.
Ale předem si připrav nějakou ukázku, jak vypadají zdrojové soubory a jak se to má poskládat do toho cílového Excelu.
jak jsem dohedal, jeste s tim souvisi jina vec. mozna je na novou otazku, ale ponecham to zde. v excelu je moznost ZÍSKAT DATA Z.. jsou verze, kde je Z PDF. ja tuhle moznost v excelu nemam. dohledal jsem, ze to souvisi s .NETframework. vyzaduje to 4.5 a vyssi. ja mam v pocitaci 4.8. muze to souviset?
tuto informaci mam odsud:
https://techcommunity.microsoft.com/discussions/excelgeneral/excel-2016-get-data-from-pdf-missing/1627037
Tak můžeš zkusit verzi 4.5 nainstalovat, tím nic nezkazíš.
Nainstalované verze .NET zjistíš pomocí Win+R [Enter], cmd [Enter] a příkaz
ne, podpora otevírání PDF je od určité verze Office.
Ten *.pdf súbor obsahuje riadky a stĺpce ako tabuľka ??? Alebo je to len čistý text?
Bolo vhodné sem dať vzorové data...
Chápem, že Ctrl+C v pdf a následne Ctrl+V v exceli - každý mesiac, to bude asi otrava...
Může to střídat s Ctrl+Ins a Shift+Ins Osobně nic jiného už více jak 30 let na kopírování/vkládání nepoužívám.
Ak má tých súborov 30 /podľa počtu dní v mesiaci/, mňa by to asi tiež nebavilo...ak by som to naozaj potreboval, naprogramoval by som si na to vlastnú utilitu...
je to gulas textu a jakoby tabulek. tim jakoby tabulek myslim to, je v kazdem souboru ruzny pocet tabulek s ruznym poctem radku. sloupcu je vzdy 8, z nichz jeden je vetsinou prazdny:
zkusim sem vepsat vzor: nejdriv je nejaky sahodlouhy zbytecny text, pak nasleduji tabulky zahlavi tabulek oznacim pismeny A B C D E F G H, data pod zahlavim nejaka (ctvrty sloupec je vetsinou prazdny, data oddelim mezerou. ve skutecnosti je tam spousta mista (je to proste PDF
qphqfhqidnqhn nxdoiqd xqdnqd pqocq q pqxmqiq
qpopqx qouqxuen§iunqxeu
qxeqpe
tabulka 1
A B C D E F G H I J
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
tabulka 2
A B C D E F G H I J
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
8:50 45-12 335663 SOUTH 25 eer 450005 200
zhruba takhle nejak to vypada. kdyz to nakopiruju do excelu, rucne si dam text do sloupcu a pak se s tim da pracovat.
Ja to chápem...žiadna sranda...
čiže stĺpcov je v pdf osem a všetkých osem "stĺpcov" potrebuješ dostať do excelu ako samotných osem stĺpcov?
tie stĺpce ako vidím sú oddelené asi medzerou?
daj sem ozajstný pdf súbor, nech to vidím "naostro"...
no, ono jak je to v pdf, tak je to oddeleno nepravidelnym poctem mezer a jsou v tom nepravidelne texty, nazvy tabulek, zahlavi, zapati. proste gulas. pointa je, ze kdyz si to nakopiruju do excelu, uz s tim dokazu pracovat. takze jde skutecne jen o tu automatizaci vlozeni dat. ikdyz by stacilo vlozit jen ta data z tech osmy sloupcu, text je zbytecny a excel akorat hizdi
Keď je to nepravidelné, zahlavi, zapati... a je v tom guláš, potom to chceš ako automatizovať?
Je problém sem dať pdf súbor? bojíš sa o data?
Asi zbytočne strácam čas...
no, slo mi o automatizovane kopirovani dat z vice souboru bez ohledu na obsah. nicmene, z hlediska GDPR si neroufnu ten soubor uplne zverejnit. muzem na to kouknout pres soukrome zpravy?
Samozrejme cez ss - ak sa jedná o dôverné data. Poši mi to do správy, ja sa Ti ozvem.
Možná by mohl použít na odstranění některých částí program, který to samé zvládne odstranit napříč všemi PDF. Může tak odstranit např. vodoznak, logo které je na stejném místě a pravděpodobně i to záhlaví a zápatí dokumentu. Holt by musel tá PDF nejprve předpřipravit pro další a snad už automatické zpracování.
Ono by to fakt chtělo zkusit dodavatele těchto takto zpracovaných dat přinutit, aby to dodával nějak rozumně. I když, dokážu si představit ještě horší variantu - mohli to *pdf vytisknout a naskenovat jako *png.
popravde receno, tahle varianta uz byla, uz jsem za ni vic v dohledne dobe necekam, ani v te nedohledne
a když to PDF otevřeš ve Wordu (pokud máš dostatečně nový Office), je to použitelné?
Pak by to mělo jít docela dobře pomocí VBA vyzobat a alespoň částečně zautomatizovat.
mam office 2016, word to otevre. bohuzel, ale ty zdrojove soubory jsou fakt jedna velka mizerie, protoze nektere otevre celkem dobre, jine otevre tak ze cast tabulek je jako tabulka a da se s ni pracovat a cast tabulek otevre jako obrazek. netusim, jak ty soubory vznikaji, ale dosude se mi skutecne osvedcilo jen rucni kopirovani. ctrl A, ctrl C, ctrl V. a 30x v mesici
ale právě to ctrl+A - C -V můžeš velmi jednoduše zautomatizovat...
akorat nevim jak
Doporučuju zaznamenat makro a pak se kouknout na kód a případně jemně upravit...
Rezignovat, to je špatné.
Pokud oni chtějí něco po mě, tak ať mi dodají zdrojová data ve standardnějších a použitenějších formátech.
Pokud oni po mě nic nechtějí a chci něco jen já, tak by mohli být ochotnější ke zpracovateli se zrakovým omezením. Většinou se těmto lidem nehází klacky pod nohy.
Souhlasím s pány:
L-Core Moderátor 20.12.2024 18:39 https://pc.poradna.net/questions/3280911-excel-automatizovane-vkladani-pdf#r3280985
touchwood Administrátor 20.12.2024 19:50 https://pc.poradna.net/questions/3280911-excel-automatizovane-vkladani-pdf#r3280990
Když se vžiju do situace při zadání dotazu, tak je nutné prioritně žádat poskytovatele zdrojových dat o "editovatelnu formu dat". To je priorita a tím směrem musí být vynakládána maximální snaha v komunikaci s poskytovatelem.
K tomu bych se snažil seznámit a naučit pracovat s placeným programem ABBYY FineReader. Je nejepší z dostupných. Zvládne dostat data z PDF a je šance, že se je podaří dostat do podoby editovatelné v MS Word a MS Excel. Má smysl se s tím seznámit a získat alespoň základní dovednosti převodu. Výstupem bude "věrná kopie" PDF, kterou bude možné následně zpracovat v MS Office pro požadovaný záměr.
Texty bude možné dostat do TXT formátu, do DOC-DOCX, tabulky do XLS-XLSX, nebo data z tabulek do CSV formátu.
Pokud je možné poskytnout na ukázku některá PDF, aby bylo patrné co vše obsahují a zkusit to prakticky realizovat, jsem ochotný se pokusit o výše uvedený postup a data vytěžená z PDF poskytnout k dalším pokusům.
Případně stačí zdrojová PDF nahrát na uschovna.cz a sem dát odkaz.
Přeji ať se to podaří a hlavně, směřovat své úsilí správným směrem. Hlavně si na začátku uvědomit zátěž v podobě četnosti úkonů a objemu dat, protože na začátku nemusí být zřejmé, že to bude manuální otročina. Automatizace zpracování dat je zvládnutí na vyšší úrovni a někdy až mistrovství.