Jak zjistit link na podřízené www stránky, na něž nevede link z hlavní strany?
Ahoj, můžete mi prosím poradit?
Na některých odborných serverech, kam často chodím, udělali jakousi reorganizaci webových stránek. Stalo se tak, že na předchozí a dosud existující webové stránky s cennými staršími informacemi nevede link z hlavní strany ani z dalších přístupných stránek. Můžete mi poradit nějaký příkaz či utilitku, jak bych zjistila strukturu přístupných informací na nějaké website?
Příklad - firemní web firmy ABC (odkazy jsou smyšlené):
Hlavní strana index.htm
dále jsou strany strana1.htm až strana9.htm
Tyto všechny stránky jsou provázány odkazy a dá se na ně normálně dostat "klikáním"
Na serveru firmy jsou ale uložené i dřívejší verze stránek s důležitými informacemi dejme tomu info.htm a old.htm
Když vím adresy těchto "schovaných" stránek a zadám je do adresního řádku, tak se mi normálně zobrazí - nejsou tedy nijak skryté před veřejností. Jenže když nevím přesný link, tak na ně nenatrefím nebo jen náhodně.
Můžete mi prosím poradit, jak zjistit existenci a link pro ty "schované" stránky? Nějaká obdoba příkazu DIR ve starém dobrém MS DOSu nebo tak něco... Děkuju předem
no moznosti je viac. jedna z nich je ta, co spominal AZOR pomocou google index, druha staci dat v FF prave tlacitko a zvolit page info a zvolit zalozku links a tretia niekym viac a niekym menej pouzivana moznost je robots.txt alebo robots.txt
Jenže tak se mi zobrazí jen stránky, na něž VEDOU odkazy. A já jsem potřebovala najít stránky, na něž linky nevedou.
To ale na všech stránkách taky nefunguje, jak jsem vyzkoušela.
Takže zůstanu u toho softíku Offline Explorer Enterprise - fakt vynikající! Ještě jednou děkuju Jirkovi1 za odkaz. Jsem jen zvědavá, jak se bude chovat po 30 dnech - jestli bude jen upozorňovat, ale bude ho možno používat, nebo jestli nebude chodit vůbec Ale 400 USD je fakt moc
Pro zájemce uvádím link
http://www.metaproducts.com/mp/Offline_Explorer_Ent erprise.htm
Offline Explorer ti takisto podla mna neda stranky, ktore nie su nezname. pokial nie je povoleny v apache directory listing, tak neviem odkial by sa mohol o tych strankach dozvediet, pokial nebudu vlozene priamo v stranke. tak schvalne, ktoru stranku ti nasiel, ktoru nenajdes mnou popisanym sposobom? jedine co ti moze povedat, ake vsetky povolene linky existuju na abc.cz a roznych podadresaroch. tu uznavam, ze to ulahci pracu, aj ked sa to da manualne urobit aj tym mojim sposobom.
robots? Tam nic zajímavého nenajde.Většinou tam je, to co je pro vyhledávače nedostupné a nebo pak hvězdičky, pro indexaci všeho. Jedinej zajimavej robots.txt je na robots.txt - co všechno WH blokuje .
Když už tak spíš sitemap.xml - tedy seznam stránek pro google v XML, ale málokdo to používá.
jasne ze robots.txt, vsak uz to dnes nikto nerobi cez meta a kde konci google s site:nieco.xyz, tam nastupuje robots.txt. napr. tu: http://209.85.135.104/search?q=cache:OdvaE1KKNW0J:w ww.zive.cz/robots.txt+robots.txt+site:zive.cz&hl=en &ct=clnk&cd=4