OT: Hledám nějaký soubor dat s normalním rozdělením.
Zdravím,
musím udělat seminárku do předmětu Analýza dat. Má to být na buď na t-testy, analýzu rozptlylu, nebo linární regresi, podmínkou pro použití těchto metod, jsou ale data s normáním rozdělením (http://cs.wikipedia.org/wiki/Norm%C3%A1ln%C3%AD_roz d%C4%9Blen%C3%AD). Vyučující si navíc vymyslel, že chce realná data. Googlím už dvě hodiny a nikde jsem nic takového nenašel. Počet dat v souoru by se měl pohybovat minimálně okolo stovky, více je lépe. Formát dat mi je celkem volný, ale uvítal bych formáty Excelu, NCSS nebo prachsprostý texťak. Nemá někdo něco takového doma, dobré by byly třeba údaje z nějakého měření, kde data slabě kolísají kolem svého (nahoru i dolů) průměru.
Díky!
MaSo
Nezkousel jsi psat na Cesky statisticky urad?
To jsem nezkoužel. Potřebuji to odevzdat v pondělí, pochybuji, že by mi do té doby odpověděli. Že já si všechno nechávám na poslední chvíli...
já takových dat mám, bohužel je nemohu zveřejnit..
Přinejhorším si nějaká data vygeneruj podle Gaussovy křivky.
To mě taky napadlo, ale musel bych to vztáhnout na něco reálného z IT oboru a říct, že jsem to změřil. Napadá mě třeba kolísání napětí PC zdroje. Porovnat přes analýzu rozptylu tři nějaké PC zdroje, třeba jen 12ti voltové větve s tím, že naměřené hodnoty si vygeneruji přes fci NORMINV() v Excelu. Šlo by to?
Ale, jak píšu, raději bych reálná data.
Kdyz mi vysvetlite, co to vubec znamena, tak bych mohl ziskat nejake informace provozu u sebe na routru
Já se obávám že mně by nestačilo ani to vysvětlení.
Příkladem normálně rozdělených dat můžou být udáje o výšce dospělé populace mužů i žen. Prostě data kolisající kolem svého průměru, tak že kladné i záporné odchylky od průměru se v ideálním navzájem "vyruší".
a to chces chces jako nejakou tabulku, nebo jak to myslis?
Ano, tabulku.
co třeba latence ICMP paketů?
Už je hotovo, viz níže...
Nemam, ale sak kup si lentilky a zmeraj priemer kazdej z nich nejakym mikromeradlom aby to bolo dost presne/rozptylene, snad ich v balicku bude aj 100, ak nie tak 2balicky. A potom ich mozes zjest
P.S. len si nie som isty ci to bude normalne rozdelenie...
A co si myslíš o tom mojem nápadu s PC zdrojem? Je to věrohodné? Kolísá to napětí vůbec?
kolisa podla zataze, ale to nebude asi ciste gaussovo rozdelenie, a aby si meral nejake nahodne chyby tak to by si musel merat dost presne a taky merak asi nemas.
Skor asi fakt merat tu vysku ludi ako si pisal predtym. Este ma napadlo stiahnut si cisla rulety (napr. www.spielbank-wiesbaden.de - referenzen - archiv, nastav tam nejaky starsi datum napr. 1.1.2007, stol tam nechaj napr. Tisch3 nech to su realne cisla z realneho stola, ausgabetyp si zmen na download mit statistiken, a "anzal tage" zadaj napr. 100 t.j. budes mat v tom textaku 100 dni), no a pre kazdy den si pozriet kolko bolo cervenych a ciernych, mas to tam v statistikach pre kazdy den. Priemer je 50:50 a kolise to kazdy den okolo priemeru. Ale tiez neviem ci to je priklad presne na gaussovo rozdelenie, ci to nie je nejake ine, ja statistiky neznasam, statistiky su aj tak len klamstvo na oblbnutie ludi
Co todle? http://www.ufa.cas.cz/html/dllouka/info/vav/priloha 01.xls
Hezky! Ja si tu lamu hlavu, cim bych prispekl troskou do mlyna a ty tohle!
Takže je to ono?
Rekl bych ze jo. To ale musi posoudit MaSo.
Ja v tom nevidim nic co by malo gaussove rozdelenie, ktory konkretne udaj z toho ma pouzit ?
Nevím jaký to má rozdělení, ale má to být statistika směru a rychlosti větru na vybraných stanicích viz googlovatelné:
Chjo, MM ma pravdu. Zmatly me ty Gaussovy souradnice v uvodu a do tabulky se nemrkl . Ani jsem netusil (az strejda objasnil), ze se to normalniho rozlozeni netyka.
Už to taky čtu .
Díky za reakci. Ale ty hodnoty rychlosti větru podle statistického software normální rozdělení nemají...
Nemas kamose (znameho) poskytovatele netu? Napada me mesicni (tydenni) objem prenesenych dat lidi se stejnou konektivitou.
Taketo veci IMHO nemaju normalne (gaussovo) rozdelenie, pretoze akekolvek mnozstvo prenesenych dat alebo akakolvek sila vetra ma rovnaku pravdepodobnost, t.j. skor to bude rovnomerne rozdelenie, nie normalne rozdelenie (normalne sa nerovna rovnomerne).
U gaussoveho rozdelenia musis mat nejaku udanu hodnotu aka by tam fakt mala byt (t.j. nieco co by mal mat kazdy prvok rovnake), a meras len odchylky. Napr. ze by si mal 100ludi ktori maju MBit pripojenie a meral by si u nich rychlost prenosu, kolisala by okolo toho MBitu - to by bolo IMHO gaussove rozdelenie.
P.S. ale je mozne ze s tym mnozstvom prenesenych dat by to bolo fakt gaussove, ako pises, kolise to okolo nejakeho priemeru stiahnutych dat takze ok, berem pripomienku spet
Ale ja to chapu. Jen varim z vody. Idealni by asi byla ta odchylka napeti stovky zdroju stejneho vyrobce pri stejne zatezi (ci presnost stejnych mericich pristroju na stejnem rozsahu). Fakt me nenapada konkretni priklad...
Ano to by bolo IMHO gaussove rozdelenie, 100 zdrojov a merat napatie. Ja by som skor meral tie lentilky, su lacnejsie ako zdroje len treba mat nejake posuvne meradlo co vie merat aspon desatiny milimetra, apod.
S tym mnozstvom dat co si pisal vyssie si niesom isty, ale skor inklinujem k tomu ze by to nebolo gaussove rozdelenie.
Teď nevím jestli neříkám blbost, ale kolísavost elektriky v zásuvce by takovou statistiku umožnila?
asi ano, mas take data?
Když mi nic jiného nezbude, tak si takové udělám. Jak moc to většinou kolísá?
Ja som skor myslel ze by to meral v minulosti napr. kazdu hodinu cely tyzden, aby tam boli aj nejake dlhodobejsie odchylky :) Kratkodobo netusim to zavisi od kvality vedeni apod. Skus presnost 0.1V a uvidis ci sa nieco bdue menit. Ja by som skor meral tie lentilky
Ty lentilky nemusí být až tak špatný nápad. Aspoň profesora pobavím.
Z lentilek se zblázníš, jsou šišatý, né kulatý.
Tak si kup pár stovek tranzistorů a změř třeba betu. Nebo si to vymysli.
Cena konkretniho vyrobku na ruznych e-shopech (odchylka od ceny doporucene vyrobcem). Tohle je IMHOj Gaussovske dost...
vezmi nejaky standartne dlhy text (napr. 1ooo znakov)a daj vyhladaj pismeno A. Je v slovencine a asi aj v cestine najcastejsie. Pouzi viac textov o rovnakej dlzke a mas to. Nemusis ani zadok zdvihnut od pocitaca, nieto este nieco merat...
Díky za reakce. Rozhodl jsem se, že udělám lentilky.
Tak prijemnu zabavu Ta ruleta co som pisal vyssie sa ti nepaci? S tym by nemal byt problem podla mna je to gauss a mas to v textaku staci to odfiltrovat. Ale ak prof. povie ze to neni gauss tak na mna nenadavat
Musím ti hodně poděkovat za tvůj ruletní tip. Díky tobě teďka na poslední chvíli asi tu seminárku fakt odevzdám. :D Budu ještě informovat o (ne)úspěchu.
Hotovo. http://rapidshare.com/files/104882355/seminarka-sob ek.pdf (direct link)
To je epochální dílo
Nádhera! Velice potřebné dílo, to na trhu znatelně chybělo .
Je vidět, že od mého mládí se nic nezměnilo a nic praktického se na školách i nadále neučí .
Jak ve kterých předmětech... Já tíhnu k programování, v tom to odvětví se u nás na praktičnost docela dbá. V ostatních předmětech je mi to víceméně jedno, ale projít jimi musím...
Takhle vědecky zpracovaný lentilky jsem ještě neviděl. Popíšeš potom výraz učitele?
Pekne, ja som sa rehotal uz pri tom podnadpise "Analýza rozptylu velikosti Lentilek ve čtyřech náhodně vybraných krabičkách" Dufam ze to docent ohodnoti kladne...
Tak to je maso ). Rulezz!!
Jak se měří lentilky tak, aby se měřením nedeformovaly?
Pavel
Proč by se měly deformovat? Lentilky jsou docela pevné.
Jinak moje seminárka nebyla ani zdaleká tak originální. Zahlídl jsem tam i práci na téma lineární regrese s názvem "Závislost délky mužského penisu na výšce". Pro lidi menšího tělesného vzrustu může být útěchou, že závislost nevyšla jako lineární...
Vyloženě originální! A vsadím se, žes nakonec objekty měření sežral.
Tak udělej třeba PSČ České republiky
PSČ Město Okres Kraj Nejbližší pošta
V čem to máš udělat?
A může jich tam být jenom 100 největších a 100 nejmenších měst ČR
Jo aha, nty to máš, tak nic. Jinak drsný ty lentilky
Tak za lentilky jsem dostal 13 bodů z patnácti, byly tam asi nějaké nepřesnosti. Ještě jsem to neviděl, ale myslím, že mám chybu v předpokladech použití analýzy rozptylu. No, je to celkem jedno, hlavně, že můžu ke zkoušce.
fakt boží
Chtělo by to zalejt