statystyka wszystko

Do czego służy test statystyczny?

weryfikacji hipotezy, wnioskowanie o H0 na podstawie danych, które prowadzi do 1 z 2 wniosków: H0 odrzucamy odpowiednie wnioski i H0 nie odrzucamy i uznajemy je za prawdziwe.

Co to jest moc testu?

Prawdopodobieństwo odrzucenia hipotezy stat. w sytuacji, gdy jest ona fałszywa, czyli prawdopod. nie popełnienia błędu 2 rodzaju (1-B)=P

Od czego zależy moc testu?

Od liczebności próby im > tym moc >. H0=uoX-N(u,b2) im u jest dalsze tym test jest mocniejszy. Wariancji jej wartości.

Analiza wariancji.

Porównanie wartości oczekiwanej wielu populacji, gdzie obserwowane są cechy o rozkładzie normalnym, a dokładnie do weryfikacji hipotezy H0=u1=u2=...uk

ui dla i=1,...,k – oznacza wartość oczekiwaną w itej populacji np. porównanie przeciętnych plonów pszenicy pewnych odmian. Dzięki weryfikacji tej hipotezy możemy uzyskać odp. na pytanie istnienia związku między cechą jakościową, który posłuży do podziału na populacje a badaną cechę ilościową. Stosuje się w doświadczalnictwie, badanie różnych czynników na określoną cechę.

Analiza regresji.

Służy 1 do sprawdzenia, czy istnieje zależność między dwiema cechami ilościowymi jak i 2 do podania opisu ilościowego zależności, np. badając zależność między dawką nawozu a efektywnością nawożenia łąk. X – dawka N deterministyczna Y – efektywność E(Y/X=x)=Bo+B1x oszacowanie B1 i Bo opis ilościowy zależności; Weryfikacja Ho:B1=0 – stwierdzenie zależności. Czyli analiza regresji opisuje zależność średniej wartości zmiennej Y od wartości zmiennej niezależnej X.

Analiza korelacji.

Badanie istnienia związku między (wł. jego siły) prostoliniowego pomiaru dwiema zmiennymi losowymi o normalnych rozkładach prawdopodobieństwa np. zależność między wzrostem i ciężarem człowieka, zawartością białka i tłuszczu w mleku. Zmienne losowe ciągłe. Analiza korelacji pozwala wykazać bądź nie istnienie związku między X i Y.

Estymacja parametru rozkładu prawdopodobieństwa.

Szacowanie na podstawie próby nieznanych wartości parametru rozkładu prawdopodobieństwa, np. X-wzrost X-N (u,b2) estymator u na podstawie próby jest X=u – estymator nieobciążony

Własności dobrego estymatora.

- nieobciążony – wart. oczekiwana estymatora = wart. parametru szacowanego, estymator jest też zmienną losową

- zgodność – z im większej próby wyznaczymy estymator tym będzie bardziej zgodny z rzeczywistym u.

- efektywność – losowy błąd estymatora najmniejsza wariancja najefektywniejszy estymator

Przedział ufności.

Wyznaczony na podstawie próby zakres liczbowy pokrywający z góry zadanym prawdopodobieństwem (znanym poziomem istotności) szacowaną nieznaną wartość parametru *dystrybuanta określa P(X<x)F(x) Formalnie jest to całka z funkcji gęstości par. X na podstawie (-nieskończoności, x).

1. Rozkład empiryczny cechy.

Podstawą do jakichkolwiek analiz statystycznych badanej cechy jest określenie tzw. empirycznego rozkładu cechy. Polega ono na uporządkowanym, uszeregowanym rosnąco wartościom, przyjmowanym przez tę cechę odpowiednio zdefiniowanych częstości ich występowania.

2. Podać definicję i opisać właściwości funkcji rozkładu zmiennej losowej oraz dystrybuanty.

Funkcje rozkładu zmiennej losowej: przyporządkowuje wartościom tej zmiennej losowej wartości prawdopodobieństw z jakimi one występują, suma tych prawd. równa się 1. Własności D=R;f=<0;1> jest ograniczona. Zmienna losowa X jest typu skokowego jeśli może przyjmować skończoną lub nieskończoną, ale przeliczoną liczbę wartości. Zmienna losowa X jest typu ciągłego jeśli możliwe wartości należą do przedziału ze zbioru liczb rzeczywistych.

F. dystrybuanty: przyporządkowuje wartościom zmiennej losowej wartości prawdopodobieństwa tego ze wartości zmiennej losowej. Przyjmuje wartość nie większą od wartości argumentu, własność jest ograniczona 0<=F(x)

3. Co to jest standaryzowany układ normalny i jak przeprowadza się proces standaryzacji?

Jest to rozkład normalny, który uległ przekształceniu a po którym ma parametr E(U)=o; DZ(U)=1. Jego dystrybuanta jest stablicowana. Standaryzacja jest to przekształcenie, którego celem może być prowadzenie różnych rozkładów zmiennej o różnym przeciętnym poziomie i stopniu zróżnicowania dla porównywalności. Standaryzację przeprowadza się w następujący sposób: od wartości zmiennej odejmuje się jej wartość oczekiwaną i otrzymaną różnicę dzieli się przez odchylenie standardowe.

4. Jakie testy są używane do weryfikacji hipotezy Ho=u1=u2 i jakie są kryteria wyboru?

- test T-studenta, jeżeli populacja ma rozkład normalny o nieznanych parametrach;

- test U, jeżeli populacja generalna ma dowolny rozkład o nie znanych parametrach (duża próba) lub gdy populacja generalna ma rozkład normalny o nieznanym u, ale znanym δ (mała próba).

5. Co to jest hipoteza? Omów rodzaje weryfikowanych hipotez.

Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej. Do weryfikacji hipotez służą testy istotności. Postać tych testów a w szczególności statystyk będących sprawdzianami Ho zależy od tego, jakiego parametru dotyczy hipoteza oraz jakimi informacjami o populacji generalnej dysponujemy.

6. Jakie czynniki i w jaki sposób wpływają na długość przedziału ufności dla wartości oczekiwanej?

Zależy od poziomu istotności α, odchylenia standardowego δ i liczebności próby N. Od α i δ zależy wprost proporcjonalnie, czyli wraz ze wzrostem parametru rośnie długość przedziału ufności, od N zależy odwrotnie proporcjonalnie ze wzrostem liczebności maleje długość przedziału. Dt=2uαS/pierwiastek z N

7. Omówić dowolnie wybrany rozkład zmiennej losowej skokowej, przedstawić na wykresie.

f(x), F(x)

Zmienna losowa przyjmuje dwie wartości 1, 2 każda z wartości przyjmuje z prawdopodobieństwem ½.

8. Od czego zależy wartość i położenie obszaru krytycznego?

Wielkość od wielkości wartości krytycznej (Uα), a odchylenie od wielkości poziomu istotności α, im większe α tym mniejszy obszar krytyczny. Położenie od stosowanego testu zgodności, np. przy rozkładzie normalnym jest dwustronny, a przy rozkładzie χ prawostronny. Położenie zależy też od rodzaju weryfikowanej hipotezy – lewostronnej, prawostronnej i obustronnej.

9. Wypisz hipotezy, które można weryfikować testem T-studenta. Jakie założenia należy przyjąć o populacjach generalnych?

Ho:u=u0 – populacja ma rozkład normalny o nieznanych parametrach, mała próba

Ho:u1=u2 – mała próba, wariancje jednakowe

10. Podać cechy dobrego estymatora.

- nieobciążony – przy wielokrotnym losowaniu próby średnie z wartości przyjmowanych przez estymator nieobciążony równa jest wartości szacowanego parametru;

- efektywny – najefektywniejszy jest ten, który ma najmniejszą wariancję;

- dostateczny (wystarczający) jeżeli do jego konstrukcji użyto wszystkie elementy próby;

- zgodny – jeśli wraz ze wzrostem wartości próby wartość estymatora jest bliższa wartości estymowanego parametru. Jeżeli dla każdego ε>0 lim P{<θα z daszkiem - θ>≤ε}=1 to θ jest estymatorem zgodnym. Jeżeli rozpatrujemy próby (n->rośnie) Es zgodny – jego wartość pokrywa się z wartością nieznaną.

11. Jaka jest interpretacja współczynnika korelacji i regresji jakie wartości mogą przyjmować te parametry?

Współczynnik korelacji określa siłę zależności między zmiennymi. Współczynnik regresji mówi o ile wzrośnie zmiana zależności, jeżeli zmienna niezależna zmieni się o 1.

xy∈(-1,1)

12. Jeżeli rozkład ma częstość empiryczną sukcesu w dużych próbach, jakie są parametry tego rozkładu?

Ma rozkład normalny o parametrach: µ – wartość oczekiwana i σ - odchylenie standardowe.

13. Omówić definicję prawdopodobieństwa.

- klasyczna – prawdopodobieństwo zdarzenia A jest to stosunek zdarzeń sprzyjających temu zdarzeniu, do ilości wszystkich zdarzeń elementarnych.

- aksjomatyczna – niech Ω będzie daną przestrzenią zdarzeń elementarnych. Jeżeli każdemu zdarzeniu A przestrzeni Ω zostanie przyporządkowana dokładnie jedna liczba P(A) spełniająca warunki P(A)≥0; P(Ω)=1 dla każdej pary wyłączających się zdarzeń A,B P(AB)=P(A)+P(B) to mówimy, że na zdarzeniach przestrzeni Ω zostało określone prawdopodobieństwo zdarzenia A, warunki nazywamy aksjomatami

- statystyczna – jeżeli przy wielorakiej realizacji doświadczeń w wyniku których może wystąpić zdarzenie A, częstość tego zdarzenia wyraża wyraźnie prawidłowość, oscyluje wokół pewnej nieznanej liczby, jeżeli wahania częstotliwości przejawiają tendencję malejącą w miarę wzrostu liczby doświadczeń, to liczba P nazywa się prawdopodobieństwem zdarzenia A.

14. Cechy rozkładu normalnego.

Symetryczny względem prostej x=u; osiąga jedno maximum w punkcie, ma dwa punkty przecięcia dla x=u - σ i u + σ; EX=u=Ho. Dowód na jego symetryczność jest określony do zera dla x do +∞ i -∞. Przekształcenie standaryzacja prowadzi do powstania innego rozkładu normalnego.

15. O czym informują kwantyle i mediany w próbie?

Kwantyle dzielą uporządkowaną rosnąco zbiorowość na 4 części liczące po 25% obserwacji środkowej. Dla zmiennej losowej ciągłej mediana dzieli pole pod wykresem na dwie równe części.

16. Co to jest obszar krytyczny, od czego zależy jego wielkość i położenie pod krzywą rozkładu statystyki testowej?

Jest to taki obszar przestrzeni próby, że jeśli wynik prób znajduje się w tym obszarze to sprawdzoną hipotezę zerową odrzucamy, jeśli natomiast wynik próby znajduje się poza tym obszarem to hipotezę Ho przyjmujemy (nie odrzucamy).

17. Podaj interpretację parametru współzmienności zmiennej losowej dwuwymiarowej.

Współczynnik determinacji exy mówi nam w jakiej części wartości jednej zmiennej jest zdeterminowana wartość drugiej zmiennej.

Współczynnik regresji βxy mówi o ile wzrośnie zmiana zależności jeżeli zmienna niezależna zmieni się o 1.

18. Co można powiedzieć o zmiennej w próbie jeśli wszystkie miary przyjmują tę samą wartość?

Jeżeli wszystkie miary przyjmują tę samą wartość to znaczy, że brak jest zróżnicowania w próbie, czyli wszystkie wartości cechy są jednakowe.

19. Dlaczego w testach istotności nie przyjmujemy Ho?

W testach istotności uwzględnia się tylko prawdopodobieństwo α popełnienia błędu 1 rodzaju. Pomija się przyjęcie hipotezy fałszywej(błędu II rodzaju β) nie mówi się o przyjęciu tej hipotezy, ale o tym, że wyniki danej próby nie dają podstaw do jej odrzucenia. Jeżeli wynik znajduje się na obszarze krytycznym odrzuca się Ho, a prawdziwa jest H1, bo w pewnych testach możliwe jest określenie prawdopodobieństwa β popełnienia błędu II rodzaju. Można zatem w pewnych przypadkach, po określeniu obszaru krytycznego dla wartości α wyznaczyć prawdopodobieństwo takiego błędu.

20. Rozkład normalny.

Określony jest przez swoje parametry: µ i σ; funkcja jest zbieżna do 0 dla -∞; +∞; podlega prawu trzech sigm; symetryczny względem prostej przechodzącej przez µ; funkcja rozkładu posiada jedno maximum lokalne µ0, które pokrywa się z wartością oczekiwaną (EX); każdy rozkład normalny X:N(µ,σ) można sprowadzić do postaci tzw. standaryzowanego rozkładu normalnego, którego funkcja gęstości i dystrybuanta została stablicowana (µ=0 σ=1)⇒N(0,1); wykresem funkcji gęstości rozkładu normalnego jest krzywa Grensa symetryczna względem prostej o równaniu x=µ z dwoma punktami przegięcia µ-σ i µ+σ

21. Podać interpretację parametrów współzależności zmiennej losowej.

1. Kowariancja cos(xy) – moment centralny II rzędu jest równa zeru, jeśli zmienne x, y niezależne – wartość liczbowa jest nieistotna

CXY=EXY-EX-EY

jeśli jest różna od zera, jest zależność; kiedy jej wartość jest dodatnia to jedna zmienna wpływa na drugą pozytywnie (jeśli I rośnie to II też); kiedy jest ujemna: jedna wpływa na drugą i jej wzrost powoduje malenie II i na odwrót.

2. Współczynnik korelacji δxy: przyjmuje wartość z przedziału <-1,1>; jest ujemna kiedy korelacja δxy=cov(x,y)/DXDY; określa natężenie zależności między dwiema zmiennymi lub jej brak; im bliżej –1 lub 1, tym większe natężenie zależności; kiedy równe O, to brak zależności.

22. Jak zmienia się długość przedziału ufności dla prawdopodobieństwa sukcesu, gdy liczebność próby wzrośnie o...?

Kiedy n(liczebność próby) rośnie, to długość przedziału maleje o tyle samo.

24. W pewnej próbie δ=0,5 a stosunki korelacji są równe 0,7 i 0,8 (e=x,y) jak można zinterpretować ich wartość?

δ=0,5 – zależności pozytywne i słabe; exy=0,7 i exy=0,8 zmienna X i Y wpływają na siebie nieznacznie (słabo).

weryfikalne – zerowe

nie weryfikalne - alternatywne

25. Zmienna losowa

Funkcja, która przyporządkowuje wartości liczbowe zdarzeniom elementarnym, Xi:Pi; X-wartości zmiennej losowej, i-kolejność, P-prawdopodobieństwo wystąpienia. Funkcja rozkładu prawdopodobieństw – przypisanie p polejnym zmiennym losowym - rozkład zmiennej losowej.

26. Zmienna losowa skokowa

cechy jakościowe, zbiór przeliczalny (skończony lub nie)

27. Zmienna losowa ciągła

cechy ilościowe, zbiór liczb rzeczywistych

28. Wartość oczekiwana

mówi czego możemy się spodziewać po danym rozkładzie; moment zwykły I-rzędu m1=EX, m1=∑x1p1. Odchylenie standardowe – rzeczywiste odchylenia od wartości oczekiwanej.

29. Rozkład Bernoulliego

Zmienna losowa ma rozkład dwumianowy, jeśli przyjmuje wartości k=0,1,2...n z prawdopodobieństwem określonym wzorem. Parametrem tego rozkładu jest n-liczba doświadczeń, p-prawdopodobieństwo sukcesu. Rezultatem doświadczenia może być A-sukces lub A’ porażka. Doświadczenie to powtarzamy wielokrotnie (n) tak, że prawdopodobieństwo sukcesu pozostaje w pojedynczych próbach stałe i równe p. Liczba zaobserwowanych sukcesów to k=0,1,2,...,n EX-np. D2X-np.(1-p)

30. Ho o niezależności

dotyczy dwóch cech w jednej próbie, kiedy między zmiennymi jest brak zależności.

31. Ho o zgodności

zmienna ma rozkład zgodny z określonym rozkładem teoretycznym. Wtedy Ho: x – rozkład normalny, Bernouliego, Possona. Zmienna ma jednakowy rozkład w dwóch populacjach. Wtedy Ho; Xα ma rozkład jak X. Do weryfikacji używa się testu tylko χ2 I- rozkład empiryczny, II-rozkład teoretyczny (zakładamy, że Ho jest prawdziwe). Test χ2 o niezależności.

Test χ2 o zgodności. Próba z jednej populacji musi być dwuwymiarowa. Przy odrzuceniu hipotezy – dwie zmienne mogą być zależne istotne lub wysokoistotne.

32. Do czego służą testy statystyczne?

Służą do weryfikacji hipotez, czyli do wnioskowania o postawionej hipotezie statystycznej (Ho) na podstawie danych, które prowadzą do jednego z dwóch wniosków:

1. wniosek Ho kwestionujemy, czyli odrzucamy

2. Ho nie odrzucamy a tym samym uznajemy za prawdziwe.

33. Jakie dwa rodzaje błędów grożą przy weryfikacji hipotezy?

1. jeśli Ho odrzucamy, jesteśmy narażeni na błąd 1-go rodzaju polegający na odrzuceniu hipotezy prawdziwej wyrażony przez α poziom istotności

2. jeśli Ho nie odrzucamy, narażeni jesteśmy na błąd II-go rodzaju, który polega na nie odrzuceniu hipotezy fałszywej

Doświadczenie losowe to proces, który możemy powtarzać wielokrotnie w jednakowych lub zbliżonych warunkach, którego przebiegu i ostatecznego rezultatu nie można w jednoznaczny sposób przewidzieć.

Przykłady

(1) rzut monetą

(2) rzut koską do gry

(3) rozdanie kart

(4) losowanie toto-lotka

(5) strzelanie do celu

Przestrzeń zdarzeń elementarnych (przestrzeń wyników) jest to zbiór wszystkich możliwych, niepodzielnych, wykluczających się wyników pewnego doświadczenia losowego. Oznaczamy ją przez Ω. Elementy tego zbioru to zdarzenia elementarne. Oznaczamy je przez ω, ewentualnie ze wskaźnikami (numerami) przez ωi .

Przykłady

(1) Przestrzenią zdarzeń elementarnych rzutu kostką do gry jest zbiór Ω={1,2,3,4,5,6} gdzie cyfra 1 oznacza wypadnięcie górnej ścianki z jednym oczkiem, cyfra 2 wypadnięcie górnej ścianki z dwoma oczkami, itd. To samo doświadczenie możemy też zapisać jako Ω={ ω1, ω2, ω3, ω4, ω5, ω6} gdzie ωi, oznacza wypadnięcie górnej ścianki z liczbą oczek równą i. Liczebność zbioru Ω to ilość elementów w zbiorze czyli n )=6.

(2) Partia towaru składa się ze sztuk dobrych i złych. Wybieramy losowo jedną sztukę. Zdarzenia elementarne definiujemy następująco :

d —wybraliśmy sztukę dobrą w —wybraliśmy sztukę wadliwą

Zbiorem zdarzeń elementarnych jest zbiór: Ω={d,w}jego liczebność wynosi 2. Zdarzenie elementarne d zachodzi wtedy i tylko wtedy gdy wylosujemy sztukę dobrą, zdarzenie elementarne w zachodzi wtedy i tylko wtedy gdy wylosujemy sztukę wadliwą.

(3) Strzelamy dwukrotnie do celu. Interesuje nas w którym strzale cel został trafiony. Zdarzenia elementarne definiujemy następująco:

(t, t)—trafienie w pierwszym i drugim strzale

(t, c)—trafienie w pierwszym i chybienie w drugim strzale

(c, t)—chybienie w pierwszym i trafienie w drugim strzale

(c, c)—chybienie w pierwszym i drugim strzale

Zbiorem zdarzeń elementarnych jest zbiór Ω={(t, t), (c, t), (t, c), (c, c)}jego liczebność wynosi 4.

  1. Strzelec trafia do celu tyle razy aż trafi. Przyjmujemy zbiór zdarzeń elementarnych

Ω={ ω1, ω2, ω3, ...., ωn},

gdzie ωn, dla n=1,2,3,... oznacza że cel zostanie trafiony w strzale o numerze n oraz w strzałach o numerach 1,2,...,n-1 nie został trafiony.

(10) Dokonujemy pomiaru pewnej wielkości fizycznej. Przyjmujemy, że każda liczba rzeczywista może być wynikiem tego pomiaru, zatem Ω jest zbiorem R wszystkich liczb rzeczywistych czyli Ω=R.

Wobec powyższych przykładów zauważamy że zbiór zdarzeń elementarnych może być:

(a) skończony (przykład 1, 2, 3 )

(b) przeliczalny (przykład 9 )

(c) nieprzeliczalny (przykład 10 )

Zdarzenia losowe są to elementy pewnej rodziny S podzbiorów przestrzeni zdarzeń elementarnych Ω.

Jeżeli przestrzeń zdarzeń elementarnych Ω składa się ze skończonej liczby elementów to jako rodzinę S przyjmujemy rodzinę wszystkich podzbiorów przestrzeni zdarzeń elementarnych Ω, czyli dowolny podzbiór jest zdarzeniem losowym.

Jeżeli przestrzenią zdarzeń elementarnych Ω będzie n- wymiarowa przestrzeń euklidesowa Rn lub jej podzbiór (np. R-zbiór liczb rzeczywistych). Przez S* oznaczamy rodzinę podzbiorów przestrzeni Ω spełniającą następujące warunki:

1.

2. Jeśli to

3. Jeśli to

S* nazywamy przeliczalnym addytwnym ciałem zdarzeń. Przez S oznaczamy najmniejsze przeliczalne addytywne ciało zdarzeń, zawierające wszystkie zbiory otwarte, czyli ciało zbiorów borelowskich (jego elementy to zbiory borelowskie). Dowolny zbiór należący do S nazywamy zdarzeniem losowym, czyli zdarzenia losowe są to zbiory borelowskie.

Zdarzenie pewne jest to podzbiór przestrzeni zdarzeń elementarnych Ω zawierający wszystkie elementy tej przestrzeni. Zdarzenia pewne oznaczamy tą samą literą Ω.

Zdarzenia niemożliwe jest to podzbiór pusty przestrzeni zdarzeń elementarnych Ω. Zdarzenie niemożliwe oznaczamy symbolem ∅

Zdarzenia losowe jako podzbiory przestrzeni Ω są zbiorami i oznacza się je literami A,B,C, ... ewentualnie literami ze wskaźnikami A1,A2,... Relacje i działania na zdarzeniach są więc relacjami i działaniami na zbiorach.

Relacje i działania na zdarzeniach losowych

Zdarzenie A jest zawarte w zdarzeniu losowym B jeśli każde zdarzenie elementarne należące do A należy też do B. Piszemy

Sumą dwu zdarzeń lodowych A oraz B nazywamy zbiór złożony z tych i tylko tych zdarzeń elementarnych, które należą co najmniej do jednego ze zdarzeń losowych A oraz B. Piszemy

Iloczynem dwu zdarzeń losowych A oraz B nazywamy zbiór złożony z tych i tylko tych zdarzeń elementarnych, które należą zarówno do A, jak i do B. Piszemy

Różnicą dwu zdarzeń losowych A oraz B nazywamy zbiór złożony z tych i tylko tych zdarzeń elementarnych, które należą do zdarzenia A i nie należą do zdarzenia B. Piszemy

Zdarzenie przeciwne do zdarzenia A oznaczamy symbolem lub A’ i określamy je w sposób następujący

Zdarzenia rozłączne (wykluczające się) to zdarzenia A oraz B dla których zachodzi ∅

Rozkład prawdopodobieństwa jest to funkcja rzeczywista P, której argumentami są zdarzenia losowe a wartościami liczby z przedziału <0;1>. Przyporządkowuje zdarzeniom losowym prawdopodobieństwa zajścia danego zdarzenia.

Funkcja P spełnia następujące aksjomaty:

1. Funkcja jest nieujemna

2. Prawdopodobieństwo zdarzenia pewnego jest równe jedności

3. Dla każdego ciągu A1,A2,..... zdarzeń parami rozłącznych (∅ dla i,j=1.2....; ) prawdziwa jest równość

Podstawowe własności funkcji P:

  1. Prawdopodobieństwo zdarzenia niemożliwego równa się zero∅

  2. Prawdopodobieństwo zdarzenia przeciwnego wyraża się wzorem

  3. Dla dowolnych zdarzeń A oraz B zachodzi

  4. Jeśli to

  5. Dla każdego zdarzenia A

Rozkład prawdopodobieństwa w przeliczalnej przestrzeni zdarzeń

Niech będzie przestrzenią przeliczalną.

Dla zdarzeń losowych jednoelementowych funkcję P określamy w sposób następujący:

, gdzie i .

Dla zdarzeń losowych więcej niż jednoelementowych czyli i funkcję prawdopodobieństwa określamy w sposób następujący:

Rozkład prawdopodobieństwa w skończonej przestrzeni zdarzeń

Niech będzie przestrzenią skończoną N-elementową.

Dla zdarzeń losowych jednoelementowych funkcję P określamy w sposób następujący:

Dla zdarzeń losowych więcej niż jednoelementowych czyli i funkcję prawdopodobieństwa określamy w sposób następujący:

Wzór ten nazywany jest klasyczną definicją prawdopodobieństwa.

Drzewo doświadczenia losowego (dendryt) jest to model doświadczenia losowego składającego się z kilku etapów, ułatwia opisanie przestrzeni wyników i obliczenie prawdopodobieństwa.

Przykład

Rzucamy trzy razy symetryczną monetą.

Zdarzenia niezależne i zależne

Dwa zdarzenia A i B nazywamy niezależnymi jeśli zajście jednego z nich nie ma wpływu na prawdopodobieństwo zajścia drugiego. Gdy mamy do czynienia ze zdarzeniem A, którego prawdopodobieństwo zależy od zajścia zdarzenia B to mówimy o prawdopodobieństwie warunkowym (P(A|B)), a zdarzenia A i B nazywamy zależnymi

Jeśli zdarzenia A i B są niezależne to P(A)=P(A|B) lub P(B)=P(B|A), w przeciwnym przypadku zdarzenia A i B

Przykład

W urnie znajduje się 7 kul białych i 3 czarne, Losujemy jedną kulę a następnie zwracamy ją do urny i losujemy drugą kulę. Oba losowania zachodzą niezależnie. Jeśli jednak rozważymy przypadek, że po pierwszym losowaniu kula nie będzie zwracana do urny, to już w drugim losowaniu prawdopodobieństwo wylosowania kuli danego koloru zmieni się. Wówczas zdarzenia będą zależne.

Prawdopodobieństow warunkowe

Prawdopodobieństwo warunkowe zajścia zdarzenia A przy założeniu, że zaszło zdarzenie B obliczamy ze wzoru

Wzór łańcuchowy

Jeśli zdarzenia A1,A2,...,AN spełniają warunek to:

Prawdopodobieństwo całkowite

Gdy zdarzenia wzajemnie się wykluczają tzn. ∅ i zachodzi

Można zastosować wzór na prawdopodobieństwo całkowite:

Schematem Bernoulliego nazywamy n-etapowe doświadczenie losowe polegające na tym, że w niezmieniających się warunkach wykonujemy n razy pewne doświadczenie. W wyniku każdego z n doświadczeń możliwe są dwa wyniki: sukces z prawdopodobieństwem p i porażka z prawdopodobieństwem q=1-p, gdzie . Prawdopodobieństwa p i q nie zmieniają się z etapu na etap.

Wzór Bernoulliego na łączną liczbę skukcesów w schemacie Bernoulliego:

, dla k=0,1,...,n (k łączna liczba sukcesów)

Przykład:

W jednakowych warunkach strzelec strzela n razy do tarczy; wyniki poszczególnych strzałów są niezależne od siebie (strzelec ani nie nabiera wprawy, ani się nie męczy; stan techniczny broni ani warunki zewnętrzne nie ulegają zmainie). Interesuje nas liczba k strzałów celnych.

Cechę ilościową można podzielić na 2 typy ze względu na możliwy do przyjęcia przez dana cechę kiedy przyjmuje wartości 0,1,2.. i nie przyjmuje wartości pośrednich np. ilość bakterii czy pasożytów

Cecha skokowa przyjmuje wartości z przedziału liczbowego (liczba pędów na roślinie, liczba kłosów nośnych na roślinie, liczba owoców na roślinie)

Cecha jakościowa wartości nie są liczbami(kolor w odrębnie gatunku, płeć gat. żywych, wrażenie smakowe konsumenta)

Hipoteza stat- dowolne przypuszczenie dotyczące rozkładu prawdopodobieństwa cechy.

Test hipotezy postępowanie mające na celu przyjęcie lub odrzucenie hipotezy.

Statystyka testowa funkcja próby na podstawie której wnioskuje się odrzucenie lub nie odrzucenie hipotezy. Jest zmienna losowa bo dla każdej próby losowej populacji może przyjmować inne wartości.

Błąd 1 rodzaju nazywamy błąd wnioskowania polegający na odrzuceniu hipotezy w sytuacji kiedy jest ona prawdziwa

Błąd 2 rodzaju nazywamy błąd wnioskowania polegający na odrzuceniu hipotezy w sytuacji kiedy jest ona fałszywa.

Poziom istotności dowolna liczba z przedziału(0,1) określa prawdopodobieństwo popełnienia błędu 1 (określa stopień naszej pewności co do hipotezy zerowej). Jeśli test odrzuca hipotezę to na im mniejszym poziomie istotności to zrobił tym większe prawdopodobieństwo ze hipoteza jest prawdziwa. Oznaczenie: alfa

Zmienna losowa funkcja o wartościach rzeczywistych określana na zbiorze zdarzeń elementarnych

Jej wartości nie można zwykle przewidzieć. Nie jest kontrolowana, jej wartości pojawiają się poza naszą wolą.

Rozkład zmiennej losowej zbiór wartości zmiennej losowej i prawdopodobieństwa z jakim wartości są przyjmowane.

Zmienna losowa skokowa zmienna której zbiór wartości jest skończony lub przeliczalny . Jeśli x1 x2 są kolejnymi wartościami zmiennej losowej skokowej to nie przyjmuje ona żadnych wartości.(liczba oczek wyrzuconych w kostce, liczba wadliwych produktów w pewnej partii, liczba bakterii w pewnej próbce)

Zmienna losowa ciągła zmienna przyjmująca wszystkie wartości z danego przedziału. Gdy X1 X2 są dwiema wartościami zmiennej losowej ciągłej to może przyjąć wartość dowolną( zawartość wit. C w mrożonce, alkoholu w winie, cukru w owocach, temp w przechowalni, wydajność pracy pracownika)

Przedział ufności estymator przedziałowy to przedział zależny od próby, który jest pewny z góry zadanym prawdopodobieństwem pokrywa nieznana wartość parametru 0.

Poziom ufności prawdopodobieństwo 1-alfa , na długość D przedziału wpływa: liczebność próby( alfa rośnie, D maleje, poziom ufności (1-alfa rośnie, D maleje), wariancja cechy(wariancja maleje, D maleje)

Moc testu prawdopodobieństwo odrzucenia hipotezy testowej gdy jest ona nieprawidłowa czyli prawdopodobieństwo nie popełnienia błędu 2 rodzaju Oznacza 1 – beta. Moc testu 1-P (błąd 2 rodz)

Moc testu P odrzucenie nieprawidłowej hipotezy

Analiza statystyczna ma 3 etapy wnioskowania: opis, analiza, wnioskowanie. Wnioski z badań formujemy na podstawie populacji obszerniejszej od tej która badamy. Służy do określenia prawidłowości występujących w zmiennym materiale liczbowym do wyodrębnienia istotnych różnic spośród różnic losowych przypadkowych.

Statystyka sposób opisu rzeczywistości zmusza do dokładności i śmiałości w rozumowaniu i działaniu. Umożliwia formowanie uogólnień na podstawie uzyskanych wyników analizy. Pozwala na przewidywanie rozwoju zdarzeń i budowaniu prognoz. Dostarcza narzędzi do porządkowania informacji o zjawiskach i budowę ich ogólnego obrazu. Dostarcza informacji do prowadzenia analizy przyczyn kształtujących bada zjawiska i procesy.

Estymator parametru 0 nazywamy dowolną funkcje próby 0 0(X1,X2....Xn) w rozsądny sposób przybliżający wart. parametru 0 .Często stosuje się pewne metody uzyskiwania estymatorów mający za założenia dawać dobre oceny parametru, tj. wiarygodne metody (bayesowkie ) ???

Rozkłady związane z N – Chi –kwadrat , t –studenta.

Współczynnik korelacji – jest liczbą nie mianowaną q ∋<-1;1> ,jeżeli q> 0 to większym wartościom jednej cechy odpowiadają (średnie) wartości drugiej cechy . Mówimy wówczas o zależności dodatniej , rosnącej lub stymulacyjnej. Jeżeli q<0 to większe wartości jednej cechy odpowiadają mniejsze wartości drugiej cechy q=0 wartości przyjmowane przez jedną z cech i średnie wartości drugiej cechy sa takie same , jeżeli q= +- 1 to istnieje liczba rzeczywista a oraz b że Y=aX+b , wartość współczynnika korelacji jest tym że |q| jest bliższy 1 tym bardziej jest liniowa zależność miedzy cechami .

Histogram szeregi rozdzielcze przedstawia graficznie . Wykres dla tego nowego przedstawia się na układnie współrzędnych prostokątnych , w postaci słupków. Powierzchnia całego słupka odpowiada liczebności odpowiadającego mu przedziału klasowego.

Estymatorem danego parametru populacji nazywamy określoną funkcję elementów próby g(x1,x2,...xn) spełniającą pewne kryteria optymalności . Postać estymatora należy do tych kryteriów .Kryteria mogą być różne zależne od celu estymacji , gdyby próba liczyła jeden element (n=1) to na ocenę średniej w populacji należałoby przyjąć wartość zaobserwowaną w próbie .Właściwości estymatorów : zgodność, nieobciążoność, efektywność

Szereg rozdzielczy – tworzą go klasy wartości losowej i zmiennej będące przykładami lub kategoriami cech oraz liczby elementów próby należących do poszczególnych klas. Klasy będące przedziałami tworzymy dzieląc całkowity zakres zmienności danych na kilka do kilkunastu części , zachowując jednakową długość przedziałów .

NIEOBCIĄŻONOŚĆ – jeżeli średnia wartość oceny 0_ jest równa wartości parametru 0 to ocenę 0_ nazywamy nieobciążoną.

MINIMALNA WARIANCJA – z dwóch nieobciążonych ocen 0_ oraz 0_ tego samego parametru 0 za lepszą uznajemy tą , która średnio przyjmuje wartości bliższe parametrowi 0

MINIMALNY BŁĄD ŚREDNIOKWADRATOWY – jeżeli ocena 0 nie jest nieobciążona , to wówczas jako miernik stosuje się błąd średniokwadratowy. Jest to uśrednienie obciążenia oraz wariancji.

RACHUNEK PRAWDOPODOBIENSTWA – zajmuje się analizą praw rządzących zdarzeniami losowymi. Pojęciami pierwotnymi są zdarzenia elementarne ‘w’ oraz zbiór zdarzeń elementarnych Ω .

ZDARZENIE LOSOWE – realizacja określonego zespołu warunków wraz z góry określonym zbiorem wyników

PRAWDOPODOBIENSTWO (def. Aksjomatyczna) jest funkcją określoną w zbiorze zdarzeń (całkowitych )??? P(a) ∋ <0;1> P(Ω)=1 P(A u B) = P(A) + P(B) o ile AnB=0

PRAWDOPODOBIENSTWO (def. Klasyczna) jeżeli Ω składa się z n jednakowo prawdopodobnych zdarzeń elementarnych , to prawdop. Zdarzenia A składającego się z k zdarzeń elementarnych wyraża się wzrorem : P(A) = k\n

Dystrybuanta F – jest funkcją określoną na zbiorze liczb rzeczywistych R wzorem F(x) = P(X x ) s∋ R. Najważniejsze własności dystrybuanty 1 0 F(x) =1 2.F(-nieskończoności) =0 , F(nieskon.) =1 3. dyst. Jest funkcją niemalejącą 4. F|a X b| = F(b)-F(a)

Wariancja - D2X zmiennej losowej jest liczbą charakteryzującą rozrzut zbioru jej wartości wokół wartości średniej EX

D2X = ((x-EX) 2 f(x)dx Brak wariancji jeśli wszystkie obiekty są jednakowe .

ODCHYLENIE STANDARDOWE - DX zmiennej losowej X jest liczbą charakteryzującą rozrzut zbioru jej wartości wokół wartości średniej EX

Kawantyl RZĘDU p zmiennej losowej X jest to taka liczba xp że F(xp)=p

Frakcja – jeżeli A jest danym podzbiorem zbioru wartości zmiennej X , to frakcję nazywamy liczbą p= P(X∋ A)

ASYMETRIA (skośna) Liczba y charakteryzująca ‘niejednakowość’ rozproszenia wartości zmiennej losowej wokół wartości oczekiwanej.

Do czego służy test statystyczny? weryfikacji hipotezy, wnioskowanie o H0 na podstawie danych, które prowadzi do 1 z 2 wniosków: H0 odrzucamy odpowiednie wnioski i H0 nie odrzucamy i uznajemy je za prawdziwe.

Co to jest moc testu? Prawdopodobieństwo odrzucenia hipotezy stat. w sytuacji, gdy jest ona fałszywa, czyli prawdopod. nie popełnienia błędu 2 rodzaju (1-B)=P

Od czego zależy moc testu? Od liczebności próby im > tym moc >. H0=uoX-N(u,b2) im u jest dalsze tym test jest mocniejszy. Wariancji jej wartości.

Analiza wariancji. Porównanie wartości oczekiwanej wielu populacji, gdzie obserwowane są cechy o rozkładzie normalnym, a dokładnie do weryfikacji hipotezy H0=u1=u2=...uk

ui dla i=1,...,k – oznacza wartość oczekiwaną w itej populacji np. porównanie przeciętnych plonów pszenicy pewnych odmian. Dzięki weryfikacji tej hipotezy możemy uzyskać odp. na pytanie istnienia związku między cechą jakościową, który posłuży do podziału na populacje a badaną cechę ilościową. Stosuje się w doświadczalnictwie, badanie różnych czynników na określoną cechę.

Analiza regresji. Służy 1 do sprawdzenia, czy istnieje zależność między dwiema cechami ilościowymi jak i 2 do podania opisu ilościowego zależności, np. badając zależność między dawką nawozu a efektywnością nawożenia łąk. X – dawka N deterministyczna Y – efektywność E(Y/X=x)=Bo+B1x oszacowanie B1 i Bo opis ilościowy zależności; Weryfikacja Ho:B1=0 – stwierdzenie zależności. Czyli analiza regresji opisuje zależność średniej wartości zmiennej Y od wartości zmiennej niezależnej X.

Analiza korelacji. Badanie istnienia związku między (wł. jego siły) prostoliniowego pomiaru dwiema zmiennymi losowymi o normalnych rozkładach prawdopodobieństwa np. zależność między wzrostem i ciężarem człowieka, zawartością białka i tłuszczu w mleku. Zmienne losowe ciągłe. Analiza korelacji pozwala wykazać bądź nie istnienie związku między X i Y.

Estymacja parametru rozkładu prawdopodobieństwa.

Szacowanie na podstawie próby nieznanych wartości parametru rozkładu prawdopodobieństwa, np. X-wzrost X-N (u,b2) estymator u na podstawie próby jest X=u – estymator nieobciążony

Własności dobrego estymatora.

- nieobciążony – wart. oczekiwana estymatora = wart. parametru szacowanego, estymator jest też zmienną losową

- zgodność – z im większej próby wyznaczymy estymator tym będzie bardziej zgodny z rzeczywistym u.

- efektywność – losowy błąd estymatora najmniejsza wariancja najefektywniejszy estymator

Przedział ufności. Wyznaczony na podstawie próby zakres liczbowy pokrywający z góry zadanym prawdopodobieństwem (znanym poziomem istotności) szacowaną nieznaną wartość parametru *dystrybuanta określa P(X<x)F(x) Formalnie jest to całka z funkcji gęstości par. X na podstawie (-nieskończoności, x).

1. Rozkład empiryczny cechy. Podstawą do jakichkolwiek analiz statystycznych badanej cechy jest określenie tzw. empirycznego rozkładu cechy. Polega ono na uporządkowanym, uszeregowanym rosnąco wartościom, przyjmowanym przez tę cechę odpowiednio zdefiniowanych częstości ich występowania.

2. Podać definicję i opisać właściwości funkcji rozkładu zmiennej losowej oraz dystrybuanty. Funkcje rozkładu zmiennej losowej: przyporządkowuje wartościom tej zmiennej losowej wartości prawdopodobieństw z jakimi one występują, suma tych prawd. równa się 1. Własności D=R;f=<0;1> jest ograniczona. Zmienna losowa X jest typu skokowego jeśli może przyjmować skończoną lub nieskończoną, ale przeliczoną liczbę wartości. Zmienna losowa X jest typu ciągłego jeśli możliwe wartości należą do przedziału ze zbioru liczb rzeczywistych.

F. dystrybuanty: przyporządkowuje wartościom zmiennej losowej wartości prawdopodobieństwa tego ze wartości zmiennej losowej. Przyjmuje wartość nie większą od wartości argumentu, własność jest ograniczona 0<=F(x)

3. Co to jest standaryzowany układ normalny i jak przeprowadza się proces standaryzacji? Jest to rozkład normalny, który uległ przekształceniu a po którym ma parametr E(U)=o; DZ(U)=1. Jego dystrybuanta jest stablicowana. Standaryzacja jest to przekształcenie, którego celem może być prowadzenie różnych rozkładów zmiennej o różnym przeciętnym poziomie i stopniu zróżnicowania dla porównywalności. Standaryzację przeprowadza się w następujący sposób: od wartości zmiennej odejmuje się jej wartość oczekiwaną i otrzymaną różnicę dzieli się przez odchylenie standardowe.

4. Jakie testy są używane do weryfikacji hipotezy Ho=u1=u2 i jakie są kryteria wyboru?

- test T-studenta, jeżeli populacja ma rozkład normalny o nieznanych parametrach;

- test U, jeżeli populacja generalna ma dowolny rozkład o nie znanych parametrach (duża próba) lub gdy populacja generalna ma rozkład normalny o nieznanym u, ale znanym δ (mała próba).

5. Co to jest hipoteza? Omów rodzaje weryfikowanych hipotez. Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej. Do weryfikacji hipotez służą testy istotności. Postać tych testów a w szczególności statystyk będących sprawdzianami Ho zależy od tego, jakiego parametru dotyczy hipoteza oraz jakimi informacjami o populacji generalnej dysponujemy.

6. Jakie czynniki i w jaki sposób wpływają na długość przedziału ufności dla wartości oczekiwanej?

Zależy od poziomu istotności α, odchylenia standardowego δ i liczebności próby N. Od α i δ zależy wprost proporcjonalnie, czyli wraz ze wzrostem parametru rośnie długość przedziału ufności, od N zależy odwrotnie proporcjonalnie ze wzrostem liczebności maleje długość przedziału. Dt=2uαS/pierwiastek z N

7. Omówić dowolnie wybrany rozkład zmiennej losowej skokowej, przedstawić na wykresie.

f(x), F(x)

Zmienna losowa przyjmuje dwie wartości 1, 2 każda z wartości przyjmuje z prawdopodobieństwem ½.

8. Od czego zależy wartość i położenie obszaru krytycznego?

Wielkość od wielkości wartości krytycznej (Uα), a odchylenie od wielkości poziomu istotności α, im większe α tym mniejszy obszar krytyczny. Położenie od stosowanego testu zgodności, np. przy rozkładzie normalnym jest dwustronny, a przy rozkładzie χ prawostronny. Położenie zależy też od rodzaju weryfikowanej hipotezy – lewostronnej, prawostronnej i obustronnej.

9. Wypisz hipotezy, które można weryfikować testem T-studenta. Jakie założenia należy przyjąć o populacjach generalnych?

Ho:u=u0 – populacja ma rozkład normalny o nieznanych parametrach, mała próba

Ho:u1=u2 – mała próba, wariancje jednakowe

10. Podać cechy dobrego estymatora.

- nieobciążony – przy wielokrotnym losowaniu próby średnie z wartości przyjmowanych przez estymator nieobciążony równa jest wartości szacowanego parametru;

- efektywny – najefektywniejszy jest ten, który ma najmniejszą wariancję;

- dostateczny (wystarczający) jeżeli do jego konstrukcji użyto wszystkie elementy próby;

- zgodny – jeśli wraz ze wzrostem wartości próby wartość estymatora jest bliższa wartości estymowanego parametru. Jeżeli dla każdego ε>0 lim P{<θα z daszkiem - θ>≤ε}=1 to θ jest estymatorem zgodnym. Jeżeli rozpatrujemy próby (n->rośnie) Es zgodny – jego wartość pokrywa się z wartością nieznaną.

11. Jaka jest interpretacja współczynnika korelacji i regresji jakie wartości mogą przyjmować te parametry?

Współczynnik korelacji określa siłę zależności między zmiennymi. Współczynnik regresji mówi o ile wzrośnie zmiana zależności, jeżeli zmienna niezależna zmieni się o 1.

xy∈(-1,1)

12. Jeżeli rozkład ma częstość empiryczną sukcesu w dużych próbach, jakie są parametry tego rozkładu?

Ma rozkład normalny o parametrach: µ – wartość oczekiwana i σ - odchylenie standardowe.

13. Omówić definicję prawdopodobieństwa.

- klasyczna – prawdopodobieństwo zdarzenia A jest to stosunek zdarzeń sprzyjających temu zdarzeniu, do ilości wszystkich zdarzeń elementarnych.

- aksjomatyczna – niech Ω będzie daną przestrzenią zdarzeń elementarnych. Jeżeli każdemu zdarzeniu A przestrzeni Ω zostanie przyporządkowana dokładnie jedna liczba P(A) spełniająca warunki P(A)≥0; P(Ω)=1 dla każdej pary wyłączających się zdarzeń A,B P(AB)=P(A)+P(B) to mówimy, że na zdarzeniach przestrzeni Ω zostało określone prawdopodobieństwo zdarzenia A, warunki nazywamy aksjomatami

- statystyczna – jeżeli przy wielorakiej realizacji doświadczeń w wyniku których może wystąpić zdarzenie A, częstość tego zdarzenia wyraża wyraźnie prawidłowość, oscyluje wokół pewnej nieznanej liczby, jeżeli wahania częstotliwości przejawiają tendencję malejącą w miarę wzrostu liczby doświadczeń, to liczba P nazywa się prawdopodobieństwem zdarzenia A.

14. Cechy rozkładu normalnego.

Symetryczny względem prostej x=u; osiąga jedno maximum w punkcie, ma dwa punkty przecięcia dla x=u - σ i u + σ; EX=u=Ho. Dowód na jego symetryczność jest określony do zera dla x do +∞ i -∞. Przekształcenie standaryzacja prowadzi do powstania innego rozkładu normalnego.

15. O czym informują kwantyle i mediany w próbie?

Kwantyle dzielą uporządkowaną rosnąco zbiorowość na 4 części liczące po 25% obserwacji środkowej. Dla zmiennej losowej ciągłej mediana dzieli pole pod wykresem na dwie równe części.

16. Co to jest obszar krytyczny, od czego zależy jego wielkość i położenie pod krzywą rozkładu statystyki testowej?

Jest to taki obszar przestrzeni próby, że jeśli wynik prób znajduje się w tym obszarze to sprawdzoną hipotezę zerową odrzucamy, jeśli natomiast wynik próby znajduje się poza tym obszarem to hipotezę Ho przyjmujemy (nie odrzucamy).

17. Podaj interpretację parametru współzmienności zmiennej losowej dwuwymiarowej.

Współczynnik determinacji exy mówi nam w jakiej części wartości jednej zmiennej jest zdeterminowana wartość drugiej zmiennej.

Współczynnik regresji βxy mówi o ile wzrośnie zmiana zależności jeżeli zmienna niezależna zmieni się o 1.

18. Co można powiedzieć o zmiennej w próbie jeśli wszystkie miary przyjmują tę samą wartość?

Jeżeli wszystkie miary przyjmują tę samą wartość to znaczy, że brak jest zróżnicowania w próbie, czyli wszystkie wartości cechy są jednakowe.

19. Dlaczego w testach istotności nie przyjmujemy Ho?

W testach istotności uwzględnia się tylko prawdopodobieństwo α popełnienia błędu 1 rodzaju. Pomija się przyjęcie hipotezy fałszywej(błędu II rodzaju β) nie mówi się o przyjęciu tej hipotezy, ale o tym, że wyniki danej próby nie dają podstaw do jej odrzucenia. Jeżeli wynik znajduje się na obszarze krytycznym odrzuca się Ho, a prawdziwa jest H1, bo w pewnych testach możliwe jest określenie prawdopodobieństwa β popełnienia błędu II rodzaju. Można zatem w pewnych przypadkach, po określeniu obszaru krytycznego dla wartości α wyznaczyć prawdopodobieństwo takiego błędu.

20. Rozkład normalny.

Określony jest przez swoje parametry: µ i σ; funkcja jest zbieżna do 0 dla -∞; +∞; podlega prawu trzech sigm; symetryczny względem prostej przechodzącej przez µ; funkcja rozkładu posiada jedno maximum lokalne µ0, które pokrywa się z wartością oczekiwaną (EX); każdy rozkład normalny X:N(µ,σ) można sprowadzić do postaci tzw. standaryzowanego rozkładu normalnego, którego funkcja gęstości i dystrybuanta została stablicowana (µ=0 σ=1)⇒N(0,1); wykresem funkcji gęstości rozkładu normalnego jest krzywa Grensa symetryczna względem prostej o równaniu x=µ z dwoma punktami przegięcia µ-σ i µ+σ

21. Podać interpretację parametrów współzależności zmiennej losowej.

1. Kowariancja cos(xy) – moment centralny II rzędu jest równa zeru, jeśli zmienne x, y niezależne – wartość liczbowa jest nieistotna

CXY=EXY-EX-EY

jeśli jest różna od zera, jest zależność; kiedy jej wartość jest dodatnia to jedna zmienna wpływa na drugą pozytywnie (jeśli I rośnie to II też); kiedy jest ujemna: jedna wpływa na drugą i jej wzrost powoduje malenie II i na odwrót.

2. Współczynnik korelacji δxy: przyjmuje wartość z przedziału <-1,1>; jest ujemna kiedy korelacja δxy=cov(x,y)/DXDY; określa natężenie zależności między dwiema zmiennymi lub jej brak; im bliżej –1 lub 1, tym większe natężenie zależności; kiedy równe O, to brak zależności.

22. Jak zmienia się długość przedziału ufności dla prawdopodobieństwa sukcesu, gdy liczebność próby wzrośnie o...?

Kiedy n(liczebność próby) rośnie, to długość przedziału maleje o tyle samo.

23. Jaki rozkład ma średnia arytmetyczna próby? Czy jej rozkład zależy od rozkładu cechy w populacji?

24. W pewnej próbie δ=0,5 a stosunki korelacji są równe 0,7 i 0,8 (e=x,y) jak można zinterpretować ich wartość?

δ=0,5 – zależności pozytywne i słabe; exy=0,7 i exy=0,8 zmienna X i Y wpływają na siebie nieznacznie (słabo).

weryfikalne – zerowe

nie weryfikalne - alternatywne

25. Zmienna losowa

Funkcja, która przyporządkowuje wartości liczbowe zdarzeniom elementarnym, Xi:Pi; X-wartości zmiennej losowej, i-kolejność, P-prawdopodobieństwo wystąpienia. Funkcja rozkładu prawdopodobieństw – przypisanie p polejnym zmiennym losowym - rozkład zmiennej losowej.

26. Zmienna losowa skokowa

cechy jakościowe, zbiór przeliczalny (skończony lub nie)

27. Zmienna losowa ciągła

cechy ilościowe, zbiór liczb rzeczywistych

28. Wartość oczekiwana

mówi czego możemy się spodziewać po danym rozkładzie; moment zwykły I-rzędu m1=EX, m1=∑x1p1. Odchylenie standardowe – rzeczywiste odchylenia od wartości oczekiwanej.

29. Rozkład Bernoulliego

Zmienna losowa ma rozkład dwumianowy, jeśli przyjmuje wartości k=0,1,2...n z prawdopodobieństwem określonym wzorem. Parametrem tego rozkładu jest n-liczba doświadczeń, p-prawdopodobieństwo sukcesu. Rezultatem doświadczenia może być A-sukces lub A’ porażka. Doświadczenie to powtarzamy wielokrotnie (n) tak, że prawdopodobieństwo sukcesu pozostaje w pojedynczych próbach stałe i równe p. Liczba zaobserwowanych sukcesów to k=0,1,2,...,n EX-np. D2X-np.(1-p)

30. Ho o niezależności

dotyczy dwóch cech w jednej próbie, kiedy między zmiennymi jest brak zależności.

31. Ho o zgodności

zmienna ma rozkład zgodny z określonym rozkładem teoretycznym. Wtedy Ho: x – rozkład normalny, Bernouliego, Possona. Zmienna ma jednakowy rozkład w dwóch populacjach. Wtedy Ho; Xα ma rozkład jak X. Do weryfikacji używa się testu tylko χ2 I- rozkład empiryczny, II-rozkład teoretyczny (zakładamy, że Ho jest prawdziwe). Test χ2 o niezależności.

Test χ2 o zgodności. Próba z jednej populacji musi być dwuwymiarowa. Przy odrzuceniu hipotezy – dwie zmienne mogą być zależne istotne lub wysokoistotne.

32. Do czego służą testy statystyczne?

Służą do weryfikacji hipotez, czyli do wnioskowania o postawionej hipotezie statystycznej (Ho) na podstawie danych, które prowadzą do jednego z dwóch wniosków:

1. wniosek Ho kwestionujemy, czyli odrzucamy

2. Ho nie odrzucamy a tym samym uznajemy za prawdziwe.

33. Jakie dwa rodzaje błędów grożą przy weryfikacji hipotezy?

1. jeśli Ho odrzucamy, jesteśmy narażeni na błąd 1-go rodzaju polegający na odrzuceniu hipotezy prawdziwej wyrażony przez α poziom istotności

2. jeśli Ho nie odrzucamy, narażeni jesteśmy na błąd II-go rodzaju, który polega na nie odrzuceniu hipotezy fałszywej

1. Dlaczego statystyka matematyczna ma różne zastosowanie w różnych dziedzinach działalności praktycznej i naukowej?

Statystyka służy do w miarę wiarygodnego wnioskowania o prawidłowościach zjawisk na podstawie reprezentatywnych danych z empirycznych obserwacji tych zmiennych z różnych dziedzin.

Możemy wyciągać wnioski z danych zbieranych w zjawiskach masowych, biologicznych, technologicznych i zastosować metody statystyczne do planowania czynnikowych zjawisk technologicznych oraz ilustrować metody na rzeczywistych przykładach z badań naukowych. Statystyka modeluje nam pewne zjawiska deterministyczno - losowe; zwiększamy wiarygodność wniosków. Przydatna tam gdzie wnioskujemy z danych.

*Działy badawcze (naukowcy)opis nieznanych prawidłowości

*Można wnioskować z danych o pogodzie.

2.Czym zajmuje się statystyka matematyczna i dlaczego ma zastosowanie w badaniach experymentalnych?

1)Modelowanie matematycznych zjawisk badawczych, empirycznych

2)Zasadami wnioskowania o prawidłowości zjawisk przy użyciu rachunku prawdopodobieństwa na podstawie danych obserwacyjnych

Ułatwia prace badawcze i obiektywne wnioskowanie z danych.

3.Jakie znaczenie mają zmienne losowe w statystyce matematycznej?

Opis wniosków zjawisk masowych, które z natury rzeczy nie są w pełni kontrolowane.

Zmienna losowa – niekontrolowana wielkość, której wartość pojawia się poza naszą wolą z określonym prawdopodobieństwem. Zmienna losowa powstaje w wyniku przyporządkowania każdemu zdarzeniu elementarnemu liczby rzeczywistej. Rozróżniamy:

*Zmienne jakościowe (np. kategorie surowca do sprzedaży)

*Zmienne ilościowe, skokowe (np. liczba bakterii w próbce surowca)

*Zmienne ilościowe, ciągłe (np. zaw. wit. C w mrożonce)

4.Sposoby wnioskowania statystycznego

Związane z analizą regresji. Wnioskowanie odbywa się 1 z 2grup metod:

1)Estymacja, szacowanie parametrów rozkładów prawdopodobieństw zmiennych losowych w populacji

2)Stawianie i weryfikacja hipotez statystycznych.

5.Czym różnią się metody statystyczne spośród wszystkich metod analizy danych?

*Pobieranie próby losowo

*Metody oparte na rachunku prawdopodobieństwa – wnioskowanie z danych zbieranych w empirycznych badaniach zjawisk masowych.

*Dane reprezentatywne, na których opierają się pewne prawidłowości zjawisk w sposób fragmentaryczny.

*Dane obarczone efektami przyczyn losowych

*Trzeba wykonać dużą liczbę doświadczeń z różnymi czynnikami i w różnych warunkach

*Wnioski i prawa wyprowadzono z analizy danych

*Prawidłowość tych wniosków jest tylko kwestią prawdopodobieństwa-bardzo dużego (0,95), ale nie pewności.

6.Do czego służy analiza regresji wielokrotnej?

Służy do statystycznego badania zależności przyczynowo-skutkowej, do oceny wpływu, jaki mają n zmienne przyczynowe, ilościowe X na zmienną skutkową, cechę Y.

Analiza regresji wielokrotnej jest oparta na funkcji regresji, która jest funkcją wielu zmiennych. Zmienne przyczynowe są od siebie zależne.

Cel analizy regresjiczy wszystkie uwzględnione zmienne faktycznie wpływają na analizie i w jaki sposób.

Analizę regresji dzielimy na 2 etapy:

1)Estymacja parametrów

2)Weryfikacja cząstkowych hipotez

W analizie tej weryfikuje się następującą hipotezęHo:b1=….bk=0.Wszystkie cząstkowe współczynniki regresji=0

Gdy Ho prawdziwa – funkcja regresji stała, zmienna X nie ma wpływu na funkcję

Gdy Ho odrzucamy – minimum 1 ze zmiennych przyczynowych wpływa na funkcję.

Dane obserwacyjne są podstawą do zastosowania metody najmniejszych kwadratów.

Współczynnik determinacji R2 – oszacowanie regresji, wykazuje struktury całkowitej zmienności.

Przyjmuje wartość przedziału (0,1),im bliższe 1,tym w większym stopniu zmienność zależy od zależności X od Y.

Współczynnik determinacji prostej określa 0-100% wyjaśnionej zmienności zmiennej zależnej Y przez liniowy model regresji prostej. Jest to miarą zależności zmiennych losowych X i Y. Jeżeli funkcja regresji jest liniowa, to współczynnik determinacji = kwadratowi współczynnika korelacji.

7.Podać 2 przykłady problemów, w których może być zastosowana analiza liniowej regresji wielokrotnej.

Xi – liczba zmiennych przyczynowych niezależnych

Y- zmienna zależna skutkowa

*Ilość skrobi (X1), oleju (X2), temp. wytwarzania (X3)gęstość majonezy (Y)

*Ilość koncentratu(X1), ilość papryki (X2), stężenie CO2 (X3)gęstość ketchupu(Y)

*Czas(X1), temp. przechowywania (X2), stężenie CO2(X3) ubytek s.m.(Y)

Funkcja: E(Y/X1…Xk)=my(X1…Xk)=βo1X1kXk

8.Podać 2 przykłady problemów naukowo-badawczych, wdrożeniowych lub praktycznych z technologii żywności, w których może być zastosowana metoda analizy regresji wielokrotnej.

Regresja – związek ukierunkowany

1)Zależność średniej masy jaj od masy nioski i ilość jaj zniesionych rocznie.

2)Zależność zawartości skrobi w ziemniakach od pola i rodzaju użytego nawozu.

9.Przykład prób naukowo-badawczych, w których można zastosować analizę regresji prostej.

Służy do oceny zależności przyczynowo-skutkowej między 1 zmienną przyczynową i 2 zmienną skutkową. 2 zmienne mają charakter losowy oraz ilościowy.

*Ocena zależności- zmienny skład tłuszczu w mleku =Y. Zmienna przyczynowa (ilościowa)-odmiana bydła =X

*Dawka nawożenia azotem =X. Twardość ziarna pszenicy =Y

*Ocena zależności między czasem zbioru truskawek, a momentem rozpoczęcia technologii ( np.5h), 1 zmienna, to czas zbioru, a 2 zmienna, to T, transport, metody składowania.

*Ilość skrobi w dżemie-1 zmienna, zawartość cukru-2 zmienna.

10.Czym się zajmuje doświadczalnictwo?

Jest to dziedzina interdyscyplinarna, obejmująca przede wszystkim problemy czysto statystyczne. Jest często traktowane jako gałąź statystyki matematycznej (np. nauki przyrodnicze).

Przedmiotem zainteresowań doświadczalnictwa są:

*Statystyczne planowanie doświadczeń w różnych warunkach przyrodniczych oraz sposób poza doświadczalnego pozyskiwania danych o przyczynach i przebiegu zjawisk doświadczalnych.

*Sprawdzanie oryginalnych metod statystycznych oraz dokonanie upowszechnienia ich zastosowania w analizie i interpretacja wyników doświadczalnych i innych danych reprezentatywnych dla badanej prawidłowości

*Klasyczny rozwój doświadczalnictwa został skierowany na opracowywanie coraz lepszych metod umożliwiających badanie wpływu czynników z minimalnym błędem losowym.

11.Napisać ogólną postać liniowej regresji wielokrotnej, dla 4 zmiennych przyczynowych.

E(Y/X1, X2, X3, X4)= bo+b1X1+b2X2+b3X3+b4X4

bo - stała regresji

bi - cząstkowy współczynnik regresji, jest miarą wpływu każdej zmiennej przyczynowej na zmienną skutkową. Wartość współczynnika regresji mówi o ile zmieni się Y, jeżeli X1zwiększymy o jednostkę.

12.Co to jest próba reprezentatywna?

Losowe pobranie z populacji jednostek doświadczalnych dla każdego poziomu badanego czynnika i zaobserwowanie na tych jednostkach wartości rozważanej cechy ilościowej.

13.Co to jest jednostka doświadczalna i hipoteza?

Jednostka doświadczalna – element rzeczywisty doświadczenia czynnikowego, do którego odnosimy zastosowanie danego poziomu czynnika i obserwację reagującej na ten poziom cechy ilościowej.

Przykład:

*Partia surowca dostarczonego przez konkretnego dostawcę

*Próbka surowca pobrana ze składu badanej tuszki

*Próbka produktu końcowego wyprodukowanego wg danej technologii.

Hipoteza – rozpatrując pewną populację generalną, której rozkład i parametry nie są znane, każde przypuszczenie określające ten rozkład lub jego parametry będziemy nazywali hipotezą statystyczną. Hipoteza statystyczna może się odnosić do kilku populacji generalnych. Hipoteza traktuje, że średnia zmiennej losowej w rozkładzie normalnym jest jakąś rozsądną liczbą.

14.Do czego służy analiza wariancji, przykłady zastosowania?

Wariancja – Miara rozrzutu, mówi o rozproszeniu wszystkich wartości zmiennej losowej wokół wartości średniej (jak bardzo od niej odbiegają).

Do obserwowania analizy danych z obserwacji pewnej zmiennej, planowanych, kontrolowanych, doświadczenia czynnikowego. Za jej pomocą można zweryfikować hipotezy zerowe. Opracowana przez Fishera, wymaga formalnego traktowania wyników doświadczeń czynnikowych. Traktowanie wyrażone jest w postaci równania – liniowego modelu ANOVA. Model ten traktuje każdą obserwację doświadczenia czynnikowego jako realizację zmiennej losowej o rozkładzie normalnym z jednakową wariancją σ2 określająca zmienna losową cechy przy danym poziomie czynnika. Umożliwia opracowanie danych statystycznych z doświadczeń czynnikowych.

Wnioskowanie – czy dany czynnik wpływa różnicująco na średnią wartość naszej zmiennej.

Model liniowy analizy wariancji dla wyników doświadczenia jednoczynnikowego uzyskanych w układzie losowym, ma postać: yij=mi+eij ; i=1, 2, …a; j=1, 2, …n

Przykłady:

*Przyczyna A-stopień wstępnego odwodnienia owoców; Przyczyna B - sposób suszenia owoców; Zmienna – cechy jakościowe produktu

*Czynnik A –metoda peklowania szynki; Czynnik B –sposoby peklowania; Cechy Y – cechy jakościowe, np. zawartość białka, soku.

15.Kiedy stosujemy układ całkowicie losowy, a kiedy układ losowanych bloków?

Układ całkowicie losowy – gdy jednostki doświadczalne są jednorodne (nie podlegają zmienności systematycznej warunków badanego zjawiska-warunków wegetacji roślin, chowu zwierząt). W doświadczeniu 1no czynnikowym liczba wszystkich jednostek wynosi an (poziomów - liczba poziomów czynnika, n- liczba powtórzeń). Układ polega na rozmieszczeniu wszystkich jednostek w doświadczeniu w sposób całkowicie losowy na obszarze doświadczalnym. W doświadczeniach technologicznych układ całkowicie losowy polega na wyborze i przygotowaniu jednostek doświadczalnych oraz poddaniu ich działaniu poziomów czynnika w taki sposób, aby został wykluczony błąd systematyczny (jednostki doświadczalne mogą być obciążone błędem systematycznym, gdy występują efekty brzegowe).

Losowanych bloków – stosuje się, gdy niejednorodność jednostek doświadczalnych wynika z występowania 1nokierunkowej zmienności systematycznej warunków wegetacji. Tu zmienność występuje zarówno na polu jak i w innych sytuacjach doświadczalnych. Zadaniem jest eliminacja wpływu zmienności systematycznej warunków doświadczenia na badaną cechę. Układ losowych bloków jest najprostszym układem blokowym, który pozwala eliminować efekty niejednorodności na badaną cechę. Polega on na takim grupowaniu jednostek w bloki, aby między blokami zaistniało zróżnicowanie systematyczne warunków (ujawniła się niejednorodność), zaś w obrębie bloków zmienność warunków na jednostkach była losowa.

Bloki – jednostki doświadczalne pogrupowane w zbiory, w każdym bloku jest a jednostek, każda jest losowo prezypożądkowana innemu poziomowi badanego czynnika.

16.Wyjaśnić zasady metody najmniejszych kwadratów, stosowanej w statystyce matematycznej.

Estymatorem Θ. wg najmniejszych □ parametru Θ, jest funkcja Θ = g(X1,X2…Xn), dla której zachodzi warunek E{(0.-0)2}=min., przy czym wartość oczekiwaną oblicza się wg wszystkich dopuszczalnych wartości różnic

Θ.-Θ przy przyjętym a priori ich rozkładzie. Powyższy warunek można sformułować za pomocą funkcji strat i za pomocą funkcji ryzyka. Wyznaczyć minimum w metodzie najmniejszych □ może być sformułowane jako minimum funkcji ryzyka R(Θ){[R(0)=E{(σ)}] przy kwadratowej funkcji strat. Polega na znalezieniu sumy najmniejszych kwadratów odchyleń standardowych znalezienie funkcji najdokładniej opisujących uzyskane wyniki.

CHOLESTEROL

Suma kwadratowych odchyleń jest tak dopasowana by była jak najmniejsza.

Średnie odchylenia zmiennej zależności (od regresji) są wynikiem działania zmiennych.

17.Do czego służy analiza korelacji?

Do badanie współzależności między 2 zmiennym losowymi o rozkładach normalnych. Polega na charakterystyce związku liniowego za pomocą współczynnika korelacji. Współczynnik korelacji prostej jest miarą kierunku (+/-) i stopnia ścisłości związku liniowego między zmiennymi losowymi X i Y.

Korelacja słaba – taka gdzie jest duża rozbieżność, punkty są rozproszone.

Korelacja silna – zmienna ściśle współzależna.

Korelacja dodatnia – jedno rośnie i drugie rośnie.

Korelacja ujemna – jedno rośnie, a drugie maleje.

Zmienna deterministyczna – kontrolowana.

Zmienna losowa – niekontrolowana.

Przykłady:

*Zależność między czasem nauki do egzaminy (X), a oceną z egzaminu (Y).

*Masa jabłka w kg (X), a zawartość s.m.(Y)

*Zawartość s.m.w bulwach ziemniaka (X), a zawartość skrobi(Y)

18.Co to jest współczynnik ufności?

Mierzy stopień zaufania do poprawności wnioskówprawdopodobieństwo poprawnego wniosku. Prawdopodobieństwo, z jakim przedział ufności jakiegoś parametru pokrywa nieznana wartość parametru.

1-α jest bliski 1 (0,9; 0,95; 0,99). Im wyższy współczynnik ufności, tym szerszy przedział ufności i mniejsza dokładność estymacji.

Przedział ufności - aby dokonać estymacji z jakimś przyjętym z góry dodatnim prawdopodobieństwem, należy w przestrzeni parametrów wyznaczyć pewien obszar, będzie to przedział ufności. Granice przedziału ufności są zmienne od próby do próby oraz 1-α jest prawdopodobieństwem pokrycia przez przedział szacowanego parametru. Konstruując przedział ufności przy danym stałym poziomie ufności możemy sądzić, że dla ok. 100 (1-α) % przypadków uzyskamy przedziały zawierające szacowany parametr.

19.Co to jest poziom istotności?

α - prawdopodobieństwo odrzucenia prawdy, prawdziwej H, dobrze gdy jest jak najmniejsze. Ryzyko błędu I rodzaju, że przedział ufności nie zawiera szacowanego parametru. Określa max ryzyko błędu, jakie badacz jest w stanie zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego, jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α=0,05; α=0,01. Im niższe α, tym niższa precyzja oceny, a większy przedział ufności.

20.Co to jest test statystyczny i moc testu statystycznego?

Test statystyczny – pewne narzędzie, postępowanie służące sformułowaniu wniosku o hipotezie. Służy do testowania hipotezy, do rozstrzygania o prawdziwości lub nie.

Hipoteza statystyczna – model matematyczny hipotezy merytorycznej.

Jeśli nie odrzucamy, nie stwierdzona zależności między badaną cechą a poziomem tego czynnika.

Moc testu – Zezwala na określenie kryterium wyboru procedury testowej przy weryfikacji hipotezy statystycznej. Test może być słaby lub mocny:

*Słaby – gdy istnieje duż szansa na to, że nie odrzucimy hipotezy zerowej, mimo jej nieprawdziwości.

*Mocny - w większości przypadków jesteśmy w stanie odrzucić fałszywą hipotezę zerową.

21.Do czego używamy test t-Studenta, 2 przykłady

1)Sprawdzenie hipotezy o różnicy dwóch populacji generalnych, o rozkładach normalnych

X1~N (µ1; σ12)

X2~N (µ2; σ22)

Postawimy H0: µ1= µ2, przy poziomie istotności α,

Jeżeli |temp|>tαHo odrzucamy (różnica miedzy średnimi jest istotna)

Jeżeli |temp|<tαHo nie odrzucamy

(weryfikując hipotezę musimy sformułować hipotezę alternatywną, która jest uznana za prawdziwą, gdy odrzucimy Ho)

1)Sprawdzenie, że średnia populacja równa się z góry przyjętej liczbie µ00=0, najczęściej)

Postawmy hipotezę Ho: µ= µ0, taką hipotezę sprawdza się zazwyczaj w badaniach przyrostu pewnych populacji w czasie,

np.przyrost masy zwierząt od hodowli t1, do hodowli t2

Założenie X1~N(µ; σ2)

Stawiamy hipotezę Ho: µ= µ0 i określamy poziom istotności α

Wyznaczamy statystykę temp = x.-µ0/Sx.

Rozkład t-Studenta ~Normalny, zależy od liczby stopni swobody, liczebności prób.

22.Jaka jest różnica między hipotezami parametrycznymi, a nieparametrycznymi?

H. parametrycznymi nazywamy hipotezy dotyczące takich parametrów populacji generalnej (jednej lub kilku), jak średnie, wariancja, wskaźnik struktury oraz parametrów populacji wielocechowych.

H. nieparametryczne, to hipotezy przy których stosuje się testy hipotez dotyczących rozkładów bez precyzowania lub bez parametrów. Rozróżniamy tu:

1,Hipotetyczny rozkład populacji generalnej jest przez hipotezę całkowicie określony

2,Hipoteza dotyczy tego rozkładu, ale parametry należy szacować z próby

3,Hipoteza dotyczy zgodności rozkładów dwóch lub kilku populacji generalnych

4,Hipoteza dotyczy niezależności elementów próby

23.Czym zajmuje się dział statystyki zwany estymacją?

Estymacja parametrów – opiera się na estymacji parametrów rozkładu normalnego, punktowy estymator daje oszacowanie w postaci 1 liczby.

Estymacja przedziałowa – tu stosujemy przedział ufności.

Zajmuje się oszacowaniem parametrów statystycznych (pewna charakterystyka zmiennej losowej

np.x € N (m,σ2) - parametry zmiennej losowej. Estymacja parametrów próby generalnej na podstawie elementów próby. Ocena rozkładu populacji wg danych z próby, przez szacowanie jej parametrów, pozwala na rozwiązywanie matematycznych problemów analizy, porównań i przewidywań wyników procesów masowych.

Przykład1: Ocena mleka dostarczonego

Mamy jednostkowe dostawy do pewnej mleczarni – dostawcy stanowią pewna zbiorowość, interesuje nas zawartość tłuszczu zmienna X.

Ocena średniej zawartości tłuszczu – bierzemy daną reprezentatywną i na tej podstawie szacujemy średnią arytmetyczną. Błąd standardowy średniej arytmetycznej Sx.=√s2/n.

Założenie: n= 50, liczba dostawców obserwowanych

x.= 3,25%, zawartość tłuszczu w mleku

Sx.= 0,15%

Średnią populacją szacujemy z próby 50 elementów, z przeciętnym błędem pomiaru 0,15%. Jest to dość dokładny pomiar. Średnia zawarta jest bliska 3, a raczej >3.

24.Jakie właściwości powinien mieć dobry estymator dla parametrów rozkładu zmiennej losowej?

*Nieobciążony – wartość oczekiwana wartości średniej powinna dać średnią arytmetyczną

*Zgodny – różnica dąży do 0

*Efektywny – im niższa wariancja, tym estymator powinien być bardziej efektywny.

*Dostateczny

*Zależny

25.Definicja błędu I i II rodzaju przy testowaniu hipotezy za pomocą testu statystycznego.

I. Rodzaju = poziom istotności testu = moc testu. Odrzucenie prawdziwej hipotezy, przy czym prawdopodobieństwo popełnienia błędu I rodzaju jest nazywane poziomem istotności.

II. Rodzaju polega na przyjęciu hipotezy zerowej, która jest fałszywa. Prawdopodobieństwo popełnienia błędu II, oznaczamy symbolem β

26.Jak posługujemy się regresją krokową?

Badanie zależności wpływu zmiennych X1, X2, …Xi na cechę Y:

Wykorzystujemy 2 opcje Backward i Forward

Y X1, X2,X3 - wybieramy zmienną która ma wpływ na Y

(Y,X1) (X2,X3) – z pozostałych wybieramy tą która najlepiej pasuje do Y,X1

(Y,X1,X2) X3 - jeśli X3 pasuje do Y,X1,X2, to dołączamy, jeśli nie, to usuwamy.

27.Własności estymatorów

Estymator – przybliżenie pewnej wartości, wartość średnia z próby. Estymatorem danego parametru populacji nazywamy określoną funkcję elementów próby g (x1, x2, …xn), spełniającą pewne kryteria optymalności. Postać estymatora zależy od tych elementów.

Dobry estymator zapewnia otrzymanie wyników z prób zbliżonych do rzeczywistości.

*Nieobciażoność – przy wielokrotnym losowaniu próby średnia z wartości przyjmowanych przez estymator nieobciążony = wartość szacowanego parametru. Wtedy odchylenia + i – nawzajem się niwelują ( nie maja tendencyjnego charakteru). Obciążenie estymatora – różnica miedzy wartością oczekiwaną rozkładu estymatora, a wartością szacowanego parametru jest zależna funkcyjnie od estymatora.

*Zależność – jeśli Tn jest zgodny, to jest asymptotycznie nie obciążony, twierdzenie odwrotne jest nieprawdziwe. Jeśli Tn jest nieobciążony i jego wariancja spełnia zależność Lim D2(Tn)=0, n∞, to Tn jest estymatorem zgodnym.

*Asymptotyczna nieobciążoność – estymator nazywamy asymptotycznie nie obciążonym, jeżeli obciążenie estymatora dąży do 0, przy rosnącej liczebności próby. Każdy estymator nie obciążony jest estymatorem asymptotycznie nie obciążonym.

*Zgodność – estymator jest zbieżny, gdy jest stachostycznie zbieżny do szacowanego parametru. Wtedy przez zwiększenie liczebności próby uzyskuje się coraz większe prawdopodobieństwo, że estymator będzie przyjmował wartości coraz bliższe wartości parametru ryzyko popełnienia dużego błędu jest niewielkie.

*Efektywność – dla najbardziej efektywnego estymatora =1, 0<e<1. Estymator najefektywniejszy ma najmniejszą wariancję.

*Dostateczność (wystarczalność) – dostateczny, gdy zawiera wszystkie informacje na temat parametru, jakie występują w próbie i żaden inny estymator nie może dać dodatkowych informacji. Estymator ten nie zawsze istnieje.

28.Do czego służą procedury porównań wielokrotnych i które z nich są preferowane?

Porównania wielokrotne – problem wyznaczania grup jednorodnych. Grupy jednorodne i podzbiór

(mi1, mi2,…mim) zbioru wszystkich średnich obiektowych {m1, m2,…mn}, tak, że m1= m2=…=mn oraz żadne z pozostałych średnich nie jest równe mi1.

rodzaje procedur porównań wielokrotnych:

1)Jednoczesne przedziały ufności (Tukey, Scheffego)

2)Testy wielokrotne (Ducana, Neumana –Keulsa)

3)Metody analizy skupień (Carsterna, Colińskiego)

Każda procedura umożliwia uzyskanie podziału prawdziwych średnich obiektowych na grupy jednorodne opierając się tylko na ocenach tych średnich z próby (wyników doświadczenia). Procedura ta ma dawać podziały najbliższe rzeczywistym podziałom na grupy jednorodne.

Służą do badań szczegółowych, umożliwiają uzyskanie podziału prawdziwości średnich obiektowych na grupy jednorodne opierając się tylko na ocenach tych średnich z próby. Powinny dawać podziały najbliższe rzeczywistym podziałom na grupy jednorodne.

Najczęściej stosowane w doświadczalnictwie – grupy porównań wielokrotnych:Ducana (najprostsze), Tukeya, Newmana (najlepsze). Wszystkie są rozwinięciem procedury opracowanej przez Fishera, a opartej na teście t-Studenta.

Kryterium skuteczności - prawdopodobieństwo dokonywania prawidłowego –zg.z rzeczywistością podziału na grupy jednorodne.

29.Doświadczenie czynnikowe

Wykonanie pewnego zjawiska w warunkach kontrolowanych oraz obserwowanie tego zjawiska pod wpływem poziomów badanego czynnika lub wielu czynników.

Przykład:

*nawóz azotowy zbóż (czynnik) wpływa na twardość ziarna, zawartość białka.

Test istotności – test skonstruowany w ten sposób, że pomijamy problem błędu II, a jedynie ustalamy poziom istotności, czyli prawdopodobieństwo błędu I rodzaju.

Charakterystyka liczb zmiennych:

*Średnia (wartość oczekiwana, czasem nie jest realizowana) – jest średnią z nieskończenie wielu możliwych realizacji zmiennych losowych, można ją oszacować na podstawie danych eksperymentalnych.

*Średnia arytmetyczna z wyników arytmetycznych jest oszacowaniem średniej populacyjnej. Wartością oczekiwaną średniej arytmetycznej jest średnia populacji.

Błąd standardowy średniej z próby - miara szacowania dokładności średniej z populacji. Im mniejsza wariancja, tym dokładność szacowania rośnie.

*Wariancja (zakres zmienności) zmiennej losowej, liczba charakteryzująca zmienność zbioru, jej wartość wokół wartości średniej. D2X – średni kwadrat odchyleń średniej wartości liczb.

Im większa liczebność próby, tym wariancja średniej arytmetycznej zmniejsza się.

*Odchylenie standardowe (do oceny zmienności zmiennej) pierwiastek z wariancji. Średnie odchylenie wartości zmiennej losowej od jej średniej. Liczba charakteryzująca rozrzut zbioru wokół średniej.

Elementy filozofii statystycznej

Czynnik – przyczyna

Cecha ilościowa - zmienna zależna obrazuje wyniki doświadczenia

Poziom czynnika (obiekt) - trzeba ustalić konkretne parametry

Doświadczenie – postępowanie zmierzające do zaistnienia pewnego zjawiska w warunkach kontrolowanych oraz zebranie danych o jego przebiegu i wynikach końcowych.

Jednostka doświadczalna - umówiony element materialny, ustalona liczba surowca. Nie są one identyczne.

Rozkład normalny – przekształcenie liniowe zmiennej o rozkładzie normalnym

30.Co to jest zmienna losowa? Czym różni się zmienna losowa od losowej skokowej?

Zmienna losowa(cecha)- Funkcja o wartościach rzeczywistych określona na zbiorze zdarzeń elementarnych. Jest to zmienna, która przyjmuje różne wartości liczbowe, wyznaczone przez los.

Zmienna losowa skokowa (dyskretna) jest to zmienna, której zbiór wartości jest skończony lub przeliczalny.

Jeżeli x1 oraz x2 są kolejnymi wartościami zmiennej losowej skokowej, to nie przyjmuje ona żadnych wartości między x1 i x2.

Przykłady: wynik rzutu kostką, liczba bakterii, liczba studentów w grupie, liczba pracowników.

Zmienna losowa ciągła jest to zmienna przyjmująca wszystkie wartości z pewnego przedziału (najczęściej zbioru liczb rzeczywistych).

Jeżeli x1 oraz x2 są dwiema wartościami zmiennej losowej ciągłej, to może ona przyjąć dowolną wartość między x1 i x2.

Przykłady: wzrost, ciężar paczki towaru, wydajność pracowników.

Rozkład zmiennej losowej

Zbiór wartości zmiennej losowej oraz prawdopodobieństwa, z jakimi są te wartości przyjmowane.

31. Co to jest wariancja zmiennej losowej? Podać wzór przy pomocy którego na podstawie wyników próby uzyskujemy estymator wariancji. Wyjaśnij użyte symbole.

Zad 29, wariancja (inaczej dyspersja) zmiennej losowej X, jest sumą kwadratów odchyleń od wartości średniej. Wariancję dla zmiennej losowej oblicza się według wzoru


$$D^{2}\left( X \right) = \sum_{i = 1}^{n}{(x_{i}} - m)^{2}p_{i}$$

32.Cecha X ma rozkład normalny standaryzowany? Co to oznacza? Podać odpowiedni wzór na standaryzację zmiennej oraz podać jej wartość średnią, wariancję i odchylenie standardowe.

Standaryzacja ma swoje uzasadnienie w tym, że tylko rozkład normalny standaryzowany jest tablicowany. Każdą zmienną losową X o dowolnym rozkładzie normalnym można doprowadzić do tzw. Zmiennej standaryzowanej U, która posiada rozkład mormalny o wartości średniej zero oraz wariancji równej 1 N(0;1). Przekształcenia zmiennej losowej X w zmienną losową standaryzowaną U dokonuje się za pomocą wzoru:


$$U = \frac{X - m}{\sigma}$$

33, Prawo 3 sigm.

Reguła 3 sigm w statystyce wykorzystywana jest do eliminacji obserwacji „mało wiarygodnych” za które uznaje się takie, których wartości znacząco różnią się od wartości średniej o więcej niż trzy odchylenia standardowe. Wartość zmiennej losowej istotnie odbiegające od wartości średniej można tłumaczyć tym, iż mogą one być skutkiem popełnianych błędów w trakcie pomiarów lub też błedami powstałymi w trakcie przeprowadzania obserwacji.

Reguła trzech sigm posiada duże znaczenie przede wszystkim w statystycznej kontroli jakości.

34.Co to jest hipoteza statystyczna (zerowa) i na czy polega weryfikacja takiej hipotezy statystycznej? Wyjaśnić na przykładzie.

Hipoteza statystyczna jest to przypuszczeniem dotyczące; wartośći parametru populacji generalnej lub rodzaju rozkładu cechy w populacji generalnej lub też współzależności cech w populacji generalnej.

Zmienna losowafunkcja przypisująca zdarzeniom elementarnym liczby. Intuicyjnie: odwzorowanie przenoszące badania prawdopodobieństwa z niewygodnej przestrzeni probabilistycznej do dobrze znanej przestrzeni euklidesowej. Zmienne losowe to funkcje mierzalne względem przestrzeni probabilistycznych.

Zmienną losową jest na przykład funkcja opisującą wagę lub wzrost ciała wylosowanego z pewnej populacji osobnika. Zjawiskom o charakterze losowym, którym nie można w oczywisty sposób przypisać jakiejś miary liczbowej, można przypisywać liczby według pewnego klucza tak, aby możliwe było ich porównywanie w interesującym nas aspekcie. Najprostszymi przykładami są: moneta (np. orłu przypisujemy zero, a reszce jedynkę) i kostka do gry (każdej ściance przypisujemy liczbę wylosowanych oczek). Innymi przykładami mogą być: stan techniczny urządzenia, czy wiedza ucznia (oceniana w skali od 1 do 6).

Rozkład prawdopodobieństwa(zmienna skokowa) – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na zbiorze wartości zmiennej losowej (wektora losowego) i pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.

Definicja Rozkładem prawdopodobieństwa nazywa się dowolną miarę probabilistyczną określoną na σ-ciele podzbiorów borelowskich pewnej przestrzeni polskiej. Zwykle jest nią zbiór liczb rzeczywistych (tzw. rozkład jednowymiarowy) lub przestrzeń euklidesowa dla pewnej dodatniej liczby naturalnej (rozkład wielowymiarowy).

Dyskretny rozkład prawdopodobieństwa to w probabilistyce rozkład prawdopodobieństwa zmiennej losowej dający się opisać przez podanie wszystkich przyjmowanych przez nią wartości, wraz z prawdopodobieństwem przyjęcia każdej z nich. Funkcja przypisująca prawdopodobieństwo do konkretnej wartości zmiennej losowej jest nazywana funkcją rozkładu prawdopodobieństwa (probability mass function, pmf). Zachodzi:

gdzie u przebiega zbiór możliwych wartości zmiennej X

Jeśli zmienna losowa jest dyskretna, wówczas zbiór wszystkich wartości, które przyjmuje z niezerowym prawdopodobieństwem jest skończony lub przeliczalny, gdyż suma nieprzeliczalnie wielu dodatnich liczb rzeczywistych jest zawsze rozbieżna do nieskończoności.Zwykle ten zbiór przyjmowanych wartości jest topologicznie zbiorem izolowanych punktów. Istnieją jednak zmienne dyskretne, dla których zbiór przyjmowanych wartości jest zbiór gęsty.Równoważnie dyskretną zmienną losową można zdefiniować jako zmienną losową, której dystrybuanta jest funkcją schodkową:

, rozkład dwumianowy, rozkład dwupunktowy, rozkład geometryczny są najbardziej znanymi rozkładami dyskretnymi.

Ciągły rozkład prawdopodobieństwa - rozkład prawdopodobieństwa dla którego dystrybuanta jest funkcją ciągłą. Stosowana jest też węższa definicja, przedstawiona poniżej w sekcji bezwzględna ciągłość.

Dla rozkładów ciągłych suma nieskończonej liczby zdarzeń o zerowym prawdopodobieństwie może być zdarzeniem o dodatnim prawdopodobieństwie. Obrazowo - pojedynczy punkt ma zerowe rozmiary, jednak odcinek złożony z nieskończonej liczby takich punktów ma już niezerową długość. Podobe zjawisko nie zachodzi dla rozkładów dyskretnych..

Dystrybuanta(zmienna ciągła) – w rachunku prawdopodobieństwa, statystyce i dziedzinach pokrewnych, funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej[1]), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa ponieważ, są obiektem prostszym niż rozkłady prawdopodobieństwa. Dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną. Jest ona blisko związana z pojęciem rangi.

Wartość oczekiwana (przeciętna, średnia), nadzieja matematyczna – w rachunku prawdopodobieństwa wartość opisująca spodziewany (średnio) wynik doświadczenia losowego. Wartość oczekiwana to inaczej pierwszy moment zwykły. Estymatorem wartości oczekiwanej rozkładu cechy w populacji jest średnia arytmetyczna.

Rozkład dwumianowy (zmienna skokowa) (Zwany także rozkładem Bernoulliego) to dyskretny rozkład prawdopodobieństwa opisujący liczbę sukcesów w ciągu N niezależnych prób, z których każda ma stałe prawdopodobieństwo sukcesu równe p. Pojedynczy eksperyment nosi nazwę próby Bernoulliego.
Prawdopodobieństwo p(k) uzyskania dokładnie k sukcesów w N próbach wynosi:
p(X=k) = {N choose k} cdot p^k cdot q^{N-k}; qquad k = 0, 1, 2, dots, N, q = 1-p
Wartość oczekiwana rozkładu dwumianowego: EX=p*N
Wariancja: D^2X=p*q*N
Funkcja charakterystyczna: phi_X(t)=(pe^{it}+ q)^N
Innym rozkładem, który opisuje ilość sukcesów w ciągu N prób, jest rozkład hipergeometryczny. W tym przypadku jednak próby nie są niezależne (próba bez zwracania).
Jeśli X ~ B(n, p) i Y ~ B(m, p) są dwiema niezależnymi zmiennymi losowymi o rozkładzie dwumianowym, wtedy ich suma X + Y jest zmienną losową o rozkładzie dwumianowym danym wzorem:

Rozkład normalny(zmienna ciągła), zwany też rozkładem Gaussa, lub krzywą dzwonową, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.Przyczyną jest jego popularność w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników, jej rozkład będzie zbliżony do normalnego[2], stąd można go bardzo często zaobserwować w danych[3]. Ponadto rozkład normalny ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są dość proste obliczeniowo[4].

Standaryzacja jest w statystyce rodzajem normalizacji zmiennej losowej, w wyniku której zmienna uzyskuje średnią wartość oczekiwaną zero i wariancję jeden.

Najczęściej spotykanym sposobem standaryzacji jest tzw. standaryzacja Z, którą można wyrazić poniższym wzorem:

gdzie:

x - zmienna standaryzowana

σ - odchylenie standardowe populacji

μ - średnia z populacji.

Bardziej złożone metody standaryzacji zmieniają dodatkowo rozkład zmiennej na normalny.

Rozkład prawdopodobieństwa – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na zbiorze wartości zmiennej losowej (wektora losowego) i pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.Rozkładem prawdopodobieństwa nazywa się dowolną miarę probabilistyczną określoną na σ-ciele podzbiorów borelowskich pewnej przestrzeni polskiej. Zwykle jest nią zbiór liczb rzeczywistych (tzw. rozkład jednowymiarowy) lub przestrzeń euklidesowa dla pewnej dodatniej liczby naturalnej (rozkład wielowymiarowy).

1.Podaj postać funkcji testowej dla weryfikacji hipotezy Ho:p1=p2. Wyjaśnij symbole.

2.Podaj postać funkcji testowej dla weryfikacji hipotezy Ho:p=p0

3.podaj postać funkcji testowej dla weryfikacji hipotezy Ho:m1=m2

4.podaj postac funkcji testowej dla weryfikacji hipotezy Ho:m=m0

5.podaj postać funkcji testowej dla weryfikacji hipotezy

6.Co to jest test statystyczny, przykład, do czego jest wykorzystywany

Test statystyczny-funkcja służąca weryfikacji hipotezy, sprawdzenia przypuszczeń wysuniętych w stosunku do parametrów lub rozkładu populacji generalnej.

7.Na podstawie badań otrzymano przedział ufności dla różnicy dwu średnich postaci(2,25;2,45) Czy można uznać, że średnie różnią się i dlaczego.

Średnie się różnią Ponieważ w przedziale ufności nie zawiera się 0

8.Jak zmieni sie długość przedziału oszacowania średniej populacji jeśli zwiększymy poziom istotności

to poziom ufności się zmieniejszy i prawdopodobieństwo sie zmniejszy

9.Jak zmieni sie długość przedziału średniej populacji jeśli zwiększymy poziom ufności

to zmniejszy się poziom istotności i zwiększy prawdopodobieństwo

(im większa liczebności próby tym mniejszy przedział ufności)

10.Jakim testem można zweryfikować hipotezę równości wariancji w dwóch populacjach

rozklad F Fishera

11.Co to jest tablica asocjacji?

12.Jakim testem- podaj postać i warunki jakie powinny być spełnione przy weryfikacji Ho:m1=m2. Podaj postać funkcji testowej.

t Studenta Wariancje sa jednakowe dla obu populacji, musi być rozkład normalny, i nie wiemy jakie sa parametry dla obu populacji.

13.Estymatory punktowe i przedziałowe- przykłady

Estymacja punktowa: przyjmujemy ze wartość dla próby jest taka sama jak dla całej populacji przykład: Średnia arytmetyczna

Estymacja przedziałowa: to wyznaczenie przedziału , który z określonym prawdopo. będzie zawierał nieznaną wartość szacowanego parametru populacji

Przykład

14.Prawo 3 sigm.

Prawo sigm:

15.Co to jest indeks jednopodstawowy?

wartosci odnoszą sie do wartości z roku podstawowego

16.Miarą rozrzutu wartości zmiennej losowej wokół jej wartości oczekiwanej jest:

wariancja,odchylenie standardowe i przeciętne, rozstęp , współczynnik zmienności

17.Jaka jest różnica miedzy zmienna skokowa , a ciągłą. Podaj przykłady

Skokowa-przyjmuje określone wartości Zbiór wartość jest przeliczalny i skończony np liczba dzieci na wycieczce

Ciągła przyjmuje wartości z pewnego przedziału. Zbiór jest nieprzeliczalny i nieskończony. Przykład: Wzrost, waga

18. Jaki rozkład ma średnia arytmetyczna z 10-elementowej próby z populacji o rozkładzie N(10,4) =

19. Co to jest przyrost względny łańcuchowy

Przyrost absolutny podzielony przez wielkość zjawiska z okresu poprzedniego

20. Co to jest próba reprezentatywna?

To taka próba która oddaje cechy populacji, pod względem badanej cechy odzwierciedla populacje

21.Co to jest poziom ufności i poziom istotności?

Poziom ufności to prawdopodobieństwo z jakim przedział ufności zawiera szacowana wartość 1-α

Poziom istotności to prawdopodobieństwo z jakim przedział ufności nie zawiera szacowanej wartości. Czyli prawdopodobieństwo z jakim przedział nie jest właściwy.

22.Jakim testem można zweryfikować hipotezę Ho:m=m0

t Studenta

23. Błąd 1 i 2 rodzaju

24. Jak zmieni się przedział ufności dla średniej, jeśli zwiększymy liczebność próby?

Poziom ufności zmniejszy sie

25. Co to jest współczynnik korelacji?

Wspolczynnik korelacji - określa poziom zależności miedzy jedna cecha a druga. Przyjmuje wartość od -1 do 1

26. Co to jest tablica kontyngencji i jakie ma zastosowanie?\

przedstawia zestawienie dwóch wartości jakościowych bądź ujakościowionych

Przykład test niezależności Ukazuje niezależność 2 cech jakościowych lub ujakosciowinonych

27. Jakie warunki muszą być spełnione, by można było stosować test t-Studenta do weryfikacji H0: m1=m2?

Rozkałd normalny, Wariancje musza być równe, parametry tych populacji musza byc nieznane

28. Co to jest przyrost absolutny łańcuchowy?

Roznica miedzy wartością z roku badanego a wartością roku poprzedniego

29. Co to jest przyrost względny jednopodstawowy?

Jest to różnica miedzy wartością w roku badanym a wartości w roku podstawowym podzielona przez wartość roku podstawowego

30. Co to jest próba losowa?

Tzn ze została otrzymana w wyniku losowania prostego

31.Jak zmieni się długość przedziału ufności dla średniej, jeśli zmniejszy się liczebność próby?

Przedzial zwiększy sie

32.Co to jest współczynnik determinacji?

Wspolczynnik determinacji-to poziom jaki zmiana jednej cechy wpływa na zmianę drugiej cechy zawiera sie w przedziale od 0 do 1



Wyszukiwarka

Podobne podstrony:
statystyka wszystko, sggw, semestr III, statystyka
statystyka społeczna notatki ze wszystkich wykładów Błaszczak Przybycińska
TEST3(BONUS), ☆☆♠ Nauka dla Wszystkich Prawdziwych ∑ ξ ζ ω ∏ √¼½¾haslo nauka, Matematyka statystyka
TEST2(BONUS), ☆☆♠ Nauka dla Wszystkich Prawdziwych ∑ ξ ζ ω ∏ √¼½¾haslo nauka, Matematyka statystyka
TEST1(BONUS), ☆☆♠ Nauka dla Wszystkich Prawdziwych ∑ ξ ζ ω ∏ √¼½¾haslo nauka, Matematyka statystyka
Wszystkie testy, Semestr II, Statystyka matematyczna
Tablice statystyczne na wszystko, statystyka
testy wszystkie, UE KATOWICE ROND, I stopień, Statystyka
mechanika, Egzamin statystyka, Założenie jednorodności mówi, że we wszystkich punktach materiały kon
statystyka społeczna notatki ze wszystkich wykładów Błaszczak Przybycińska
TEST3(BONUS), ☆☆♠ Nauka dla Wszystkich Prawdziwych ∑ ξ ζ ω ∏ √¼½¾haslo nauka, Matematyka statystyka
Statystyka SUM w4
statystyka 3
Weryfikacja hipotez statystycznych
Zaj III Karta statystyczna NOT st
Metodologia SPSS Zastosowanie komputerów Brzezicka Rotkiewicz Podstawy statystyki
metody statystyczne w chemii 8

więcej podobnych podstron