Ordinarie tenta - Matematikcentrum
Transcription
Ordinarie tenta - Matematikcentrum
Matematisk statistik Matematikcentrum Lunds tekniska högskola Lunds universitet Tentamen: 2015–10–26 kl 800 –1300 FMS 086 — Matematisk statistik för B, K, N och BME, 7.5 hp MASB02 — Matematisk statistik för kemister, 7.5 hp Korrekt och väl motiverad lösning på uppgifterna 1–5 ger 10 poäng vardera medan delfrågorna på uppgift 6 ger 4 poäng vardera. Totalt kan man få 70 poäng. Gränsen för godkänd är 35 poäng, dock finns det vissa minimikrav på uppgifterna 1–5 (18p) respektive uppgift 6 (7p). Institutionens papper används både som kladdpapper och inskrivningspapper. Varje lösning skall börja överst på nytt papper. Rödpenna får ej användas. Tillåtna hjälpmedel: Matematiska och statistiska tabeller som ej innehåller statistiska formler, formelsamling matematisk statistik för bio- och kemitekniker, samt miniräknare. Resultatet förs in i LADOK senast måndag den 16 november i matematikhusets entréhall. Redovisa införda beteckningar; ange modeller, approximationer, hypoteser och slutsatser. Motivera alla antagande. Skriv anonymkoden (eller namn) på omslaget och SAMTLIGA inlämnade papper. 1. I en tillverkningsprocess fylls vätska på flaskor som sedan förpackas i kartonger om 24 flaskor. Varje flaska bör innehålla 330 ml vätska. För att ingen flaska ska innehålla för lite väljer man att överfylla flaskorna något, mängden vätska i varje flaska kan anses vara N 335, 52 -fördelad. (a) Vad är sannolikheten att en flaska innehåller mindre än 330 ml vätska? (5p) (b) Vad är sannolikheten att det i en kartong finns minst två flaskor med för lite vätska (mindre än 330 ml)? (5p) 2. Antibiotikaresistenta bakterier är ett växande problem för sjukvården. Baserat på data från hela landet kan antalet fall av antibiotikaresistenta bakterier antas vara Poissonfördelat med 1.17 förväntade fall per 100 patienter. På en avdelning noterar man 5 fall bland 100 patienter. Avgör, med ett lämpligt test, om avdelningen är särskilt utsatt. (10p) 3. En större ombyggnation av ett reningsverk har genomförts för att minska utsläppen av bl.a. fosfor. Mätningar av fosforhalter (mg/l) i det renade vattnet före och efter ombyggnation har gjorts men tyvärr finns ingen rådata kvar. Ur rapporterna kan man utläsa att 95%-iga konfidensintervall för fosforhalterna var: före ombyggnation: (0.28, 0.42) baserat på 15 mätningar. efter ombyggnation: (0.21, 0.29) baserat på 15 mätningar. (a) Antag att mätningarna är normalfördelade med okänd varians. Bestäm vilket medelvärde, x, standardavvikelse, s, och kvantil som har använts i intervallet före ombyggnation? (4p) (b) Antag att variansen är okänd men samma för alla mätningar. Använd båda konfidensintervallen för att skatta den gemensamma variansen. (2p) (c) Konstruera ett tvåsidigt konfidensintervall för skillnaden i förväntade fosforhalter före och efter ombyggnationen. (4p) 4. En ny spektrometer ska, enligt tillverkaren, kunna bestämma koncentrationer med en osäkerhet på σ2 = 0.0625. För att undersöka om spektrometern uppfyller tillverkarens specifikation bestämmer man sig för att utföra upprepade mätningar på två olika prov. Mätningarna kan antas vara normalfördelade. På grund av problem i laboratoriet blev det tyvärr olika antal mätningar för de olika proven. Prov 1 2 4.724 10.313 Mätningar 5.265 4.844 9.820 9.806 2 i xi P P 14.833 40.484 73.501 410.145 i xi — 10.545 (a) Ställ upp en lämplig modell och skatta den gemensamma variansen. (6p) (b) Avgör, genom att konstruera ett lämpligt 95% konfidensintervall, om variansen är större än den av tillverkaren angivna variansen. (4p) 5. Kolnanorör (carbon nanotubes — CNT) kan potentiellt användas som armering i polymer-cement. För att undersöka hur hållfastheten i cement beror av olika tillsatser mätes det tryck (i MPa) som cementen tål i ett 22 faktorförsök. Följande faktorer varierades: med eller utan CNT och andelen epoxy i den tillsatta polymeren. För varje faktorkombination gjordes 5 försök och följande värden erhölls. Faktorer (A) (B) CNT epoxy (%) Nej 25 Ja 25 Nej 75 Ja 75 Medelvärde μ∗11 = 67.6 μ∗21 = 69.9 μ∗12 = 70.9 μ∗22 = 58.2 Varians 2 = 14.8 s11 2 = 17.5 s21 2 = 27.4 s12 2 = 7.4 s22 (a) Skatta huvud- och samspelseffekter (4p) (b) Avgör, under lämpliga antagande om oberoende och normalfördelning, vilka av effekterna i a) som är signifikanta på 5%-nivån? (4p) (c) Vad kan man säga om tillsatsen av CNT i polymer-cement? (2p) 6. Teorifrågor. Ge koncisa svar på nedanstående frågor. (a) X och Y är oberoende stokastiska variabler med X ∈ Po(3) och Y ∈ Po(1), beräkna P(X + Y > 5). (4p) (b) Antag att X är en kontinuerlig stokastisk variabel med täthetsfunktion 1 0, fX (x) = 2x , 0, x<0 0≤x≤2 2<x 0.5 0 −2 Beräkna E(X ) och V(X ). 0 2 4 (4p) (c) För att undersöka storleken på sfäriska partiklar som suspenderats i vätska lyser man genom vätskan och noterar skuggornas area. Sambandet mellan area (A) och volym (V) för partiklarna ges av V = 4 · A3/2 √ . 3 π Ange en approximativ formel för E(V ) och V(V ) uttryckt i areans väntevärde, E(A) = μ, och varians, V(A) = σ2 . (4p) (d) Följande flervalsfrågor ger +1p för rätt svar men -1p för fel svar (lägst 0p på uppgiften). Antag att X1 , X2 , . . . , X100 är 100 st oberoende likafördelade s.v. med E(Xi ) = μ och V(Xi ) = σ2 . i) Sant eller falsk: N enligt CGS. Xi ∈ ∼ ii) Sant P100eller falsk: ∈ i=1 Xi ∼ N enligt CGS. iii) Man bildar medelvärdet 100 X = 1 X Xi 100 i=1 Vad kan man säga om fördelningen för medelvärdet? 2 A: X∈ N μ, σ ∼ C: 2 X∈ N 100 · μ, 100 · σ ∼ B: σ2 X∈ N μ, ∼ 100 D: X är inte approximativt Normalfördelad. Antag att Y ∈ Bin(n, 0.1). iv) Sant eller falsk: Om n = 11 är Y ∈ N enligt CGS. ∼ (4p) (e) För att undersöka hur en partikel rör sig under påverkan av ett svagt magnetfält mäts den tillryggalagda sträckan (m) som funktion av tiden (s) under 30 experiment. Linjär regression användes sedan för att anpassa fyra olika modeller till data. Model 1: yi = a + b · ti + εi Model 2: yi = a + b · ti + c · ti2 + εi Model 3: yi = a + b · ti + c · ti2 + d · ti3 + εi log(yi ) = a + b · ti + εi Model 4: Redogör kortfattat (1-2 meningar) om för- och nackdelar med respektive model. Parameter skattningar och konfidensintervall: Skattningar Model a (intervall) b (intervall) c (intervall) 1 0.52 (0.06, 0.97) 5.84 (5.07, 6.61) 2 1.27 (0.80, 1.74) 0.82 (−1.35, 3.00) 3 1.45 (0.91, 1.99) −2.00 (−6.93, 2.92) 4 0.01 (−0.07, 0.27) Residualplottar på nästa sida! 1.89 (1.60, 2.18) (4p) d (intervall) 5.01 (2.92, 7.11) 12.43 (0.64, 24.23) −4.94 (−12.69, 2.80) y=a+b*t Residualer 6 Residualer Probability 1 y 0 −1 2 0 0.5 tid (s) 1 0 y=a+b*t+c*t2 0.5 tid (s) 1 −1 Residualer Probability 6 y 0 2 0.5 tid (s) 1 y=a+b*t+c*t2+d*t3 −1 0 0.5 tid (s) 1 Probability y 0 2 1 log(y)=a+b*t 0.5 tid (s) 1 0 0.5 tid (s) 1 −0.5 −1 0 0.5 tid (s) LYCKA TILL! 0 0.5 Data Residualer 0 log(2) 0 0.5 Data 1 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 Residualer 1 log(6) log(y) −1 0 Probability 0.5 tid (s) −0.5 Residualer 6 0 1 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 Residualer 1 0 Data Residualer 1 0 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 1 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 −0.5 0 Data 0.5 1