Schema della sezione
-
lunedì 24 novembre Aula C di Medicina Legale (ore 11-13)
Funzioni inverse e derivate delle funzioni inverse:
le derivate di arcsin(x) di arccos(x) e di arctan(x)
inverse e loro derivate di alcune funzioni
y=(x+2)1/2
y= e2x +3
y= -2 tan(3x+1) + 5
(da completare)
Richiami sulle funzioni inverse
Una funzione f:D→ C , x→ y=f(x) è invertibile
see solo se (per definzione)
per ogni y in C esiste ed è unico un x in D tale che
f(x)=y ed in tale caso x=f-1( y)
Inoltre f(f-1( y))=y e f-1( f( x))=x.
Di solito, però, quando D e C sono sottoinsiemi dell'insieme dei numeri reali
(ad esempio intervalli, limitati o illimitati)
allora si preferisce usare il simbolo x per la variabile indipendente e y per quella indipendente per cui si scrive
y=f-1( x), con le proprietà f(f-1( x))=x e f-1( f( x))=x.
ESEMPIO 1
funzione inversa di y=f(x)=(x+1)3
x=f -1( y) se e solo se y=(x+1)3 OSSIA SE E SOLO SE y1/3=x+1 cioè se y1/3-1=x
quindi x=f -1( y)= y1/3-1, ma di solito si scrive
y=f -1( x)= x1/3-1, inoltre
f(f-1( x)) f(x1/3-1)=(x1/3-1+1)3= (x1/3)3=x3/3=x
e
f-1( f( x)) = ( f( x) ) 1/3-1 =((x+1)3 ) 1/3-1 = (x+1)3/3-1=x.
ESEMPIO 2
la funzione y=f(x)=ex è invertibile se si prende come dominio D tutti i reali e come codominio C i numeri reali strettamente positivi, ossia C=(0,+∞).
quindi per ogni y>0 esiste un x reale tale che y=ex questo valore x è il logaritmo naturale, ossia x=ln( y), quindi x=f-1( y)=ln( y)
Tuttavia scriviamo di solito y=ln(x) per x>0.
Formula della derivata della funzione inversa
Se f(x) è derivabile [con derivata f'(x)] , è invertibile, e se x è tale che f'(f-1(x))≠ 0,
allora la funzione inversa y=f-1(x) è derivabile con derivata in x
(d/dx)f-1(x)= 1/f'(f-1(x))
Idea della dimostrazione
La derivata nel punto x0 di f-1(x) è il limite del rapporto incrementale
[f-1(x)-f-1(x0)]/(x-x0)
Posto y=f-1(x) e y0=f-1(x0)
e osservando che quindi f( y)=f(f-1(x))=x e f (y0)=f(f-1(x0))= x0,
possiamo scrivere
[f-1(x)-f-1(x0)]/(x-x0)=[y -y0]/(f( y) - f( y0) ) = 1/ {(f( y) - f( y0) )/ [y -y0] }
che tende, per x→x0, a 1/f' (y0) =1/f' ( f-1(x0) )
in quanto per x→x0, si ha che y=f(x)→f(x0)=y0.
Calcolo delle derivate delle funzioni inverse di sen(x) [o sin(x)] di cos(x) e di tan(x) [o tg(x)]
Prima di tutto bisogna ricordare che
(d/dx)sin(x)=cos(x), (d/dx)cos(x)=-sin(x), (d/dx) tg(x) = 1/(cos(x))2.
SI DIMOSTRA CHE
(d/ dx) arcsin (x) = 1/ (1-x2 )1/2 per x in (-1,1) (OSSIA ESCLUSI GLI ESTREMI)
(d/ dx) arccos (x) = -1/ (1-x2 )1/2 per x in (-1,1) (OSSIA ESCLUSI GLI ESTREMI)
(d/ dx) arctg (x) = 1/ (1+x2 ) per x in (-∞,∞)
CENNO ALLA DIMOSTRAZIONE
CASO della funzione arcsin(x)
La funzione y=sin(x) è invertibile se si sceglie come dominio [- π/2,π /2]
(in questo intervallo la funzione y=sin(x) è continua e strettamente crescente)
e come codominio [-1,1]
La funzione inversa è chiamata arcoseno
e per ogni x in [-1,1] si scrive y=arcsin(x) [ = f-1(x) per f(x)=sin(x) ]
ossia y è quel numero in [- π/2,π /2] e tale che sin( y) =x
La derivata della funzione inversa è quindi, ricordando che la derivata di sin(x) è cos(x),
(d/ dx) arcsin (x) = 1/ f'(f-1(x) ) = 1/ cos ( arcsin (x) ) = 1/ cos( y)
dove y è tale che sin( y)=x
MA IN QUESTO MODO NON SAPPIAMO CALCOLARE QUANTO VALE LA DERIVATA in x
tuttavia sappiamo che
sin2( y) + cos2( y) =1 per ogni y
e quindi, nel nostro caso
cos2( y)=1-sin2( y) =1-x2 da cui cos( y) = ± (1-x2)1/2
e dopo aver capito che bisogna scegliere il segno +
possiamo finalmente affermare che
(d/ dx) arcsin (x) = 1/ f'(f-1(x) ) = 1/ cos ( arcsin (x) ) = 1/ cos( y) = 1/(1-x2)1/2
ovviamente dobbiamo escludere i punti x=+1 e x=-1 dove il denominatore si annulla.
PERCHE' SCEGLIERE IL SEGNO + ?Risposta 1 Sappiamo che se una funzione è crescente e derivabile la sua derivata deve essere maggiore o uguale a zero: la funzione arcsin(x) è crescente: cià si può vedere dal grafico oppure dalla seguente considerazione generale
Se f è crescente e invertibile (e quindi stettamente crescente) allora anche la sua funzione inversa è crescente
A sua volta questo fatto si può vedere dai grafici oppure dal seguent ragionamento:
se f è crescente ed invertibile DEVE ESSERE strettamente crescente in quanto NON possono esistere x e x' con x<x' e per i quali f(x)=f(x') [se esistessero la funzione non sarebbe iniettiva e quindi non sarebbe invertibile]
allora x<x' implica che f(x)<f(x') [con le disuguaglianze strette]
Siano ora t < t' vogliamo controllare che f -1(t) < f -1(t') .
A questo scopo si pongano x=f -1(t) ed x'=f -1(t') : questi due numeri non possono essere uguali (in quanto anche f -1 è invertibile)
e non può essere f -1(t) > f -1(t') (in quanto allora applicando il fatto che f è strettamente crescente otterremmo f(f -1(t) ) > f( f -1(t') ) ossia t > t', mentre per ipotesi t<t')
quindi deve essere necessariamente f -1(t) < f -1(t').
Risposta 2 non detta a lezione: sappiamo che y deve essere un numero in [- π/2,π /2]
e che cos(α) ≥ 0 per ogni α in [- π/2,π /2]
CASO della funzione arccos(x)
La funzione y=cos(x) è invertibile se si sceglie come dominio [0,π ]
(in questo intervallo la funzione y=cos(x) è continua e strettamente decrescente)
e come codominio [-1,1]
La derivata della funzione inversa è quindi, ricordando che la derivata di cos(x) è -sin(x), per x in (-1,1)
(d/ dx) arcsin (x) = 1/ f'(f-1(x) ) = 1/ sin ( arccos (x) ) = - 1/ sin( y)
dove y è tale che y è in [0,π ] e cos( y)=x
in modo analogo abbiamo che sin2( y)=1-cos2( y)=1-x2 e che quindi
sin( y) = ±(1-x2)1/2, m va scelto il segno + perche' sin( y)≥ 0 per y in [0,π ],
oppure ricordare che la funzione cos(x) à decrescente e quindi lo è anche la sua inversa.
CASO della funzione arctg(x)
La funzione y=tg(x) è invertibile se si sceglie come dominio (-π/2,π/2 )
(in questo intervallo la funzione y=cos(x) è continua e strettamente decrescente)
e come codominio (-∞,∞)
La derivata della funzione inversa è quindi, ricordando che la derivata di tg(x) è 1/cos2(x), per x in (-π/2,π/2)
(d/ dx) tg (x) = 1/ f'(f-1(x) ) = 1/ [ 1/ cos2( arctg (x) )] = cos2( y)
dove y è tale che y è in (-π/2,π/2) e tg( y)=x
Qui però dobbiamo utilizzare la seguente relazione che lega cos2( y) e tg2( y)
cos2 ( y) = 1/[1 + tg2( y)]
che si dimostra immediatamente osservando che
cos2 ( y) = cos2 ( y)/1=cos2 ( y)/[cos2 ( y)+sin2 ( y)] =1/[1 + tg2( y)]
(basta dividere numeratore e denominatore per cos2 ( y)]
a questo punto ricordando che se arctg(x)=y allora x= tg( y)
(d/dx) acrtg(x) = cos2 ( y)= 1/[1 + tg2( y)] = 1/[1+x2].
lunedì 24 novembre Aula A del Plesso Tecce (ore 15-17)
Regola di de l'Hôpital
per i limiti del tipo 0/0 o del tipo ∞/∞
esempi e applicazioni
correzione del test di valutazione.
(da completare)
mercoledì 26 novembre Aula A del Plesso Tecce (ore 15-17)
Concavità e convessità, varie caratterizzazioni.
Flessi orizzontali e obliqui
Studio del grafico delle funzioni f(x)=x2/(x2+3) e della funzione f(x)=x3/[x2-x-2]
PRIMA Definizione di funzione convessa
(o con concavità rivolta verso l'alto)
f(x) è convessa in un intervallo J (limitato o illimitato) se e solo se
comunque scelti x1 e x2 in J (si può pensare con x1<x2 )
per ogni x in (x1,x2) la funzione f(x) è sempre minore o uguale alla retta secante che passa per i punti (x1,f(x1)) e (x2,f(x2)),
cioè la retta y=f(x1)+ { [f(x2)-f(x2)]/(x2-x1) }(x-x1)
IN FORMULE
f(x) ≤ f(x1)+ { [f(x2)-f(x2)]/(x2-x1) }(x-x1) per ogni x tale che x1≤x≤x2,
[ovviamente poiché l'equazione della retta si può scrivere anche come
y=f(x2)+ { [f(x1)-f(x1)]/(x1-x2) }(x-x2)
vale anche
f(x) ≤ f(x2)+ { [f(x1)-f(x1)]/(x1-x2) }(x-x2) per ogni x tale che x1≤x≤x2 ]
-----------------------------------------------------------------
UNA FUNZIONE è CONCAVA in J se invece vale la disuguaglianza opposta, ossia se comunque scelti x2 e x1 in J (possiamo pensare x1≤x2, )
f(x) ≥ f(x1)+ { [f(x2)-f(x2)]/(x2-x1) }(x-x1) per ogni x tale che x1≤x≤x2,
Ovviamente se f(x) è convessa in J allora -f(x) è concava e viceversa se f(x) è concava in J allora -f(x) è convessa
PROTOTIPO DELLE FUNZIONI CONVESSE SONO la funzione y=|x| e la funzione y=x2.
SECONDA DEFINIZIONE EQUIVALENTE di funzione convessa
UNA FUNZIONE è CONVESSA in J se invece vale la disuguaglianza opposta, ossia se comunque scelti x2 e x1 in J (possiamo pensare x1≤x2, )
f(λx1+(1-λ)x2)≤ λ f(x1) + (1-λ)f(x2) per ogni λ in [0,1]
MOTIVO PER CUI LA DEFINIZIONE E' EQUIVALENTE: al variare di λ
x(λ)=λx1+(1-λ)x2 percorre il segmento di estremi x1 e x2
(si noti che x(0)=x2 e che x(1)=x1)
e quindi i punti (x(λ), f(λx1+(1-λ)x2) ) percorrono il grafico della funzione
mentre i punti
(x(λ), λ f(x1) + (1-λ)f(x2) )
percorrono il segmento della secante che unisce i punti (x1,f(x1)) e (x2,f(x2))
CONDIZIONI DI CONVESSITA' per funzioni derivabili
Se f(x) è derivabile in ogni punto di J allora è convessa se e solo se
per ogni x1 in J la retta tangente è sempre minore o uguale alla funzione stessa
ossia, dato che l'equazione della retta tangente in x1 è
y=f(x1)+f'(x1)(x-x1)
Sia f derivabile in J allora f è convessa se e solo se
se per ogni x1 in J si ha
f(x1)+f'(x1)(x-x1) ≤ f(x) per qualunque x in J
Ovviamente per le funzioni concave e derivabili vale la disuguaglianza opposta:
Sia f derivabile in J allora f è concava se e solo se
se per ogni x1 in J si ha
f(x1)+f'(x1)(x-x1) ≥ f(x) per qualunque x in J
Seconda caratterizzazione
Sia f derivabile in J allora f è convessa se e solo se f'(x) è crescente
analogamente
Sia f derivabile in J allora f è concava se e solo se f'(x) è decrescente
Condizioni di convessità per funzioni con derivata seconda
Se una funzione è derivabile due volte e f''(x)≥0 allora f(x) è convessa
(per ricordarlo pensare al prototipo f(x)=x2 per la quale f'(x)=2x e f''(x)=2>0)Se è convessa e derivabile due volte allora f''(x)≥0.
ESEMPIO la funzione f(x)=x4 è convessa, e si ha f''(x)≥0, ma non f''(x)>0 per ogni x: infatti f'(x)=4x3 e quindi la derivata prima è crescente e quindi f(x)=x4 è convessa, ma f''(x)=12x2 ≥0, ma vale 0 in x=0.
FLESSI
la curva (x, f(x)) ha un flesso in (x0,f(x0)) se la funzione f(x) cambia concavità in x0, ossia se la funzione a destra di x0 è convessa e a sinsitra di x0 è concava o viceversa
più precisamente
se esistono due intervalli (x0, x0+ε1) e (x0-ε2,x0) (con ε1>0 e ε2>0) per i quali
(a) f(x) è convessa in (x0, x0+ε1) ed f(x) è concava in (x0-ε2,x0)
oppure viceversa
(b) f(x) è concava in (x0, x0+ε1) ed f(x) è convessa in (x0-ε2,x0)
Si dice che si ha un flesso orizzontale se f'(x0)=0
come ad esempio per la funzione f(x)=x3 e con x0=0
si dice che si ha un flesso obliquo se f'(x0)≠0
come ad esempio per la funzione
f(x)= x2/(x2+3)
per la quale, dalla formula (f/g)' = [f'g-fg']/g2,
f'(x)= [2x (x2+3) - x2 2x] / (x2+3)2 = 6 x/(x2+3)2,
e quindi usando di nuovo la stessa formula e la formula (d/dx)h(f(x))=h'(f(x))f'(x), per calcolare la derivata di (x2+3)2,
f''(x) = 6 [ (x2+3)2 - x 2 (x2+3) 2x]/(x2+3)4,= 6 [ 1/(x2+3)3] [ (x2+3) -4x2]
= 6 (-3x2+3)/(x2+3)3= -18(1-x2)/(x2+3)3 ≥0
se e solo se x2≥1 ossia per x≤-1 e per x ≥1,dove è convessa e invece è concava per x in (-1,1).
Quindi la funzione f(x)= x2/(x2+3) cambia la concavità nei punti -1 e +1 e si ha che ha un punto di flesso in -1 e in + 1 e si tratta di un flesso obliquo perché
f'(1)= 6/42=3/8>0 (in -1 si ha invece f'(-1)= - 6/42<= - 3/8 < 0 )
la retta tengente y=f(1)+f'(1)(x-1) = 1/4 +(3/8)(x-1) attraversa il grafico nel senso spiegato qui sotto
IMPORTANTE la retta y=f(x0)+f'(x0)(x-x0) nelle vicinanze di x0 ,ossia nell'intervallo (x0-ε2,x0+ε1), gode della proprietà che
se vale (a) (prima convessa e poi concava)
f(x0)+f'(x0)(x-x0)≤f(x) per x in (x0, x0+ε1) (dove f(x) è convessa)
e
f(x0)+f'(x0)(x-x0)≥f(x) per x in (x0-ε2,x0) (dove f(x) è concava)
viceversa se vale (b) (prima concava e poi convessa) si ha
f(x0)+f'(x0)(x-x0)≥f(x) per x in (x0, x0+ε1) (dove f(x) è concava)
e
f(x0)+f'(x0)(x-x0)≤f(x) per x in (x0-ε2,x0) (dove f(x) è convessa)
..
venerdì 28 novembre Aula C di Medicina Legale (ore 11-13)
asintoti verticali, orizzontali e obliqui
Esercizi vari
ASINTOTI
Se limx→x0+ f(x) = +∞ si dice che la retta x=x0 è un asintoto verticale
(lo stesso vale se limx→x0+ f(x) = -∞
oppure limx→x0- f(x) = +∞ o se limx→x0- f(x) = -∞ )
Se limx→+∞ f(x) = q si dice che la retta y=q è un asintoto orizzontale
(lo stesso vale se limx→ -∞ f(x) = q )
Se limx→+∞ [f(x) - (mx+ q) ] = 0 si dice
che la retta y=mx+q è un asintoto obliquo
(ovviamente è necessario che limx→+∞ f(x) = ∞ o limx→+∞ f(x) = - ∞)
e limx→+∞ [f(x) - (mx+ q) ] = 0
Inoltre lo stesso vale se invece si limx→+∞ si considera limx→ -∞ )
ESEMPIO la funzione f(x)=x3/[x2+x-2] ha un asintoto obliquo per x→∞ e uno per x→ - ∞
Per trovarlo cominciamo con l'osservare che limx→+∞ f(x) = ∞ in quanto
x3/[x2+x-2]= x/[1+(1/x) -(2/x2)]
Poi dobbiamo trovare m e q tali che limx→+∞ [f(x) - (mx+ q) ] = 0.
Osserviamo che
f(x) - (mx+ q) = x3/[x2+x-2] -(mx+q)= [x3 - (mx+q)(x2-x-2) ] / [x2+x-2] =
=[x3 - mx3 - mx2 +2mx -qx2-qx+2q ] / [x2+x-2]
= [(1-m)x3 + (-m-q)x2 + (2m-q) +2q] / [x2+x-2]
Affinché questa funzione vada a zero quando x tende a + infinito è necessario che il numeratore sia un polinomia di grado minore del denominatore e quindi dobbiamo imporre che
1-m=0 e che -m-q=0 ossia che m=1 e q=-1
IN CONCLUSIONE la retta y=x-1 è un asintoto obliquo per la funzione f(x)=x3/[x2+x-2]
(l'altro asintoto è lasciato come esercizio)
-------------
Questo è un caso particolarmente semplice in generale per trovare se c'è un asintoto obliquo si deve procedere come segue:
Per trovare il valore m: ci si chede se esiste finito limx→+∞ f(x)/x, e se esiste necesariamente deve essere m=limx→+∞ f(x)/x
Per trovare q: si cerca , se esiste un q tale che valga la condizione
limx→+∞ [f(x) - (mx+ q) ] = 0
OSSERVAZIONE poiché il limx→+∞ f(x)/x è una forma indeterminata, SE ESISTE IL LIMITE limx→+∞ f'(x)/1= L ed è finito, allora si può prendere m=L, MA ATTENZIONE potrebbe non esistere limx→+∞ f'(x) MA INVECE potrebbe esistere finito limx→+∞ f(x)/x !!!
ESERCIZIO C7.3 ed ESERCIZIO 7.17 su massimi di funzioni in un intervallo chiuso.
Trovare il max x(1-x) per x in [3/4, 2]
SI CONSIGLIA DI FARE UN GRAFICO APPROSSIMATIVO della funzione f(x)=x(1-x), tuttavia si può risolvere anche senza l'aiuto del grafico:
si trova la derivata f'(x)= 1-2x si osserva che f'(x)=0 per x=1/2 che però non è nell'intervallo [3/4,2] si trova che f'(x) >0 solo per x< 1/2 e quindi la funzione è decrescente nell'intervallo [3/4,2] e quindi il massimo viene assunto nel punto x=374 e il massimo vale f(3/4)= 3/4 (1-3/4)= 3/16.
Osservazione: quando si tratta di trovare il massimo di f(x) in un intervallo chiuso e limitato si devono tenere presenti i seguenti fatti:
1) se la funzione è continua esistono un punto di massimo e un punto di minimo
(se l'intervallo non è limitato ciò non è vero: pensare ad esempio alla funzione ex)
2) se la funzione è derivabile non basta andare a cercare i punti xi in cui è derivabile, ma bisogna controllare anche cosa avviene agli estremi dell'intervallo, che supponiamo siano a e b
e per decidere quale è il massimo in tutto l'intervallo si confrontano tutti i valori f(xi), f(a) ed f(b) per decidere quale di questi è il massimo in [a,b] (o il minimo)
3) se ci sono dei punti in cui la funzione non è derivabile bisogna tenere conto anche di questi punti
Esercizi D.6 e D.7 del foglio 6:
Per questi esercizi servono i grafici A,B, C D ed E nella figura 6.1 (che trovate nell'eserciziario)
GRAFICO A, sicuramente è il grafico di una parabola con la concavità rivolta verso l'alto e con punto di minimo negativo e minimo assoluto positivo
GRAFICO B, è una retta con coefficiente angolare strettamente positivo e che taglia l'asse x in un punto con ascissa positiva e taglia l'asse y in un ponto con ordinata negativa
GRAFICO C, sicuramente è il grafico di una parabola con la concavità rivolta verso il basso e con punto di minimo positivo e massimo assoluto negativo
GRAFICO D, sicuramente è uina funzione crescente e SEMBRA che abbia un flesso orizzontale in un punto x0 >0 e che f(x0)<0
GRAFICO E, SEMBRA è una funzione decrescente e SEMBRA che abbia un flesso orizzontale in un punto x0 >0 e che f(x0)=0
Tuttavia le figure non sono chiarissime, e FORSE a volte non bisogna tenere conto delle unità di misura.
IN REALTA' HO CAPITO QUAL E' IL PROBLEMA CON QUESTE FIGURE: A UNA PRIMA VISTA (almeno per presbiti, come me) si vedono SOLO i punti sugli assi con coordinate intere ben marcate, e che vengono prese per le uniche coordinate intere, e quindi nel grafico E sembra che la funzione si annulli in un punto dell'intervallo (0,1) e che in 1 la funzione assuma un valore negativo!
INVECE i punti sugli assi con coordinate intere ben marcate devono essere i punti del tipo (0,2k) o (2h,0), con h e k interi, mentre i punti con coordinate dispari [ossia del tipo (0,2k+1) e (2h+1,0) ] non sono marcate e quindi nel grafico E la funzione si annulla nel punto x=1.
Ad esempio nell'esercizio D.7 si chiede di trovare a quale grafico corrisponda una funzione tale che f(1)=0 f'(1)=0 ed f''(0)=0, se si tenesse conto delle unità di misura come appaiono a un presbite, non si troverebbe nessuna funzione con queste caratteristiche fra quelle dei grafici A, B,C, D ed E
In questo caso si possono scartare immediatamente i grafici A e B per i quali non esiste un x con f(x)=0 e quindi non soddisfano la condizione f(1)=0.
Rimangono quindi solo le funzioni dei grafici B,D ed E
Giudicando dai grafici e nell'ipotesi che le unità di misura sono esatte sembrerebbe pero' che nessuna funzione soddisfa la condizione f(1)=0 tranne forse la funzione del grafico D, che però non può essere perché f'(1)>0 in quanto la funzione è strettamente crescente nel punto xD in cui la funzione si annulla [ricordiamo che la derivata f'(x0) è il coefficiente angolare della retta tangente la curva (x,f(x)) nel punto (x0,f(x0)) ]
Per lo stesso motivo non può essere neanche la funzione del grafico B che è una retta con coefficiente angolare chiaramente strettamente positivo.
Rimane quindi solo il grafico della funzione E, che pero' (a un presbite) appare come una funzione con f(1)<0) e la risposta sarebbe che nessuna funzione può essere rappresentata da uno dei cinque grafici. MA SE CI SI ACCORGE DI QUALE E' LA VERA UNITA' DI MISURA allora si "VEDE" che la funzione del grafico E è tale che f(1)=0, f'(1)=0 ed f''(0)=0.
ESERCIZIO D.1 del foglio 6
sia P(x) un polinomio di grado 4, ossia P(x)=ax4+bx3+cx2+dx+e
tangente all'asse x e con un flesso orizzontale nel punto (0,-1) si può affermare che
a) il polinomio è sempre positivo
b) il polinomio è sempre negativo
c) si può solo affermare che il polinomio è positivo a destra di x=0 (cioè per x>0)
d) si può solo affermare che il polinomio è positivo a sinistra di x=0 (cioè per x<0)
e) nessuna delle precedenti risposte è corretta.
Iniziamo dal prendere in considerazione la condizione sul flesso orizzontale in (0,-1), che ci permette di dire che
i) P(0)=-1
ii) P'(0)=0
iii) P''(0)=0
iv) P(x) cambia concavità nelle vicinanze di 0 ossia
esistono due intervalli (0, ε1) e (-ε2,0) (con ε1>0 e ε2>0) per i quali
iv.a) P''(x) > 0 per x in (0, ε1) e P''(x) < 0 per x in (- ε2,0)
oppure
iv.b) P''(x) < 0 per x in (0, ε1) e P''(x) > 0 per x in (- ε2,0)
osservando che
P(x)=ax4+bx3+cx2+dx+e e quindi P(0)=e
P'(x)=4ax3+3bx2+2cx+d e quindi P'(0)=d
P''(x)=12ax2+6bx+2c e quindi P''(0)=2c
dalle condizioni i) ii) e iii) otteniamo che P(0)=e=-1, P'(0)=d=0 e P''(0)=2c=0
e quindi
P(x)=ax4+bx3-1
P'(x)=4ax3+3bx2 =(4ax+3b)x2
P''(x)=12ax2+6bx= 6x(2ax+b)
dalla condizione iv) otteniamo che vale
iv.a) P''(x) = 6x(2ax+b)> 0 per x in (0, ε1) e P''(x) = 6x(2ax+b) < 0 per x in (- ε2,0)
ossia che 2ax+b>0 per x in ( - ε2, ε1) e quindi b>0
oppure
iv.b) P''(x) = 6x(2ax+b) < 0 per x in (0, ε1) e P''(x) = 6x(2ax+b)> 0 per x in (- ε2,0)
ossia che 2ax+b<0 per x in ( - ε2, ε1) e quindi b<0
DALLA CONDIZIONE CHE la curva è tangente all'asse delle x otteniamo che esiste un x0 con
v) P(x0)=0, ossia a(x0)4+b(x0)3-1= 0
vi) P'(x0)=0, ossia (4ax0+3b)(x0)2=0
dalla condizione vi) deve necessariamente essere il punto x0= -3b/(4a)
e quindi dalla condizione v) si ottiene che
a(x0)4+b(x0)3=1 ossia a(-3b/(4a))4+b(-3b/(4a))3= (b4/a3)(33/43)[3/4-1 ] =1
ossia a3 = - b4 44/33 da cui si deduce che a<0
[e si possono scartare le risposte a) e c)]
Inoltre essendo a<0 si ha che P(x) tende a -∞ sia per x che tende a + ∞ che per x che tende a - ∞ [e quindi si può scartare la risposta d)].
Infine notiamo che non possono esserci punti di minimo o massimo relativo (o locale) diversi da x0= -3b/(4a): infatti gli unici punti in cui P'(x)=0 sono x=0 e appunto x= x0= -3b/(4a), e in particolare non può esserci un punto x1 di massimo relativo (o locale) con P(x1)>0, e quindi, grazie al comportamento di P(x) per x che tende a + ∞( e a - ∞), il punto di massimo assoluto (o globale) deve necesariamente essere x0= -3b/(4a), e quindi il massimo deve essere P(x0)=0, ossia il polinomio P(x) è sempre negativo (non strettamente) ossia P(x) ≤ 0
e vale la risposta b) [INTERPRETANDO P(x) sempre negativo, con negativo in senso NON STRETTO]
..
lunedì 30 novembre Aula C di Medicina Legale (ore 11-13)
Coordinate Polari
Prodotto scalare
Relazione tra cos(θ), dove θ è l'angolo formato da due vettori OP e OQ e prodotto scalare
Polinomio di Taylor
COORDINATE POLARI
ogni punto/vettore P(xP,yP) puo' essere individuate univocamente dal suo modulo
ρP=(xP2+yP2)1/2, e dall'angolo αP che il vettore OP forma con l'asse delle x (NB: si suppone che αP sia in (-π, π] e O=(0,0) è l'origine degli assi)
attraverso le formule
xP=ρP cos(αP) , yP= ρP sin(αP)
Questo si vede immediatamente supponendo che P sia nel primo quadrante, ossia xP e yP entrambi positivi, (ossia αP in [0,π/2] ) e osservando che,
posto P' (x',y') il punto di incontro tra la semiretta che parte da O e passa per P e la circonferenza di raggio 1 si ha che x'=cos(αP) e y'= sin(αP).
Inoltre, posti H(xP,0) e H'(x',0) si ha che il triangolo POH è simile al triangolo P'OH' e quindi |OP|/1=|PH|/|P'H'| e |OP|/1=|OH|/|OH'| ossia
ρP= yP/y'=yP/sin(αP) e ρP= xP/x'=xP/cos(αP)
da cui yP=ρPsin(αP) e xP= ρP cos(αP)
(si veda la figura coordinate polari)
Si vede poi facilmente che nel caso in cui αP sia in uno degli altri quadranti che il segno di xP è concorde con quello di cos(αP) e analogamente che il segno di yP è concorde con quello di sin(αP).
SI OSSERVI che quando P coincide con l'origine O allora il suo modulo vale 0 e viceversa se ρP=0 allora P è l'origine.
Quando il punto è dato attraverso la coppia (ρP, αP) si dice che stiamo usando le coordinate polari.
Il nome viene dal modo in cui vengono rappresentate le carte geografiche nelle vicinanze dei poli.
Prodotto scalare
dati i vettori v1=(x1,y1) e v2=(x2,y2) il prodotto scalare è definito da
v1•v2 = x1x2+y1y2
(a volte si usa anche la notazione <v1,v2 > )
Relazione tra cos(θ), dove θ è l'angolo formato da due vettori OP e OQ e prodotto scalare
Siano P(xP,yP) e Q(xQ,yQ) con modulo ρP=(xP2+yP2)1/2, e ρQ=(xQ2+yQ2)1/2, rispettivamente
e siano αP l'angolo che il vettore OP forma con l'asse delle x, e αQ l'angolo che il vettore OQ forma con l'asse delle x
per cui
xP= ρP cos(αP) , yP=ρPsin(αP)
xQ= ρQ cos(αQ), yQ=ρQsin(αQ)
Allora, posto θ l'angolo formato da due vettori OP e OQ si ha che
θ= αP - αQ
e quindi
cos(θ)= cos(αP - αQ) = cos(αP) cos(αQ) + sin(αP) sin(αQ)
D'altra parte il prodotto scalare dei vettori OP e OQ è dato da
xPxQ+yPyQ= ρP cos(αP) ρQ cos(αQ) + ρPsin(αP) ρQsin(αQ) = ρPρQ [cos(αP)cos(αQ) + sin(αP)sin(αQ)]= ρPρQ cos(αP - αQ) =ρPρQ cos(θ)
RIASSUMENDO abbiamo trovato che
cos(θ)= [xPxQ+yPyQ] / [ ρP ρQ ]
APPLICAZIONE.
Dati i punti A(0,2), B(4,0), C(3,3) trovare l'angolo θB= ABC (ossia nel vertice B)
Prima di tutto bisogna individuare i vettori BA e BC (si tratta di "spostare l'origine degli assi in B) ossia considerare i vettori
vA= (xA-xB, yA-yB)=(0-4,2-0)=(-4,2) e il vettore vC = (xC-xB, yC-yB)=(3-4,3-0)=(-1,3) , i rispettivi moduli
ρA=((xA-xB)2+(yA-yB)2 )1/2 = ((-4)2+(2)2 )1/2= (20)1/2= 2 51/2,
ρC=((xC-xB)2+(yC-yB)2 )1/2 = ((-1)2+(3)2 )1/2= (10)1/2= 21/2 51/2,
e il prodotto scalare
vA•vC=(xA-xB)(xC-xB) + (yA-yB)(yC-yB)= (-4) (-1)+ (2) (3)= 10
e allora (dalla formula cos(θ)= [xPxQ+yPyQ] / [ρP ρQ] )
cos(θB) = vA•vC/(ρAρC)= 10/ [2 21/2 5] =1/21/2 e quindi θB= π/4 (=45°)
Piu' in generale se conosciamo il cos(θ) dove θ è un angolo nell'intervallo (0,π) possiamo almeno dire se l'angolo è acuto o ottuso, a seconda del segno di cos(θ): infatti se cos(θ)>0 allora θ è un angolo acuto (o retto, nel caso cos(θ)=1) e viceversa se cos(θ)< 0 allora è un angolo ottuso.
POLINOMIO DI TAYLOR
Iniziamo con l'osservare che, se la funzione y=f(x è derivabile, allora l'equazione della tangente al grafico di una funzione y=f(x) nel punto (x0,f(x0)) è una funzione polinomiale di grado 1 (o lineare) il cui grafico passa per il punto (x0,f(x0))
ossia è la funzione
y=f(x0) + f'(x0) (x-x0)
Si "intuisce" da un disegno che la differenza tra la retta tangente e la funzione è "piccola" quando x-x0 è "piccolo" ovvero quando x è "vicino" a x0, ma si può anche pensare più rigorosamente al fatto che, essendo sia y=f(x) che y= f(x0) + f'(x0) (x-x0) due funzioni continue in x0, allora
limx→x0 [f(x)- ( f(x0) + f'(x0) (x-x0) ) ] = f(x0) - f(x0)=0
Lo sviluppo di Taylor generalizza questa idea al caso di funzioni polinomiali
e nel caso in cui la funzione f(x) abbia derivate di ordine più grande di 1.
[ricordiamo che f'(x) è la derivata di ordine 1, f''(x) è la derivata di ordine 2, ed è la (d/dx)f'(x) e si scrive anche (d2/dx2)f(x)=f(2)(x), f'''(x) è la derivata di ordine 3, ed è la (d/dx)f''(x) e si scrive anche (d3/dx3)f(x)=f(3)(x),
e che più in generale la derivata di ordine n o derivata n-sima (ennesima) si scrive (dn/dxn)f(x)=f( n)(x), ed è definita da f( n)(x)=(d/dx)f(n-1)(x) ]
Sia f una funzione con derivate fino all'ordine n
allora il POLINOMIO DI TAYLOR di grado n (o sviluppo di Taylor di ordine n) è il polinomio
Tn(x) = f(x0) + f'(x0) (x-x0) + f''(x0) (x-x0)2/2!+ f'''(x0) (x-x0)3/3! +...
....+ f(k)(x0) (x-x0)k /k!+ ...+ f( n)(x0) (x-x0)n /n!
SI OSSERVI CHE y=T1(x) coincide con l'equazione della reta tangente
Sotto opportune condizioni, il polinomio di Taylor Tn(x) "approssima" il valore della funzione f(x): infatti
VALE IL SEGUENTE RISULTATO
Se f(x) è derivabile fino all'ordine n+1, (con f(n+1)(x) continua) allora
la differenza tra f(x) e il polinomio di Taylor di grado n Tn(x) è maggiorata, in valore assoluto come segue:
| f(x) - Tn(x)| ≤ M |x-x0|n+1/(n+1)!
dove M è una costante che dipende da f, da n, da x e x0,
ossia, se x>x0 allora
M=max t in [x0 ,x] |f(n+1)(t)|
mentre se x<x0 allora
M=max t in [x, x0] |f(n+1)(t)|
OSSERVAZIONE: se x varia in [x0-δ, x0+ δ] allora vale anche la seguente maggiorazione:
| f(x) - Tn(x)| ≤ M' δn+1/(n+1)! per ogni x in [x0-δ, x0+ δ]
dove M':= max t in [x0 -δ,x0 +δ] |f(n+1)(t)|
in quanto (ad esempio per x< x0)
M=max t in [x, x0] |f(n+1)(t)| ≤ M'= max t in [x0 -δ,x0 +δ] |f(n+1)(t)|
ossia l'errore che si commette calcolando Tn(x) invece di f(x) è minore o uguale a
max t in [x0 -δ,x0 +δ] |f(n+1)(t)| δn+1/(n+1)!
APPLICAZIONE:
Calcolare ex per x in [0,1/4] utilizzando il polinomio di Taylor di grado 2 in x0=0 e trovare l'errore massimo che si commette (sia direttamente che utilizzando la maggiorazione dell'errore sopra citata)
Per iniziare ricordiamo che per f(x)=ex, si ha f'(x)=ex, e quindi f( n)(x)=ex, per ogni n, e quindi f( n)(0)=e0=1, per ogni n.
Di conseguenza il polinomio di Taylor di ordine n per x0=0 è dato da
Tn(x)= 1 + x + x2/2!+ x3/3!+ x4/4!+....+ xn/n!
in particolare
T2(x)= 1 + x + x2/2
e quindi il valore assoluto dell'errore che si commette calcolando 1 + x + x2/2 invece di ex è uguale a
|ex - (1 + x + x2/2)| posto g(x)=ex - (1 + x + x2/2) si vuole calcolare esattamente
max x in [0,1/4] |g(x)|
o almeno trovare una maggiorazione per tale espressione
Nel primo caso lo studio del max x in [0,1/4] |g(x)| si riduce a osservare che
g(0)=e0 - (1 + 0 + 02/2)=0
e che
g(1/4)=e1/4 - (1 + 1/4 + (1/4)2/2) = e1/4 - (32+8+1 )/32=e1/4 - 41/32
e che
g'(x)= ex - (0 + 1 + (2x)/2) = ex - (1 + x) ≥ 0 per ogni x
in quanto la funzione f(x)=ex è convessa su tutti i reali (ad esempio la derivata seconda è ex>0 per ogni x) e l'equazione della tangente nel punto (0,1) è y=1+x
e quindi il grafico della funzione è sempre al di sopira del grafico della retta tangente, o anche la funzione è sempre maggiore o uguale della tangente [ o meglio f(x) ≥ f(x0)+f'(x0)(x-x0), per ogni x, si confrontino le caratterizzazioni delle funzioni convesse]
di conseguenza
g(x)=ex - (1 + x + x2/2) ≥ g(0)=0 ed essendo g(x) una funzione crescente si ha che |ex - (1 + x + x2/2)| =|g(x) |=g(x) e
max x in [0,1/4] |ex - (1 + x + x2/2)|= max x in [0,1/4] |g(x)| = max x in [0,1/4] g(x)= g(1/4)= e1/4 - 41/32
ora e1/4 - 41/32 vale circa 0,00277
[ più precisamente usando una calcolatrice scientifica
1,2840254166877414840734205680624- 1,28125 = 0,00277541668774148407342056806244 ]
tuttavia c'è stato bisogno di calcolare e1/4 usando una calcolatrice scientifica e non volevamo utilizzare questo mezzo ma solo una calcolatrice semplice
Allora possiamo utilizzare invece il RISULTATO sul polinomio di Taylor per poter dire che
max x in [0,1/4] |ex - (1 + x + x2/2)| ≤ max t in [0,1/4] | (d2/dt2)et | (1/4)3/3!=
= max t in [0,1/4] | et | (1/4)3/3! = e1/4 (1/4)3/3! ≤ 3 (1/4)3/3! =
= 1/128 = 0,0078125 ≤ 0,008 = 8 10-3.
(abbiamo usato il fatto che e1/4 ≤ 3 e che 3!=3 2=6)
e possiamo quindi affermare che per ogni x in [0,1/4]
1 + x + x2/2- 8 10-3≤ ex ≤1 + x + x2/2 +- 8 10-3
..
lunedì 30 novembre Aula A del Plesso Tecce (ore 15-17)
Ancora sui polinomi di Taylor
caso f(x)= cos(x) e x0=0 (con dim e applicazione)
caso f(x)= sin(x) e x0=0 (con dim)
caso f(x)= ln(1+x) e x0=0 (senza dim)
Discussione sugli Esercizi sui polinomi (foglio 6 D.1, D.2 e D.3)
Polinomio di Taylor caso f(x)= cos(x) e x0=0
f(x)=cos(x)
f'(x)=-sin(x)
f''(x)= -cos(x)
f'''(x)= sin(x)
fiv(x)=cos(x)
e quindi si ottiene che si ricomincia daccapo
in particolare per f(x)=cos(x)
f(4k)(x)=cos(x)
f(4k+1)(x)=-sin(x)
f(4k+2)(x)= -cos(x)
f(4k+3)(x)= sin(x)
di conseguenza
f(0)=cos(0)=1
f'(0)=-sin(0)=0
f''(0)= -cos(0)=-1
f'''(0)= sin(0)=0
fiv(0)=cos(0)=1
e cosi' via
e quindi nello sviluppo di Taylor (o polinomio di Taylor) appaiono solo le potenze si esponente pari e con segno alterno
ad esempio
T1(x)=cos(0)-sin(0)x=1+0x=1
T2(x)=cos(0)-sin(0)x-cos(0)x2/2!=1+0x-x2/2!=1-x2/2
T3(x)=cos(0)-sin(0)x-cos(0)x2/2! +sin(0)x3/3!=1+0x-x2/2!+0x3/3!
=1-x2/2 =T2(x)
T4(x)=cos(0)-sin(0)x-cos(0)x2/2! +sin(0)x3/3! + cos(0)x4/4!
=1+0x-x2/2!+0x3/3!+x4/4!=1-x2/2!+x4/4!
T5(x)=1+0x-x2/2!+0x3/3!+x4/4!+0x5/5!=1-x2/2!+x4/4!=T4(x)
etc
ad esempio
T11(x) =1-x2/2!+x4/4! - x6/6! + x8/8! - x10/10!
OSSERVAZIONE la funzione cos(x) è pari e anche il polinomio di Taylor è pari, (compaiono solo le potenze pari di x)
APPLICAZIONE
calcolare cos(0,2) usando il polinomio di Taylor di grado 3 e maggiorare l'errore commesso utilizzando il risultato sui polinomi di Taylor
T3(x)=T2(x)=1-x2/2
e quindi
T3(0,2)=1-(0,2)2/2= 1- (2/10)2/2= 1-2/100=98/100=0,98
utilizzando la maggiorazione dell'errore e osservando che
M=max t in [x0 ,x] |f(n+1)(t)| ≤ 1
(la derivata n+1-sima è una fra le funzioni ±sin(t) o ± cos(t) e quindi sicuramente il suo valore assoluto è minore o uguale a 1)
otteniamo che
| cos(0,2) - T3(0,2) | = | cos(0,2)- (1-(0,2)2/2) | ≤ M (0,2)3/3! ≤ 1 (2/10)3/3! = (4/3) 10-3 = (circa) 1,33 10-3 ,
ossia che 0,97867=0,98 - 1,33 10-3 ≤ cos(0,2) ≤ 0,98 + 1,33 10-3 = 0,98133
(per curiosità dalla calcolatrice scientifica si ottiene che cos(0,2)=0,98006657784124163112419651674817)
Inoltre lo stesso vale per ogni x in [0,2/10]
ossia
| cos(x) - T3(x) | = | cos(x)- (1-x2/2) | ≤ max t in [0 ,x] |f(n+1)(t)| |x|3/3! ≤ 1 (0,2)3/3! = 1 (2/10)3/3! = (4/3) 10-3 = (circa) 1,33 10-3
cioè per ogni x in [0,2/10]
1-x2/2 - 1,33 10-3 ≤ cos(x) ≤ 1-x2/2 + 1,33 10-3
Polinomio di Taylor caso f(x)= sin(x) e x0=0
f(x)=sin(x)
f'(x)=cos(x)
f''(x)= -sin(x)
f'''(x)= -cos(x)
fiv(x)= sin(x)
e quindi si ottiene che si ricomincia daccapo
in particolare per f(x)=sin(x)
f(4k)(x)=sin(x)
f(4k+1)(x)=cos(x)
f(4k+2)(x)= -sin(x)
f(4k+3)(x)= -cos(x)
di conseguenza
f(0)=sin(0)=0
f'(0)=cos(0)=1
f''(0)= -sin(0)=0
f'''(0)= -cos(0)=-1
fiv(0)=sin(0)=0
e cosi' via
e quindi nello sviluppo di Taylor (o polinomio di Taylor) appaiono solo le potenze si esponente dispari e con segno alterno
ad esempio
T1(x)=0+1x=x
T2(x)=0+1x+0x2/2!= x =T1(x)
T3(x)=0+1x+0x2/2!- 1x3/3!=x-x3/3!
T4(x)=0+1x+0x2/2!- 1x3/3!+0 x4/4! =x-x3/3! =T3(x)
T5(x)=0+1x+0x2/2!- 1x3/3!+0 x4/4! + x5/5!=x-x3/3!+x5/5!
etc
ad esempio
T11(x) =x-x3/3!+x5/5! - x7/7! + x9/9! - x11/11! ( =T12(x) )
OSSERVAZIONE la funzione sin(x) è dispari e anche il polinomio di Taylor è dispari, (compaiono solo le potenze dispari di x)
Polinomio di Taylor caso f(x)= ln(1+x) e x0=0
T4(x)= 0 + x - x2/2 + x3/3- x4/4
e più in generale
Tn(x)= 0 + x - x2/2 + x3/3- x4/4 +....± xn/n (dove l'ultimo termine è + xn/n se n è dispari e - xn/n se n è pari)
DISCUSSIONE DEGLI ESERCIZI del tipo D.1, D.2 e D.3 del foglio 6
Attenzione alcuni studenti hanno pensato che la frase in D.2
" un polinomio di grado 4 ha un massimo in (1,1)" significasse che 1 è un punto di massimo assoluto e che quindi f(x) ≤ 1 per ogni x.
[tra l'altro è più usuale dire un polinomio di grado 4 ha un massimo nel punto 1 e il massimo vale 1, oppure 1 è un punto di massimo e f(1)=1 ]
Chiederò alla professoressa Menghini se questa interpretazione è corretta, ma se fosse cosi' credo che avrebbe detto che (1,1) è IL massimo e non UN massimo.
Analogamente se la frase in D.3
" un polinomio di grado 4 ha un minimo in (0,0) " si dovesse interpretare come ha un minimo assoluto allora il fatto che abbia anche un flesso orizzontale sarebbe inutile e la risposta giusta sarebbe banalmente la risposta 3A (ossia che il polinomio è sempre positivo)
Ad esempio per l'esercizio D.3 del foglio 6 si ha
che posto
P(x)=ax4+bx3+cx2+dx+e e quindi P(0)=e
P'(x)=4ax3+3bx2+2cx+d e quindi P'(0)=d
P''(x)=12ax2+6bx+2c e quindi P''(0)=2c
dalla condizione che 0 è un punto di minimo (locale) e che P(0)=0
si ha che
P(0)=e=0
P'(0)=d=0
P''(0)=2c≥0
ossia
P(x)=ax4+bx3+cx2
P'(x)=4ax3+3bx2+2cx= x(4ax2+3bx+2c)
P''(x)=12ax2+6bx+2c
Dalla condizione che ha un flesso orizzontale in un altro punto x=ξ≠0
si ottiene che esiste un punto ξ≠0, tale che
P'(ξ)=0
P''(ξ)=0
ossia ξ≠0 è soluzione del sistema
x(4ax2+3bx+2c)=0 (I)
12ax2+6bx+2c =0 (II)
che grazie alla condizione che ξ≠0 possiamo riscrivere come
4ax2+3bx+2c=0 (I')
12ax2+6bx+2c=0 (II)
Dalla (I') otteniamo che ξ= [ -3b ± ((3b)2 - 32ac)1/2 ]/ (8a)
Inoltre da (II) - (I') abbiamo che ξ≠0 è soluzione di
12ax2+6bx+2c -(4ax2+3bx+2c)= 8ax2+3bx = x(8ax+3b)=0
ed essendo ξ≠0 è soluzione di 8ax+3b=0 ossia ξ= -3b/(8a)
da cui , confrontando con la condizione ξ= [ -3b ± ((3b)2 - 32ac)1/2 ]/ (8a) = -3b/(8a)
abbiamo che (3b)2 - 32ac=0 e quindi
P'(x)=4a x (x- ξ)2
e quindi non possono esserci altri punti di massimo o minimo locale diversi da x=0
Quindi non può essere a<0 altrimenti ci sarebbero almeno altri due punti di massimo locale e ciò è impossibile.
DI CONSEGUENZA x=0 deve essere un minimo ASSOLUTO (o globale) e quindi la funzione P(x)≥0 per ogni x.
Volendo si potrebbe arrivare alla conclusione che a>0 anche osservando che
da (1/2)(II) - (I') si ottiene che
6ax2+3bx+ c -(4ax2+3bx+2c)= 2ax2- c=0
ossia (ricordando che a≠0 ) che
ξ2= c/(2a)
ed inoltre, essendo ξ≠0 (e quindi ξ2>0) e c≥0
deduciamo che c>0 e che anche a >0
Per l'esercizio D.3 del foglio 6 si ha
che posto
P(x)=ax4+bx3+cx2+dx+e e quindi P(0)=e P(1)= a+b+c+d+e
P'(x)=4ax3+3bx2+2cx+d e quindi P'(0)=d P'(1)=4a+3b+2c+d
P''(x)=12ax2+6bx+2c e quindi P''(0)=2c P''(1)=12a +6b+2c
dalla condizione che (1,1) è un massimo (locale) e che c'è un flesso nell'origine, come vediamo qui sotto non si riesce ad ottenere nulla
MA BISOGNA CHIEDERE ANCHE CHE NELL'ORIGINE CI SIA UN FLESSO ORIZZONTALE
otteniamo che
si ha che
P(0)=e=0
P(1)= a+b+c+d+e=1
[P'(0)=d = 0 ? se possiamo dire se è un flesso orizzontale, ma non la usiamo per il momento]
P'(1)= 4a+3b+2c+d =0
P''(0)=2c = 0
P''(1)= 12a +6b+2c ≤0
dalle condizioni P(0)=e=0 e P''(0)=2c = 0
possiamo dire che
P(x)=ax4+bx3 +dx
P'(x)=4ax3+3bx2 +d
P''(x)=12ax2+6bx
e le altre condizioni diventano
P(1)= a+b+d=1 cioè d=1-(a+b) (I)
P'(1)= 4a+3b+ d =0 cioè d=-4a-3b (II)
P''(1)= 12a +6b ≤0 (III)
dal confronto tra (I) e (II) otteniamo che
1-(a+b)=-4a-3b cioè 1-a+4a = b-3b ossia 1+3a = - 2b e infine b= - (1+3a)/2
e inserendo questo risultato in (III) possiamo affermare che
12a +6b = 12 a - 3 (1+3a) = 3a -3 =3( a-1) ≤0 ossia a ≤ 1
e di conseguenza ricordando che
d=1-(a+b) = 1-a +(1+3a)/2= [2-2a +1+3a]/2= (3+a)/2
P(x)=ax4-(1+3a)x3 /2 + (3+a) x /2
P'(x)=4ax3 - 3(1+3a) x2 /2 +(3+a)/2
P''(x)=12ax2 - 3(1+3a) x
ed è ben difficile poter dire qualcosa!!
SE INVECE PONIAMO LA CONDIZIONE CHE IN (0,0) CI SIA UN FLESSO ORIZZONTALE, ALLORA ABBIAMO ANCHE LA CONDIZIONE
P'(0)=d = 0 allora potremo dire che d=0 e che quindi
P(x)=ax4+bx3
P'(x)=4ax3+3bx2
P''(x)=12ax2+6bx
e le altre condizioni diventano
P(1)= a+b =1 cioè b=1-a
P'(1)= 4a+3b =0 cioè 4a +3(1-a)=a+3=0 e cioè a=-3 e b=1-(-3)=4
P''(1)= 12a +6b = 6(2a+b) ≤0 e coerentemente 2a+b=-6+4=-2<0
e quindi
P(x)= -3 x4 +4 x3 = x3 (-3x+4) =-x3 (3x-4)
e il segno di P(x) è dato dal sistema
P(x)>0 se e solo se
-x3>0 e 3x-4>0, cioè x<0 e x>4/3 (impossibile)
OPPURE
-x3<0 e 3x-4<0, cioè x>0 e x<4/3 ossia 0<x<4/3
e quindi
P(x) <0 per x<0 e anche P(x)<0 per x>4/3
IN DEFINITIVA possiamo dire che P(x) è negativa a sinistra di 0 (cioè per x<0)
..
mercoledì 2 dicembre Aula A del Plesso Tecce (ore 15-17)
Integrali definiti: ∫ab f(t)dtè il simbolo che si usa per l'integrale definito di f(t) [ in dt ] tra a e b.
a e b sono detti estremi di integrazione
(i) interpretazione geometrica, se a<b, la funzione f(x) è a valori positivi (o nulli) l'idea è definire ∫ab f(t)dt come area della regione compresa tra l'asse x e la funzione f(x), per x in [a,b],ossia del seguente insieme di punti del piano
{ (x,y) con a≤x≤b e 0≤y≤f(x) }
(ii) definizione formale:
(ii.a) il caso di funzioni costanti a tratti: se l'intervallo [a,b] è diviso in sottointervali del tipo [xk-1,xk) (con a=x0<x1<x2<....<xn-1<xn=b ) e la funzione f(x) è costante su ciascun intervallo [xk-1,xk), e più precisamente
f(x)=ck per x in [xk-1,xk)
allora
∫ab f(t)dt = c1 (x1-x0) + c2 (x2-x1)+... + ck (xk-xk-1)+...+cn-1 (xn-1-xn-2)+cn (xn-xn-1)
= ∑k=1 n ck (xk-xk-1)
(ii.b) il caso di funzioni continue in [a,b]: comunque si divida l'intervallo in n sottointervalli del tipo [xk-1,xk) (con a=x0<x1<x2<....<xn-1<xn=b ) si possono definire due funzioni costanti a tratti nel seguente modo
f1(x) = mk per x in [xk-1,xk)
dove mk=min x in [xk-1,xk] f(x)
ed
f2(x) = Mk per x in [xk-1,xk)
dove Mk=MAX x in [xk-1,xk] f(x)
di modo che, chiaramente, f1(x) ≤ f(x)≤f2(x) per ogni x in [a,b]
(si ricorda che essendo f(x) una funzione continua, il massimo e il minimo su ogni intervallo chiuso e limitato sono univocamente individuati)
OSSERVAZIONE ovviamente le funzioni f1(x) ed f1(x) dipendono da f, ma anche da n e dalla suddivisione scelta, ossia da a=x0<x1<x2<....<xn-1<xn=b, ma, per semplicità di notazione, tali dipendenze vengono omesse.
Di conseguenza (con un disegno diventa tutto più semplice)
{ (x,y) con a≤x≤b e 0≤y≤f1(x) } è contenuto in { (x,y) con a≤x≤b e 0≤y≤f(x) } che a sua volta è contenuto in { (x,y) con a≤x≤b e 0≤y≤f2(x) }
e quindi l'area della regione che ci interessa, ossia {(x,y) con a≤x≤b e 0≤y≤f(x)}, è compresa tra l'area della regione { (x,y) con a≤x≤b e 0≤y≤f1(x) } che è appunto
∫ab f1(t)dt = ∑k=1 n mk (xk-xk-1)
e l'area della regione { (x,y) con a≤x≤b e 0≤y≤f2(x) } che è appunto
∫ab f2(t)dt = ∑k=1 n Mk (xk-xk-1)
ovvero
∫ab f1(t)dt = ∑k=1 n mk (xk-xk-1)≤ A ≤∫ab f2(t)dt = ∑k=1 n Mk (xk-xk-1)
(dove A= area della regione che ci interessa)
Poiché f(x) è una funzione continua, si dimostra che infittendo la suddivisione in intervalli (e quindi per n che tende all'infinito) in modo che l'ampiezza di ciascun intervallo [xk-1,xk) , cioè |xk-xk-1| , tenda a zero, allora le due somme sono sempre piu' vicine.
Il valore dell'integrale di f(x) tra a e b, in simboli ∫ab f(t)dt è appunto questo valore "limite"
OSSERVAZIONE il motivo per cui tale se l'ampiezza di ciascun intervallo [xk-1,xk), cioè |xk-xk-1| , tenda a zero, la differenza tra
∑k=1 n Mk (xk-xk-1) e ∑k=1 n mk (xk-xk-1) è piccola
è perché, essendo la funzione continua, e l'intervallo "piccolo" la funzione varia poco in tale intervallo e quindi per ogni x in [xk-1,xk), f(x) è "vicino sia ad mk che a Mk, e quindi sia Mk (xk-xk-1) che mk (xk-xk-1) sono "vicini" a f(xk)(xk-xk-1). Ovviamente questa non è una dimostrazione formale, ma rende l'idea del motivo.
ESEMPIO: Calcolo dell'integrale della funzione f(x)=x tra 0 e 1 (con la definizione formale)
e dell'integrale della funzione f(x)=x2 tra 0 e 1 (con la definizione formale).
Il caso f(x)=x si potrebbe facilmente risolvere graficamente (se disegnate sul piano cartesiano la retta y=x, si vede immediatamente che la regione
{ (x,y) con 0≤x≤1 e 0≤y≤x }
è un triangolo di area 1/2.
Tuttavia vogliamo riottenere lo stesso risultato utilizzando il procedimento illustrato dalla definzione formale
(ovviamente serve solo come esempio, ma vedremo che ci sono metodi piu' efficaci per "calcolare" gli integrali definiti)
Si considera la suddivisione dell'intervallo [0,1] con xk=k/n, di modo che xk-xk-1 = 1/n per ogni k=1,...,n.
Si vede facilmente che, essendo la funzione f(x)=x crescente
mk=min x in [xk-1,xk] f(x) = min x in [xk-1,xk] x = xk-1= (k-1)/n
e
Mk=MAX x in [xk-1,xk] f(x) = MAX x in [xk-1,xk] x = xk= k/n
per cui
∫01 f1(t)dt = ∑k=1 n mk (xk-xk-1)
= ∑k=1 n (k-1)/n [1/n]
= [1/n2] [0+1+2+...+(n-1)]
e
∫01 f2(t)dt = ∑k=1 n Mk (xk-xk-1)
= ∑k=1 n k/n [1/n] = [1/n2] [1+2+...+(n-1)+n]
= [1/n2] n(n+1)/2 =(1/2) [ n2+n]/n2
che tende a 1/2 all'infittirsi della suddivisione, ossia quando n tende all'infinito.
(abbiamo usato la formula 1+2+...+n=n(n+1)/2 e il fatto che [ x2+x]/x2 tende a 1 per x che tende ad infinito)
Inoltre si vede facilmente che
∫01 f2(t)dt - ∫01 f1(t)dt
= [1/n2] { [1+2+...+(n-1)+n] - [0+1+2+...+(n-1)] }m = [1/n2] n = 1/n
che tende a zero per n che tende all'infinito e quindi abbiamo ottenuto che
all'infittirsi della suddivisione i valori di ∫01 f2(t)dt e di ∫01 f1(t)dt tendono entrambi a 1/2, come si voleva, ossia che
∫01 t dt =1/2 corentemente con l'interpretazione geometrica.
Il caso di f(x)=x2 è ben fatto sul libro, qui osserviamo solo che si tratta di ripetere quanto fatto nel caso f(x)=x
ma osservando che in questo caso mk=[(k-1)/n]2 e Mk=[k/n]2.
Quindi in questo caso
∫01 f1(t)dt = ∑k=1 n mk (xk-xk-1)
= ∑k=1 n [(k-1)/n]2 [1/n] = [1/n2] [02+12+22+...+(n-1)2]
e
∫01 f2(t)dt = ∑k=1 n Mk (xk-xk-1)
= ∑k=1 n [k/n]2 [1/n] = [1/n3] [12+22+...+(n-1)2+n2] =
[1/n3] n(n+½)(n+1)/3 = (1/3) [n(n+½)(n+1)]/n3
che tende a 1/3
(abbiamo usato la formula 12+22+...+(n-1)2+n2 = n(n+½)(n+1)/3 = n(2n+1)n/6 )
e anche qui
∫01 f2(t)dt - ∫01 f1(t)dt = [1/n2] {[12+22+...+(n-1)2+n2] - [02+12+22+...+(n-1)2] }
= [1/n3] n2 = 1/n
che tende a zero per n che tende all'infinito
In definitiva abbiamo ottenuto che
∫01 t2dt =1/3.
Estensioni e alcune proprietà
1) estensione al caso di funzioni che possono assumere valori negativi (area segnata)
2) estensione al caso in cui gli estremi di integrazione non sono in ordine crescente ossia, se x1 < x2 , allora, per definizione si pone
∫x2x1 f(t)dt = - ∫x1x2 f(t)dt
Proprietà dell'integrale definito:
se a<c<b allora ∫ab f(t)dt = ∫ac f(t)dt + ∫cb f(t)dt
(ovvia, se si pensa all'interpretazione geometrica come area)
Quest'ultima proprietà permette di estendere l'integrale anche a funzioni definite a tratti, in modo che su ciascun intervallo siano continue.
Inoltre, le altre proprietà permettono di definire la seguente funzione:
Fa(x)=∫ax f(t)dt
sia per x maggiore di a che per x minore di a e di osservare che
SE LA FUNZIONE f(x) è continua,
allora la funzione Fa(x) è derivabile e ha derivata prima uguale a f(x) ossia
(d/dx)Fa(x)=f(x)
--------------------------------------------------
Idea euristica:
Fa(x+Δ)=∫ax+Δ f(t)dt = ∫ax f(t)dt + ∫xx+Δ f(t)dt = Fa(x) + ∫xx+Δ f(t)dt
quindi il rapporto incrementale vale
[Fa(x+Δ) - Fa(x)]/Δ = ∫xx+Δ f(t)dt / Δ
inoltre se Δ è "piccolo" allora
∫xx+Δ f(t)dt è molto "vicino" al prodotto f(x) Δ
in quanto per ogni t in [x, x+Δ] il valore f(t) è "vicino" a f(x) [perché f è continua]
e quindi
[Fa(x+Δ) - Fa(x)]/Δ = ∫xx+Δ f(t)dt / Δ =(circa) f(x) Δ/ Δ = f(x).
DEFINIZIONE di una FUNZIONE PRIMITIVA di una funzione data
data una funzione f(x) ed una funzione F(x) tale che
la derivata F'(x)=f(x)
si dice allora che la funzione F(x) è una funzione primitiva di f(x).
Abbiamo quindi trovato che la funzione Fa(x)=∫ax f(t)dt è una funzione primitiva di f(x).
Osservazioni Se F1(x) è una funzione primitiva di f(x), allora anche la funzione F2(x)=F1(x)+C, doce C è una costante, è una primitiva
[ infatti se (d/dx)F1(x) = f(x)
allora (d/dx) F2(x)= (d/dx)( F1(x)+C) = (d/x) F1(x) + (d/dx) C = f(x) +0 ]
e viceversa,
se F1(x) ed F2(x) sono entrambe funzione primitive di f(x) allora
F1(x) ed F2(x) differiscono per una costante
[ Infatti se (d/dx)F1(x) = f(x) e (d/dx)F2(x) = f(x)
allora (d/dx)[F2(x) - F2(x)] = (d/dx)F2(x) - (d/dx)F2(x) = f(x)-f(x) =0
e inoltre se una funzione g(x) è tale che g'(x)=0 allora g(x) è costante e quindi la funzione g(x)=F2(x) - F2(x) è costante ]
Cenno al fatto che questa proprietà sarà la chiave di volta per poter calcolare esplicitamente gli integrali definiti e al legame tra primitive e integrali definiti.
..
venerdì 4 dicembre Aula C di Medicina Legale (ore 11-13)
Relazione tra integrale definito e integrale indefinito ed esempi
Definizione di integrale indefinito
L'integrale indefinito di f(x) è la collezione delle funzioni F(x) primitive di f(x) ossia tali che F'(x)=f(x) e viene denotato con
∫ f(x)dx = { funzioni F(x) tali che F'(x)=f(x) }
Dalla lezione precedente sappiamo che data una primitiva F(x) tutte le atre primitive differiscono da F(x) per una costante, ossia per ogni F1(x) primitiva di f(x) esiste una costante C tale che F1(x)=F(x)+C e quindi possiamo scrivere
∫f(x)dx = { funzioni F(x)+C con C costante }dove F è una fissata primitiva di f
TUTTAVIA C'E' UNA NOTAZIONE PIU' SEMPLICE OSSIA
∫f(x)dx = F(x)+C
Come abbiamo visto euristicamente nella lezione precedente, la funzione
Fa(x)=∫ax f(t)dtè una primitiva di f(x) e quindi fissata una primitiva F(x) possiamo affermare che esiste una costante C tale che
Fa(x)=∫ax f(t)dt =F(x)+C
Inoltre, tenendo conto che Fa(a)=0 (come del resto discende immediatamente dall'interpretazione dell'integrale come area)
possiamo affermare che
∫abf(t)dt = Fa(b)=Fa(b)-Fa(a)= F(b)+C - (F(a)+C)=F(b)-F(a)
IN CONCLUSIONE ABBIAMO TROVATO IL LEGAME TRA INTEGRALE DEFINITO di f(x) E INTEGRALE INDEFINITO di f(x) [ ossia la famiglia delle primitive, cioà le funzioni F(x) tali che F'(x)=f(x) ]
∫abf(t)dt = F(b) - F(a) ( = "notazione"= F(x)|ab )
Per trovare le fuzioni primitive si usa la tabella delle derivate e la si legge al contrario, ad esempio-----------------------------
(d/dx) ex = ex e quindi (d/dx) [ex+C] = ex
da cui si ottiene che∫ex dx= ex +C
-----------------------------
(d/dx)ln x = 1/x e quindi (d/dx) [lnx + C] = 1/x, con x>0
da cui si ottiene che∫1/x dx = lnx + C, con x >0
-----------------------------
(d/dx) xa = a xa-1 ovvero per comodità (d/dx) xa+1 /(a+1)= xa
e quindi (d/dx) [xa+1/(a+1) + C] = xa
da cui si ottiene che∫xa dx = xa+1/(a+1) + C
OVVIAMENTE DEVE ESSERE a+1≠0 ossia a≠-1,
ma del resto per a=-1, ossia per f(x)=x-1=1/x, abbiamo già visto che ∫1/x dx = lnx + C
-----------------------------
(d/dx)cos(x) = -sin(x) e quindi (d/dx) [-cos(x) + C] = sin(x)
da cui si ottiene che∫sin(x) dx = -cos(x) + C
-----------------------------
(d/dx)sin(x) = cos(x) e quindi (d/dx) [sin(x) + C] = cos(x)
da cui si ottiene che∫cos(x) dx = sin(x) + C
-----------------------------
(d/dx)arcsin(x) = 1/(1-x2)½ e quindi (d/dx) [ arcsin(x)) + C] = 1/(1-x2)½, per |x|<1
da cui si ottiene che∫1/(1-x2)½ dx = arcsin(x) + C
-----------------------------
Ovviamente si ha anche che
(d/dx)arccos(x) = -1/(1-x2)½ e quindi (d/dx) [-arccos(x)) + C] = 1/(1-x2)½ , per |x|<1
da cui si ottiene che∫1/(1-x2)½ dx = -arccos(x) + C
Ciò non contraddice il risultato precedente in quanto arccos(x) = -arcsin(x) + π/2
(per convincersene basta fare un disegno)-----------------------------
(d/dx)arctan(x) = 1/(1+x2) e quindi (d/dx) [ arctan(x)) + C] = 1/(1+x2)
da cui si ottiene che∫1/(1+x2) dx = arctan(x) + C
-----------------------------
Da questa prima tabella si ottiene ad esempio che
∫01 et dt = e1 - e0 = e-1 ( "notazione " ∫01 et dt = ex|01 =e1 - e0 = e-1 )Sul libro si trova una tabella completa, ma suggerisco anche la tabella da youmath all'indirizzo
http://www.youmath.it/lezioni/analisi-matematica/integrali/596-integrali-notevoli.html
Esercizi vari in cui si è usata la proprietà di linearità dell'integrale definito e di quello indefinito.Per l'integrale indefinito questa proprietà significa che
∫ [α f(x) + β g(x) ] dx = α ∫ f(x)dx + β ∫ g(x)dx
come discende immediatamente dalla proprietà di linearità delle derivate
infatti se ∫ f(x)dx = F(x)+C e ∫ g(x)dx=G(x)+K, ossia se F'=f e G'=g allora
(d/dx) [ α F(x) + β G(x) ] = α F'(x) + β G'(x) = α f(x) + β g(x)
che significa appunto che α F(x) + β G(x) è una primitiva di α f(x) + β g(x)
..
lunedì 8 dicembre VACANZA ACCADEMICA
mercoledì 10 dicembre Aula A del Plesso Tecce (ore 15-17)
Integrazione per sostituzione e integrazione per parti esercizi ed esempi
Integrazione per sostituzione:
Sia F(x) una primitiva di f(x) [cioè F'(x)=f(f) ] e sia g(x) derivabile,
allora F(g(x)) è una primitiva di f(g(x)) g'(x)
INFATTI (d/dx) F(g(x))= F'(g(x)) g'(x) =f(g(x)) g'(x)
ovvero se ∫ f(x)dx = F(x)+C allora ∫ f(g(x)) g'(x) dx = F(g(x))+C
SI USA ANCHE LA SEGUENTE NOTAZIONE
∫ f(g(x)) g'(x) dx = ∫ f(t) dt |t=g(x) = F(t)|t=g(x) +C = F(g(x))+C
dove il simbolo |t=g(x) significa "calcolato in t=g(x)
DI CONSEGUENZA
∫abf(g(t))dt = F(g(b)) - F(g(a)) ( = "notazione"= F(g(x))|ab )
ESEMPIO
∫ sin2(x) cos(x) dx = ∫ sin2(x) (d/dx)sin(x) dx = sin3(x)/3 +C
qui g(x)=sin(x) f(t)=t2 e F(t)=t3/3
Integrazione per parti:
Dalla formula di derivazione del prodotto di due funzioni si ha che
(d/dx) (f(x)g(x))=f'(x) g(x) + f(x) g'(x)
o equivalentemente
f(x) g'(x) = (d/dx) (f(x)g(x)) - f'(x) g(x).
Quindi per la linearità dell'integrale indefinito e osservando che f(x)g(x) è ovviamente una primitiva di (d/dx) (f(x)g(x))
si ottiene la formula di integrazione per parti:
∫ f(x) g'(x) dx = f(x)g(x) - ∫f'(x) g(x) dx
e analogamente, per l'integrale definito
∫ab f(x) g'(x) dx = f(x)g(x)|ab - ∫ab f'(x) g(x) dx = f(b)g(b) - f(a)g(a) - ∫ab f'(x) g(x) dx
Questa formula va utilizzata ovviamente solo se si sa calcolare ∫ f'(x) g(x) dx.
ESEMPIO calcolo di ∫ xex dx
Se prendessimo f(x)=ex, g'(x)=x e quindi g(x)= x2/2 dalla FORMULA DI INTEGRAZIONE PER PARTI otterremmo
∫xex dx = ex x2/2 - ∫ ex x2/2 dx
ma non sapremmo come calcolare l'integrale indefinito
se invece prendiamo
f(x)=x e g'(x)=ex, e quindi g'(x)=ex dalla FORMULA DI INTEGRAZIONE PER PARTI otteniamo
∫xex dx =x ex - ∫ ex dx = x ex - ex +C
ESEMPIO A volte è necessario usare la formula di integrazione per parti piu volte, come nel caso di
∫x2ex dx =x2 ex - ∫ ex 2x dx = x2 ex - 2 ∫xex dx = x2 ex -2 (x ex - ∫ ex dx)
= x2 ex - 2 x ex + 2 ex + C
Questo procedimento si può utilizzare per calcolare
∫xnex dx con n intero! ma se n non è intero non sarebbe utile.
..
venerdì 12 dicembre Aula C di Medicina Legale (ore 11-13)
Esempi di uso della formula di integrazione per sostituzione e per parti.
valore medio di una funzione in un intervallo [a,b] limitato (ossia -inf< a<b< +inf)
Esercizi dal foglio 7
integrale di log (x)
integrale indefinito di 1/(x2-1)½lunedì 14 dicembre Aula C di Medicina Legale (ore 11-13)
Equazioni differenziali: definizione e vari esempi di equazioni differenziali lineari
Soluzione generale, soluzione particolare, Equazioni differenziali in forma normale e problema di Cauchy
Enunciato del teorema di Cauchy per equazioni differenziali di ordine 1 e di ordine 2
Esempi di applicazionelunedì 14 dicembre Aula A del Plesso Tecce (ore 15-17)
integrali tra a e + ∞, tra -∞ e b, e tra -∞ e +∞
Esempi :
1) integrale di e-x tra 2 e +∞
2) generalizzazione al caso e-λ x con λ >0 tra 0 e +∞
3) caso dell'area tra 0 e 1 di ln (x) geometricamente e analiticamente
4) integrale tra 1 e +∞ di x-β che è finito per β >1 e infinito altrimenti
5) integrale indefinito di 1/(x2-1)½ (per |x|>1) e generalizzazione al caso dell'integrale indefinito di 1/(x2-a2)½ e 1/(x2+a2)½
Seconda ora esercizi
..
mercoledì 16 dicembre Aula A del Plesso Tecce (ore 15-17)
1) Equazione differenziale del tipo dy/dx= k y/x con soluzione generale y(x)=Cxk: soluzione per verifica
INFATTI y'(x)=Ckxk-1= k Cxk/x = ky(x)/x.
2) Equazione differenziale del tipo dy/dx= a y(1-y) , con a>0 e con la richiesta che 0<y<1, con soluzione generale y(x)=1/(1+Ce-ax): soluzione per verifica, solo per C>0 (così la funzione y(x) è definita per ogni x e vale 0<y(x)<1 )
INFATTI, ricordando che (d/dx)[1/f(x)]= - f'(x)/f2(x)
y'(x)= - [ C e-ax (-a) ]/ [ 1+ C e-ax ]2= ( 1/[ 1+ C e-ax ] ) ([ a C e-ax ] /[ 1+ C e-ax ] )
= y(x) a (1-y(x) ) = a y(x) (1-y(x) )
in quanto a(1-y(x))= a (1- 1 /[1+ C e-ax ] ) = a ( [1+ C e-ax -1] /[1+ C e-ax ] )= a C e-ax /[1+ C e-ax ]
Studio delle soluzioni y(x)=1/(1+Ce-ax) al variare di C>0, ossia
a) la funzione è definita per ogni x e vale 0<y(x)<1 per ogni x
b) la funzione è crescente su tutto R, infatti
y'(x)= a y(x) (1-y(x) ) >0 [in quanto a>0, y(x)>0 e 1-y(x)>0]
c) COMPORTAMENTO AI BORDI
limx→+∞ y(x)= limx→+∞ 1/[1+ C e-ax ] =1/[1+0]=1
limx→-∞y(x)= limx→-∞ 1/[1+ C e-ax ] (=1/[1+∞] )=0
d) PUNTI DI FLESSO, CONCAVITA' e CONVESSITA'
per trovare i punti di flesso e studiare la concavità e la convessità di y(x) bisogna calcolare la derivata seconda e studiarne il segno, ma invece di calcolarla esplicitamente utilizziamo l'equazione differenziale che la funzione y(x) soddisfa, come illustrato qui sotto:
y''(x)= (d/dx) y'(x) = (d/dx) a y(x) (1-y(x) ) = a(d/dx)[ y(x) - y2(x) ]= a [y'(x)-2y(x)y'(x) ]= a y'(x) [1-2y(x)]
ora si vede immediatamente che essendo a> e y'(x)>0 [come visto nel punto b)]
y''(x) >0 se e solo se 1-2y(x) >0 ossia la funzione è convessa se e solo se y(x)<1/2, è concava se e solo se y(x) >1/2 ed ha un flesso se e solo se y(x)=1/2
INFINE a soluzione di y(x)=1/2 equivale a trovare x tale che
1/[1+ C e-ax ] =1/2 cioè 1+ C e-ax = 2 cioè C e-ax = 1
cioè (moltiplicando ambo i membri dell'uguaglianza per eax )
C = eax, ed infine si ottiene che l'unico punto di flesso è
x=ln(C)/2
ATTENZIONE y(x)=1/(1+Ceax) è soluzione dell'equazione dy/dx= - a y(1-y)
Enunciato (parziale) del Teorema di Cauchy sull'esistenza e unicità delle soluzioni di un'equazione differenziale ordinaria del primo ordine in forma normale y'=Φ(x,y) con condizione iniziale y(x0)=y0.
METODO GENERALE PER TROVARE LA SOLUZIONE DEL PROBLEMA DI CAUCHY di ordine 1: data una soluzione generale, che dipende da una costante C (o meglio da un parametro C) , imporre la condizione che y(x0)=y0, e trovare il valore C: il teorema di Cauchy ci garantisce che si trova sempre una e una sola soluzione.
ESEMPIO la soluzione di y'(x)= 3 y(x) (1-y(x) ) con y(1)=3/4 è quella funzione
y(x)= 1/[1+ C e-3x ] tale che y(1)= 1/[1+ C e-3 ] =3/4 ossia 1+ C e-3= 4/3, ossia C=e3/3, e la soluzione cercata è
y(x)= 1/[1+ (e3/3) e-3x ]= 3/[3+ e-3(x-1) ]
METODO GENERALE PER TROVARE LA SOLUZIONE DEL PROBLEMA DI CAUCHY di ordine 2: ossia del problema del tipo
y''=Φ(x,y, y') con condizioni iniziali y(x0)=y0 e y'(x0)=y'0.
Data una soluzione generale, che dipende da due costanti A e B, imporre le condizioni che y(x0)=y0 e y'(x0)=y'0, e trovare i valori A e B: il teorema di Cauchy ci garantisce che si trova sempre una e una sola coppia (A,B) che individua la soluzione cercata.
Nel libro si accenna al caso in cui invece delle condizioni del tipo y(x0)=y0 e y'(x0)=y'0, si richiedono condizioni del tipo y(x0)=y0 e y(x1)=y1. In questo caso PUO' SUCCEDERE che ci sia una sola soluzione, oppure nessuna o infinite.
Come esempio abbiamo visto il caso dell'equazione del tipo
y''(x)=- k y(x) con k>0
la cui soluzione generale è
y(x)= A sin (√k x) + B cos (√k x).
Considerando che
y'(x)= A cos (√k x) √k - B sin (√k x) √k .
e che quindi
y(x0)= A sin (√k x0) + B cos (√k x0),
e
y'(x0)= A cos (√k x0) √k - B sin (√k x0) √k,
imporre la condizione y(x0)=y0 e y'(x0)=y'0,
significa risolvere il seguente sistema di due equazioni nelle due incognite A e B
A sin (√k x0) + B cos (√k x0)=y0,
A cos (√k x0) √k - B sin (√k x0) √k= y'0,
la cui matrice è
sin (√k x0) cos (√k x0)
cos (√k x0) √k - sin (√k x0) √k
con determinante
- sin2(√k x0) √k - cos2(√k x0) √k= - √k ( sin2(√k x0) + cos2(√k x0) ) = - √k ≠ 0
e quindi esiste sempre una e una sola soluzione (come del resto ci garantisce il teorema di Cauchy)
INVECE se proviamo ad imporre le condizioni "al bordo" del tipo y(x0)=y0 e y(x1)=y1, otteniamo il sistema
A sin (√k x0) + B cos (√k x0) = y0,
A sin (√k x1) + B cos (√k x1) = y1,
la cui matrice è
sin (√k x0) cos (√k x0)
sin (√k x1) cos (√k x1)
con determinante
sin(√k x0) cos (√k x1) - cos(√k x0) sin (√k x1) = sin(√k x0- √k x1)
che può essere nullo o non a seconda dei valori di √k, x0 e x1 e quindi NON E' DETTO CHE abbia una e una sola soluzione, ossia ce ne è una e una sola se sin(√k x0- √k x1) ≠ 0, mentre se sin(√k x0- √k x1) = 0 potrebbe non esserci soluzione o invece potrebbe accadere che ne abbia infinite (dipende dai valori di y0 e y1)
METODI DI SOLUZIONE DELLE EQUAZIONI DIFFERENZIALI
1) Equazioni differenziali a variabili separabili OSSIA del tipo
y'(x)= g(x) h( y)
Per la spiegazione di questo metodo viene introdotta la nozione di differenziale di una funzione f(x) e riscritto il metodo di integrazione per sostituzione con l'uso dei differenziali.
(TRA L'ALTRO QUESTO FATTO SPIEGA IL NOME DI EQUAZIONI DIFFERENZIALI)
DEFINIZIONE Data una funzione derivabile f(x), con derivata continua, si chiama differenziale di f(x) l'espressione df(x)= f'(x)dx
SIGNIFICATO GEOMETRICO del differenziale: fissato x0, l'equazione della retta tangente in x0, è y(x)-f(x0)=f'(x0) (x-x0), ovvero
y(x) = f(x0) + f'(x0) (x-x0)
ed in particolare y(x0)=f(x0). Se consideriamo la differenza della retta tangente nei punti x0+Δx e x0, ossia y(x0+Δx) -y(x0), si ha che
y(x0+Δx) -y(x0) = f(x0) + f'(x0) (x0+Δx-x0) - f(x0) = f'(x0) Δx
Prendendo un x generico al posto di x0 e dx al posto di Δx otteniamo che
y(x +dx) -y(x) = f'(x) dx = df(x)
e QUINDI il significato geometrico del differenziale come incremento della retta tangente nell'intervallo di estremi x e x+dx
Questa notazione permette di riscrivere la regola di integrazione per sostituzione in modo più " accattivante"
Supponiamo che ∫ φ(x) dx = Φ(x) +C
(ma possiamo anche scrivere ∫ φ(t) dx = Φ(t) +C )
e che f(x) sia una funzione derivabile, con derivata continua, allora sappiamo che
∫ φ(f(x)) f'(x)dx = Φ(f(x)) +C = Φ(t)| t=f(x) +C
ora, usando il differenziale possiamo riscrivere questa formula come
∫ φ(f(x)) f'(x)dx = ∫ φ(f(x)) df(x) = ∫ φ(f) df | f=f(x) .
QUESTO MODO DI SCRIVERE CI SARA' UTILE PER SCRIVERE PIU' SEMPICEMENTE il METODO DI SOLUZIONE PER LE EQUAZIONE A VARIABILI SEPARABILI.
INFATTI un'equazione del tipo
y'(x)= g(x) h( y(x) )
equivale a y'(x) dx = g(x) h( y(x)) dx ovvero a [y'(x) dx]/ h( y(x)) = g(x) dx
e quindi i due integrali indefinitisono uguali ossia
∫ [1/ h( y(x))] y'(x) dx = ∫ g(x) dx che possiamo esprimere anche come
∫ [1/ h( y(x))] dy(x) = ∫ g(x) dx
o brevemente come
∫ [1/ h( y)] dy | y=y(x)= ∫ g(x) dx
di conseguenza, posto H(t) una primitiva di 1/h(t) e G(x) una primitiva di g(x) si ottiene
H(y(x))= G(x) + C
e SE LA FUNZIONE H è INVERTIBILE per ottenere la funzione y(x) basta applicare a entrambi i membri della precedente uguaglianza H-1 ottenendo così la soluzione generale dell'equazione differenziale
y(x)= H-1 ( H(y(x)) ) = H-1( G(x) + C )
ESEMPIO calcolo della soluzione dell'equazione dy/dx= k y/x che è a variabili separabili.
Per calcoloare la soluzione del problema di Cauchy si può procedere come al solito: data la soluzione del
2) Equazioni lineari del primo ordine a coefficienti non costanti ossia del tipo
a(x)y'(x) + b(x) y(x) + c(x) = 0
con a(x)≠0 (ALTRIMENTI NON è un'equazione differenziale)
e quindi equivalente a
y'(x) + [b(x)/a(x)] y(x) + [c(x)/a(x)] = 0
cioè, posto B(x)=b(x)/a(x) e C(x)=c(x)/a(x), equivalente a
y'(x) + B(x) y(x) + C(x) = 0
(a) CASO OMOGENEO (cioè C(x)=0) e quindi a variabili separabili
(b) CASO GENERALE (cioè C(x) non necessariamente nullo) con il metodo della variazione delle costanti (ideato da Lagrange)
Il metodo è spiegato sul libro (per il momento non vado avanti)
AGGIUNTA: l'equazione omogenea è y'(x) + B(x) y(x) = 0
che è a variabili separabili ossia y'(x)/y(x)=-B(x) che equivale ady/y=-B(x)dx cioè ∫dy/y = - ∫B(x)dx
e quindi, se FB(x) è una primitiva di B(x), cioè (d/dx)FB(x)=B(x),
ln|y(x)| = - FB(x) +c
(equivalentemente, come sul libro, si scrive anche ln|y(x)| = - ∫B(x)dx +c )
da cui, posto C=ec, (e quindi C>0)
|y(x)| = eln|y(x)| = e- FB(x) +c= C e- FB(x)
(o anche, come sul libro, |y(x)| = C e- ∫B(x)dx )
ora ci accorgiamo che si può tolgiere il valore assoluto e si ottiene che la soluzione generale è
y(x) = C e- FB(x) (o anche y(x)= C e- ∫B(x)dx ),
con C che può assumere un qualunque valore reale (senza la restrizione che C>0)
Ora si cerca la soluzione dell'equazione differenziale non omogenea
y'(x) + B(x) y(x) + C(x) = 0 o equivalentemente y'(x) = - B(x) y(x) - C(x)
del tipo y(x)=u(x) e- FB(x)cioè:
al posto della costante C si mette una funzione u(x) che "varia al variare di x"
da questa osservazione il nome di metodo della variazione delle costanti (o della costante)
y'(x) = (d/dx)[u(x) e- FB(x) ] = u'(x) e- FB(x) + u(x) e- FB(x) (-B(x))
= u'(x) e- FB(x) -B(x) u(x) e- FB(x) = u'(x) e- FB(x) -B(x) y(x)
e quindi la funzione y(x)=u(x) e- FB(x) è soluzione dell'equazione y'(x) = - B(x) y(x) - C(x) se e solo se
u'(x) e- FB(x) - B(x) y(x) = - B(x) y(x) - C(x)
ossia se e solo se
u'(x) e- FB(x) = - C(x) cioè u'(x) = - C(x) e FB(x)
che equivale a chiedere che
u(x)= - ∫ C(x) e FB(x) dx = L(x)+C dove L(x) è una primitiva di C(x) e FB(x) .
In definitiva la soluzione dell'equazione lineare non omogenea
y'(x) + B(x) y(x) + C(x) = 0
è data da
y(x) = - (∫ C(x) e FB(x) dx ) e- FB(x) = (-L(x) +C) e- FB(x)
ovvero, come sul libro,
>y(x) = - e- ∫B(x) dx (∫ C(x) e ∫B(x) dx + K)
ESEMPIO equazione differenziale y'=A(M-y)
OMOGENEA y' = -Ay la cui soluzione è yo(x) = C e-Ax
(il sottoindice ci ricorda che è la soluzione dell'equazione differenziale omogenea)
cerchiamo la soluzione di y'=AM-Ay del tipo
y(x) = u(x) e-Ax
da cui
y'(x) = (d/dx)[ u(x) e-Ax ] = u'(x) e-Ax + u(x) e-Ax (-A) = u'(x) e-Ax -A u(x) e-Ax = u'(x) e-Ax Ay(x) = MA - Ay(x)
se e solo se
u'(x) e-Ax = MA
cioè (moltiplicando per eAx ambo i membri dell'uguaglianza)
u'(x) e-Ax eAx = MA eAx , ossia u'(x) = MA eAx = M (d/dx)[eAx]
da cui u(x)= M eAx+ C
e quindi la soluzione dell'equazione non omogenea
y'=AM-Ay è y(x)= (M eAx+ C)e-Ax = M + Ce-Ax
..
venerdì 18 dicembre Aula C di Medicina Legale (ore 11-13)
Esempio di come ricavare un'equazione differenziale:
La legge del raffreddamento di NEWTON afferma che la velocità di raffreddamento di un corpo è proporzionale alla differenza di temperatura tra il corpo e l'ambiente. Se la temperatura dell'ambiente è costante e β è la costante di proporzionalità, posto y(t) la temperatura del corpo al tempo t scrivere l'equazione differenziale che soddisfa la funzione temperatura del corpo.
La velocità di raffreddamento è la derivata di y(t): il rapporto [y(t+Δ)-y(t)]/Δ rappresenta la velocità media di raffreddamento nell'intervallo [t, t+Δ] e quindi, mandando Δ a zero si ottiene la derivata y'(t).
La differenza tra temperatura del corpo e temperatura dell'ambiente è y(t)-M
e quindi la legge di Newton ci assicura che,
y'(t) = β (y(t)-M) che è del tipo y'=A(M-y) con A=-β.
La soluzione generale è quindi y(t)= M + Ce-At = M + Ceβt
Supponiamo ora che la temperatura iniziale sia y(0)=M+2 (>M) e troviamo la soluzione particolare:
basta imporre y(0)=M+Ceβ0 = M+C = M+2, cioè C=2
da cui la soluzione particolare è
y(t)=M +2 eβt
OSSERVANDO che a seconda del segno di β si ha un comportamento diverso per t che tende all'infinito, ossia
SE β>0 ALLORA lim t→+∞ y(t)=lim t→+∞M +2 eβt = +∞
SE β=0 ALLORA y(t)= M +2 e0t = M
SE β<0 ALLORA lim t→+∞ y(t)=lim t→+∞M +2 eβt = M
capiamo che il valore di β deve essere negativo: ci aspettiamo che se mettiamo un corpo in un ambiente a temperatura costante M, dopo un certo tempo anche la temperatura del corpo sarà M (ovvero talemente vicina a M da essere indistinguibile da M)
EQUAZIONI DI BERNOULLI
sono equazioni del tipo y'(x)+b(x)y(x)+c(x)(y(x))m=0
per m reale diverso da 0 e da 1:
se m=0 è l'equazione differenziale lineare non omogenea y'(x)+b(x)y(x)+c(x)=0
se m=1 è l'equazione differenziale lineare omogenea y'(x)+[b(x)+c(x)]y(x)=0
che si risolvono con la trasformazione w(x)=1/(y(x))m-1= (y(x))-m+1.
infatti in questo caso
w'(x) = (d/dx) (y(x))-m+1= (-m+1) (y(x))-m+1-1y'(x)
= (-m+1) (y(x))-m [-b(x)y(x)-c(x)(y(x))m] = (m-1) b(x) (y(x))-m+1 + (m-1) c(x)
= (m-1) b(x) w(x) + (m-1) c(x) [ usando il fatto che (y(x))-m+1=w(x) ]
OSSIA
w(x)=1/(y(x))m-1 soddisfa l'equazione differenziale lineare di ordine 1
w'(x) = (m-1) b(x) w(x) + (m-1) c(x)
CHE SI RISOLVE CON IL METODO DELLA VARIAZIONE DELLE COSTANTI
una volta trovata la soluzione generale w(x) si ottiene la soluzione y(x) dell'equazione di Bernoulli usando la relazione w(x)=1/(y(x))m-1 da cui si ricava che
y(x)=[1/w(x)]1/(m-1).
Ovviamente (a parte il caso in cui m è intero e pari, di modo che m-1 è dispari) si dovranno imporre le condizioni per cui abbia senso elevare 1/w(x) alla potenza 1/(m-1), cioè considerare solo soluzioni w(x) strettamente positive.
ESEMPIO:
trovare la soluzione dell'equazione y'=ay(1-y)= ay-ay2 che è un'equazione di Bernoulli con m=2 b(x)=-a e c(x)=a, con il metodo appena descritto.
(ovviamente già sappiamo che la soluzione generale è y(x)=1/[1+Ce-ax], ma ora vediamo come ci si può arrivare anche da soli)
si pone w(x)=1/y(x)
w'(x) = - y'(x)/y2(x) = - [ay(x)-ay2(x)]/y2(x) = -a/y(x) +a = -aw(x)+a
risolviamo l'equazione differenziale
w'(x) = -aw(x)+a
Soluzone dell'equazione omeogenea w'(x) = -aw(x) è wo(x)=Ce-ax
la soluzione dell'equazione non omogenea è del tipo w(x)=u(x)e-ax , con
w'(x)= u'(x) e-ax - a u(x)e-ax = a - a w(x) se e solo se
u'(x) e-ax = a ossia se esolo se u(x)=aeax , da cui u(x)=eax +C
e w(x)= (e-ax +C)e-ax = 1+Ce-ax ,
INFINE ricordando che w(x)=1/y(x) ossia che y(x)=1/w(x)
si ottiene finalmente che
y(x) = 1/[1+Ce-ax ].
EQUAZIONI DIFFERENZIALI DEL SECONDO ORDINE A COEFFICIENTI COSTANTI E OMOGENEE
sono equazioni del tipo
y''(x)+b y'(x) + cy(x)=0
Abbiamo controllato alcuni casi particolari in una lezione precedente:
per risolovere questa equazione si procede come segue
si considera il polinomio caratteristico associato, ossia il polinomio λ2+bλ+c
e si studia l'equazione di secondo grado
λ2+bλ+c=0
Ci possono essere tre casi
1) esistono DUE SOLUZIONI di λ2+bλ+c=0, m1 ed m2 DISTINTE (o equivalentemente il discriminante Δ=b2-4c>0 ed m1, m2= -(b/2)± (√Δ)/2
e allora la soluzione generale è
y(x) = A em1x+B em2x.
2) le due soluzioni di λ2+bλ+c=0 COINCIDONO ossia m1 = m2 = m (= - b/2) (o equivalentemente il discriminante Δ=b2-4c=0)
allora la soluzione generale è
y(x)= A em x+B x em x.
3) il discriminante Δ=b2-4c<0
(o equivalentemente, MA SOLO PER COLORO CHE CONOSCONO I NUMERI COMPLESSI, le soluzioni di λ2+bλ+c=0 sono complesse e coniugate e valgono -(b/2)± i (√|Δ|)/2, dove i è l'unità immaginaria)
allora la soluzione generale è
y(x)= ep x [A sin(q x) +B cos(q x) ],
dove p=-b/2 e q=(√|Δ|)/2.
ESEMPI
1) y''(x)-y(x)=0
qui il polinomio caratteristico è λ2-1=0, cioè m1 =-1 ed m2=+1
e quindi la soluzione generale è
y(x)= A e-x+B e+ x.
2) y''(x)-2y'(x)+y(x)=0
qui il polinomio caratteristico è λ2-2 λ +1=0, cioè (λ-1)2=0 e quindi m1 =m2=+1
e quindi la soluzione generale è
y(x)= A e x+B x e x.
3) y''(x)+y(x)=0
qui il polinomio caratteristico è λ2+1=0, cioè il discriminante è negativo e vale
Δ=b2-4c= 0-4 allora p=-(b/2)=0 e q=(√|Δ|)/2= (√4)/2)=1,
e quindi (poiché e0x=1) la soluzione generale è
y(x) = A sin(x) +B cos(x)
SISTEMI DI DUE EQUAZIONI lineari a coefficienti costanti e omogenee di ordine 1.
si tratta del sistema del tipo
y1'=a1y1+b1y2,
y2'=a2y1+b2y2,
per risolvere questo sistema si procede in questo modo:
1) Si considera la derivata seconda di y1 e si cerca di scrivere un'equazione differenziale che coinvolga solo y1 e la sua derivata y'1. (la spiegazione di come fare viene messa dopo)
2) Si ottiene un'equazione lineare a cofficienti costanti di ordine 2 che si risolve con il metodo spiegato prima e si trova la soluzione generale per y1(x).
3) una volta "trovata" la soluzione generale y1(x) si osserva che l'equazione
y2'=a2y1+b2y2, è ora semplicemente un'equazione lineare a coefficienti costanti di ordine 1 che si risolve con il solito metodo di variaizone delle costanti.
OSSERVAZIONE si può ripetere lo stesso procedimento anche iniziando da y2 invece che da y1.
SPIEGAZIONE DEL METODO PER OTTENERE l'equazione da risolvere per trovare y1.
dalla prime delle due equazioni
y1'=a1y1+b1y2,
y2'=a2y1+b2y2,
troviamo che (SE b1≠0) y2=(1/b1)[y'1- a1y1] ed inoltre, derivando ambo i membri, sempre della prima equazione
otteniamo
y"1=a1y'1+b1y'2,
e quindi UTILIZZANDO la seconda equazione
y"1 = a1y'1+b1y'2= a1y'1+b1 [a2y1+b2y2] = a1y'1+b1a2y1+b1b2y2
a questo punto, per eliminare y2, nell'ultima espressione utilizziamo il fatto che y2=(1/b1)[y'1- a1y1] e troviamo
y"1 = a1y'1+b1a2y1+b1b2(1/b1)[y'1- a1y1] =a1y'1+b1a2y1+b2y'1- a1b2y1
riordinando i coefficienti abbiamo finalmente l'espressione
y"1 = (a1+b2)y'1+(b1a2 - a1b2)y1
ovvero
y"1 - (a1+b2)y'1+(a1b2-b1a2 ) y1 = 0
si tratta quindi di studiare l'equazione di secondo grado
λ2- (a1+b2) λ+(a1b2-b1a2 )=0
che ha discriminante Δ= (a1+b2)2-4(a1b2-b1a2 ) = (a1-b2)2+4b1a2
e quindi a seconda del segno di Δ possiamo trovare la soluzione generale
ESEMPIO DUE SPECIE IN COMPETIZIONE
y1'= y1 - y2,
y2'=-4y1+y2,
con condizioni iniziali y1(0)=6 e y2(0)=5
(anche in questo caso vale un teorema di esistenza e unicità del problema di Cauchy)
Questo sistema modellizza DUE SPECIE IN COMPETIZIONE: ad esempio due specie erbivore: se ci fosse una sola specie, ad esempio se fosse y2=0 allora la prima specie crescerebbe senza limiti seguendo l'equazione y1'= y1. La presenza della seconda specie fa "descresce" la popolazione grazie alla presenza del termine -y2 nella prima equazione.
Lo stesso tipo di argomentazione vale per la seconda specie e si può ripetere tutte le volte che nel sistema
y1'=a1y1+b1y2,
y2'=a2y1+b2y2,
si ha che tale sistema MODELLIZZA DUE SPECIE IN COMPETIZIONE
se a1>0 e b2 >0 e invece b1<0 e a2 < 0
TORNANDO ALL'ESEMPIO: si tratta del sistema precedente con a1=1, b1=-1, a2 = -4, b2 =1
e quindi
λ2- (a1+b2) λ+(a1b2-b1a2 )=λ2- (1+1) λ+(1-(-1)(-4) )=λ2- 2 λ-3=0
con soluzioni m1=3 ed m2=-1
e allora la soluzione generale è
y1(x) = A e3x+B e-x.
per trovare poi y2(x) si procede come segue:
si deve risolvere l'equazione
y2'=-4y1+y2= -4(A e3x+B e-x) +y2,
la cui equazione omogenea associata è y2'= y2, con soluzione del tipo y2(x)=Cex.
La funzione y2(x)=u(x) ex deve risolvere
u'(x) ex+ u(x) ex= -4(A e3x+B e-x) +y2, e quindi
u'(x) ex = -4(A e3x+B e-x)
ovvero
u'(x) = -4(A e3x+B e-x)e-x = -4A e2x-4B e-2x da cui
u(x) = -4A (e2x/2) - 4B (e-2x/(-2)) = -2A e2x+2B e-2x
(Attenzione: non consideriamo un'ulteriore costante, come invece avremmo fatto nel caso di una equazione differenziale lineare di ordine 1. Spiegazione euristica: abbiamo già due parametri A e B)
e quindi finalemte possiamo scrivere
y2(x)=u(x) ex = (-2A e2x+2B e-2x ) ex = -2A e3x+2B e-x
e in conclusione la soluzione generale del sistema è
y1(x) = A e3x+B e-x,
y2(x) = -2A e3x+2B e-x
per trovare la soluzione particolare imponiamo le condizioni iniziali y1(0)=5 e y2(0)=6, ossia
y1(0) = A e0 + B e-0 = A+B = 5
y2(0) = -2A e30+2B e-0 = -2A +2B=6
la cui soluzione è A=1 e B=4 e quindi la soluzione particolare del sistema è
y1(x) = e3x-4 e-x,
y2(x) = -2 e3x+8e-x
OSSERVAZIONE questo modello non modellizza bene la situazione di due specie in competizione che abbiamo descritto, almeno non per tutti i tempi x: infatti, ad esempio lim x→+∞ y2(x) =lim x→+∞ ( -2 e3x+8e-x ) = -∞
e ciò implica che y2(x) può essere interpretato come "numerosità" della seconda specie al massimo fino a quando y2(x)≥0.
QUESTO TIPO DI PROBLEMI SI PRESENTA ANCHE NEI MODELLI DI TIPO COOPERATIVO o di PREDA/PREDATORE che hanno condizioni diverse sui coefficienti:
Il sistema
y1'=a1y1+b1y2,
y2'=a2y1+b2y2,
MODELLIZZA DUE SPECIE IN COMPETIZIONE
se a1> 0 e b2 >0 e invece b1<0 e a2 < 0
ovvero il sistema
y1'= α1y1 - β1 y2,
y2'= - α2y2 + β2y2,
con α1, β1,α2, β2 tutte strettamente positive,
(ciascuna specie senza l'altra cresce, mentre la presenza dell'altra specie fa diminuire la crescita della specie in esame)
MODELLIZZA DUE SPECIE IN COOPERAZIONE
se a1<0 e b2 <0 e invece b1>0 e a2 > 0
ovvero
y1'= - α1y1 + β1 y2,
y2'= +α2y1 - β2y2,
con α1, β1,α2, β2 tutte strettamente positive,
(ciascuna specie senza l'altra decresce, mentre la presenza di un'altra specie fa aumentare la crescita della specie in esame)
MODELLIZZA DUE SPECIE DEL TIPO PREDA/PREDATORE
se a1>0 e b2 <0 b1<0 e a2 > 0
ovvero
y1'=α1y1 - β1 y2,
y2'=α2y1 - β2y2,
con α1, β1,α2, β2 tutte strettamente positive,
(se y1 rappresenta le prede e y2 rappresenta i predatori allora le prede tendono a crescere senza la presenza dei predatori, mentre la presenza dei predatori li fa diminuire, invece i predatori tendono a decrescere senza la presenza delle prede e la presenza delle prede li fa crescere)
A CAUSA DI QUESTO PROBLEMA Lotka e Volterra hanno "inventato" la seguente variante del modello generale nel caso di preda predatore
y1'=α1y1 - β1y1 y2,
y2'=α2y1 y2 - β2y2,
con α1, β1,α2, β2 tutte strettamente positive,
con l'idea che i predatori "mangiano" le prede con maggiore frequenza quanto più speso si possono incontrare, e ciò accade più di frequente tanti piu' sono sia le prede che i predatori. Ecco il motivo della presenza dei termini del tipo y1 y2, (come nel caso dell'interpretazione del modello y'=ay(1-y) come diffusione del raffreddore)
VANTAGGIO DEL MODELLO DI LOTKA-VOLTERRA
le soluzioni sono sempre positive e hanno un andamento ciclico: se i predatori diminuiscono allora le prede aumentano e viceversa
SVANTAGGIO DEL MODELLO DI LOTKA-VOLTERRA
non c'è una formula esplicita per le soluzioni del sistema
lunedì 22 dicembre Aula C di Medicina Legale (ore 11-13)
La lezione sarà recuperata a gennaio
lunedì 22 dicembre Aula A del Plesso Tecce (ore 15-17)
La lezione sarà recuperata a gennaio
..
VACANZE DI NATALE
..
mercoledì 7 gennaio 2015 Aula A del Plesso Tecce (ore 15-17)
Esercizi sulle equazioni differenziali:DA FOGLIO 8D.2, D.3 (con richiami alle equzioni a variabili separabili),
D.4, D.5 (con richiami sulle equazioni differenziali lineari del secondo ordine),
D.10, D.11 (con osservazione che gli esercizi di questo tipo a volte sono a tempo discreto e a volte a tempo continuo)
D.23
..
venerdì 9 gennaio 2015 Aula C di Medicina Legale (ore 11-13)
A partire da un problema scritto sulla lavagna:da un mazzo di 40 carte (4 semi e 10 carte per ogni seme) (a) quanti insiemi di 5 carte esistono? (b) quanti insiemi con 4 assi esistono? (c) in quanti modi si possono prendere 5 carte, tenendo conto dell'ordine?
abbiamo introdotto il concetto di Combinazione di n elementi di classe k come un sottoinsieme di cardinalità k (ossia con k elementi) di un insieme di cardinalità n (ossia con n elementi)
Cenno alle funzioni di due variabili, e ai differenziali
sia A un sottoinsieme del piano R2,
U: A → R; (x,y) → U(x,y)
è una funzione reale di due variabili reali
ESEMPIO 1 U(x,y)=x2+y2. (qui A=R2)
ESEMPIO 2 in realtà abbiamo già visto un esempio di funzione di due variabili quando abbiamo paralto dei piani, ad esempio
l'equazione a(x-x0)+b(y-y0)+ c(z-z0)=0 individua un piano che passa per il punto P0(x0,y0,z0), e se c≠0 allora possiamo scrivere
z=z0 - [a(x-x0)+b(y-y0) ]/c
ossia
z=U(x,y) con U(x,y)=z0 - [a(x-x0)+b(y-y0) ]/c
DERIVATE PARZIALI
fissato y possiamo definire la funzione x→u1(x):=U(x,y)
(ad esempio per la funzione dell'ESEMPIO 1, U(x,y)=x2+y2, fissato y=1 possiamo considerare la funzione x→x2+12=x2+1)
e considerare la sua derivata (SE ESISTE) ossia
(d/dx)u1(x)= lim Δx→0 [u1(x+Δx)-u1(x)]/Δx = lim Δx→0 [U(x+Δx,y)-U(x,y)]/Δx
che viene denotato con il simbolo
(∂/∂x)U(x,y) = lim Δx→0 [U(x+Δx,y)-U(x,y)]/Δx
(a volte si usa anche il simbolo U'x(x,y))
e detto DERIVATA (prima) PARZIALE di U rispetto ad x, nel punto (x,y)
In modo analogo viene definita la DERIVATA PARZIALE di U rispetto a y nel punto (x,y) ossia:
fissato x si considera la funzione y→u2( y):=U(x,y) e di considera la sua derivata (SE ESISTE) e si ottiene che (d/dx)u2( y) coindice con
(∂/∂y)U(x,y) = lim Δy→0 [U(x,y+Δy)-U(x,y)]/Δy
(a volte si usa anche il simbolo U'y(x,y) )
ESEMPIO: se U(x,y)=x2+y2, allora (∂/∂x)U(x,y)=(∂/∂x)[x2+y2 ]= 2x
in quanto y2 è costante rispetto ad x
e analogamente (∂/∂y)U(x,y)=(∂/∂x)[x2+y2 ]= 2y
Non daremo la definzione formale di continuità di una funzione di due variabili, ma diciamo solo che la funzione è continua inn un punto (x0,y0) se U(x,y) è"vicino" a U(x0,y0), se (x,y) è "vicino" a (x0,y0).
Analogamente la funzione U(x,y) è continua se è continua in ogni punto (x,y).
[QUI SERVIREBBE di aggiungere delle condizioni sull'insieme A sul quale è definita la funzione U, ma tralasciamo questi particolari IMPORTANTI, per mancanza di tempo]
AD ESEMPIO la funzione U(x,y)=x2+y2 è continua e anche le derivate parziali lo sono
ed in generale tutte le funzioni che sono di tipo polinomiale sono continue, come, ad ESEMPIO: U(x,y)=3x2+5x2y+2y2.
IMPORTANTE Nel seguito assumeremo che U(x,y) è una funzione continua e che anche le derivate parziali (∂/∂x)U(x,y) e (∂/∂y)U(x,y) lo siano
INTERPRETAZIONE GEOMETRICA
Nello spazio tridimensinale R3 i punti (x,y,z) che soddisfano l'equazione z=U(x,y) rappresentano una superficie.
PIANO TANGENTE in un punto (x0,y0,z0) alla superficie z=U(x,y):
in analogia con l'equazione della retta tangente alla curva y=f(x) nel punto (x0,y0), dove y0=f(x0),
ossia la retta y=y0+f'(x0) (x-x0)
si ha che il piano tangente è
z=z0+(∂/∂x)U(x0,y0) [x-x0] + (∂/∂y)U(x0,y0) [y-y0]
Differenziale di U(x,y)
in analogia al caso delle funzioni di una variabile f(x) con derivata prima continua il differenziale df(x) è per definizione df(x)=f'(x) dx
ed in particolare per x=x0 corrisponde all'incremento di della retta tangente nel punto (x0,y0) quando calcolata in x1=x0+dx:
y1-y0=f'(x0)[x1 -x0]=f'(x0)[x0+dx-x0]=f'(x0) dx
ANALOGAMENTE SE U(x,y) è continua insieme alle sue derivate parziali allora
dU(x,y)=(∂/∂x)U(x,y) dx + (∂/∂y)U(x,y) dy
anche qui c'è un'analogia:
se fissiamo (x0,y0) e (x1,y1) = (x0+dx,y0+dy) allora (∂/∂x)U(x0,y0) [x1-x0] + (∂/∂y)U(x0,y0) [y1-y0]= (∂/∂x)U(x0,y0) dx + (∂/∂y)U(x0,y0) dy
rappresenta l'incremento sul piano tangente.
DERIVATA della funzione h(t):= U(x(t),y(t))
Sia U una funzione don derivate parziali prime continue e siano x(t) ed y(t) due funzioni derivabili
[e tali che, per ogni t il punto (x(t),y(t)) apartiene all'insieme A sul quale è definita la funzione U ]
e sia h(t) definita da
h(t):= U(x(t),y(t))
allora (SENZA DIMOSTRAZIONE) la funzione h(t) è derivabile con derivata data da
h'(t)= (∂/∂x)U(x(t),y( t)) x'(t) + (∂/∂y)U(x(t),y( t)) y'( t)
e quindi il differenziale di h(t) vale
dh(t)=h'(t)dt = [ (∂/∂x)U(x(t),y( t)) x'(t) + (∂/∂y)U(x(t),y( t)) y'( t) ] dt
= (∂/∂x)U(x(t),y( t)) x'(t) dt + (∂/∂y)U(x(t),y( t)) y'( t) dt
= (∂/∂x)U(x(t),y( t)) dx(t) + (∂/∂y)U(x(t),y( t)) dy( t)
IMPORTANTE CONSEGUENZA
Siano (x0,y0) e (x1,y1) due punti di A, allora QUALUNQUE SIANO LE FUNZIONI x(t) e y(t) con t'≤ t ≤ t", e tali che (x(t'),y(t'))=(x0,y0) e (x(t"),y(t"))=(x1,y1)
allora
U(x1,y1)-U(x0,y0) = h(t")-h(t')=∫[t',t"] h'(t) dt = ∫[t',t"] dh(t)
= ∫[t',t"] [(∂/∂x)U(x(t),y( t)) x'(t) dt + (∂/∂y)U(x(t),y( t)) y'( t) dt]
= ∫[t',t"] [ (∂/∂x)U(x(t),y( t)) dx(t) + (∂/∂y)U(x(t),y( t)) dy( t)]
CONNESSIONE CON GLI INTEGRALI DI FORME DIFFERENZIALI:
INTRODUCIAMO ORA LA NOTAZIONE γ(P',P") per la linea curva data dai punti (x(t),y(t)) per t'≤t≤t" nel piano che unisce i punti P'=(x0,y0) e P"=(x1,y1)
e, date due funzioni F1(x,y) ed F2(x,y), LA NOTAZIONE
∫ γ(P',P") [ F1(x,y) dx + F2(x,y) dy ] = ∫[t',t"] [F1(x(t),y( t)) dx(t) +F2(x(t),y( t)) dy( t) ]
OVVIAMENTE tale integrale in genere dipende dalle funzioni x(t) e y(t) e quindi dalla linea curva γ(P',P") che unisce i due punti P'=(x0,y0) e P"=(x1,y1)
TUTTAVIA se le due funzioni F1(x,y) ed F2(x,y) sono tali che
LA FORMA DIFFERENZIALE
F1(x,y) dx + F2(x,y) dy
(il nome " forma differenziale " si può memorizzare ad esempio pensando che "somiglia" ad un differenziale)
COINCIDE EFFETTIVAMENTE CON IL DIFFERENZIALE di una funzione U ossia F1(x,y) dx + F2(x,y) dy =dU(x,y)
[ NOTA BENE in tale caso si dice che la forma differenziale F1(x,y) dx + F2(x,y) dy è una FORMA DIFFERENZIALE ESATTA ]
OVVERO se esiste una funzione U(x,y) tale che F1(x,y)=(∂/∂x)U(x,y) e F2(x,y)=(∂/∂y)U(x,y)
ALLORA possiamo affermare che
l'integrale della forma differenziale F1(x,y) dx + F2(x,y) dy vale U(x1,y1) - U(x0,y0)
ossia
l'integrale di linea non dipende dalla linea curva γ(P',P") data dai punti (x(t),y(t)) per t'≤t≤t" nel piano che unisce i punti P'=(x0,y0) e P"=(x1,y1), ma solo dai punti P'=(x0,y0) e P"=(x1,y1)
INFATTI, per quanto visto prima, tale integrale vale
∫ γ(P',P") [ F1(x,y) dx + F2(x,y) dy ] = ∫[t',t"] [F1(x(t),y( t)) dx(t) +F2(x(t),y( t)) dy( t) ]=
= ∫[t',t"] [ (∂/∂x)U(x(t),y( t)) dx(t) + (∂/∂y)U(x(t),y( t)) dy( t)] = h(t'')-h(t')= U(x1,y1) - U(x0,y0)
in altre parole, e riassumendo:
F1(x,y) dx + F2(x,y) dy è UNA FORMA DIFFERENZIALE ESATTA SE E SOLO SE ESISTE UNA FUNZIONE U(x,y) tale che
F1(x,y)=(∂/∂x)U(x,y) e F2(x,y)=(∂/∂y)U(x,y)
e in tale caso possiamo affermare che l'integrale di linea della forma differenziale
F1(x,y) dx + F2(x,y) dy vale
∫ γ(P',P") [ F1(x,y) dx + F2(x,y) dy ] = U(x",y") - U(x',y')
OSSERVAZIONE: la funzione U(x,y) non è univocamente determinata, infatti si può usare anche la funzione U(x,y)+C, che ha lo stesso differenziale di U(x,y), MA CHIARAMENTE [U(x",y")+C] - [U(x',y')+C]= U(x",y") - U(x',y')
Poiché in genere, date due funzioni F1(x,y) ed F2(x,y) NON SAPPIAMO SE F1(x,y) dx + F2(x,y) dy è una forma differenziale esatta,
ossia non sappiamo se esiste una funzione U(x,y) tale che dU(x,y)= F1(x,y) dx + F2(x,y) dy è importante avere un criterio sufficiente affinché questo sia verificata:
ATTENZIONE! CONDIZIONE SUFFICIENTE AFFINCHE' UNA FORMA DIFFERENZIALE F1(x,y) dx + F2(x,y) dy SIA ESATTA:
SE ESISTONO LA DERIVATA PARZIALE di F1(x,y) rispetto ad y e LA DERIVATA PARZIALE di F2(x,y) rispetto ad x e sono uguali e continue, cioè
(∂/∂y)F1(x,y)=(∂/∂x)F2(x,y) (ed è una funzione continua)
Allora la forma differenziale la forma differenziale F1(x,y) dx + F2(x,y) dy è esatta.
LEGAME CON LE EQUAZIONI DIFFERENZIALI
OSSERVAZIONE Supponiamo che esista una funzione U(x,y) differenziabile e una funzione y(x) tale che
U(x,y(x))=c (c= costante)
Allora la funzione h(x)=U(x,y(x)) è costante e quindi la sua derivata è nulla, ossia
h'(x)=(∂/∂x)U(x,y(x)) 1 + (∂/∂y)U(x,y(x))y'(x) = 0
e SE INOLTRE (∂/∂y)U(x,y(x))≠0 allora la funzione y(x) è soluzione dell'equazione differenziale (in forma normale)
y'(x) = - [(∂/∂x)U(x,y(x))] / [(∂/∂y)U(x,y(x))]
QUESTA OSSERVAZIONE E' ALLA BASE DELL'IDEA per risolvere equazioni differenziali del tipo
y'(x)= - a(x,y(x)) / (b(x,y(x)) [con b(x,y(x))≠0]
nel caso in cui la forma differenziale a(x,y) dx + b(x,y)dy sia una forma differenziale esatta:
IN TALE CASO POSSIAMO RIPETERE I PASSAGGI PRECEDENTI "AL CONTRARIO"
per trovare una soluzione dell'equazione differenziale del tipo
y'(x)= - a(x,y(x)) / (b(x,y(x)). [con b(x,y(x))≠0]
OSSIA
se esiste una funzione U(x,y) per cui dU(x,y)=a(x,y) dx + b(x,y)dy
allora possiamo cercare la soluzione y(x) del tipo U(x,y(x))=c, OVVIAMENTE SE SI RIESCE A TROVARE UNA TALE SOLUZIONE.
ESEMPIO: (TUTTO QUESTO ESEMPIO E' NUOVO e DIFFERISCE DA QUELLO SVOLTO IN CLASSE nel 2015)
Verificare che (2x+5y)dx+ (5x+2y)dy è un differenziale esatto
Prima di tutto ricordiamo che stiamo cercando una funzione U(x,y) tale che
dU(x,y)=(2x+5y)dx+ (5x+2y)dy
ossia tale che
(∂/∂x)U(x,y)=2x+5y e (∂/∂y)U(x,y) = 5x+2y.
Dalla condizione (∂/∂x)U(x,y)=2x+ 5y
otteniamo che U(x,y)= x2 + 5yx +C1( y)
Dalla condizione (∂/∂y)U(x,y)=5x+ 2y
otteniamo che U(x,y)= 5xy + y2 + C2(x)
E' quindi necessario che x2 + 5yx +C1( y)=5xy + y2 + C2(x)
e ciò è possibile se e solo se C1( y) - y2 = C2(x) - x2 e quindi sia necessariamente una costante C
[INFATTI una funzione che dipende SOLO da y e una funzione che dipende SOLO da x possono essere uguali SOLTANTO se sono costanti!!]
e quindi
la/e funzione/i cercata/e è U(x,y)= x2 + 5xy + y2 + C
(ATTENZIONE in effetti si tratta di infinite funzioni al variare di C, ma basta prendere il caso C=0 per trovarne una)
IMPORTANTE si poteva ottenere che si trattava di un differenziale esatto anche semplicemente controllando che
(∂/∂y) (2x+5y) = (∂/∂x) (5x+2y) come in effetti si vede subito considerando che entrambi i membri sono uguali a 5, e che si tratta di funzioni ''regolari''.
MA NON AVREMMO SAPUTO DIRE PER QUALE/I FUNZIONE/I U(x,y)
(2x+5y)dx+ (5x+2y)dy = dU(x,y) = (∂/∂x)U(x,y) dx + (∂/∂y)U(x,y) dy
Proprietà dell'integrale di un differenziale esatto
Si noti che se x=x(t)= 2t+1 e y=y(t)=t2,
[ si noti che (x(0),y(0))=(1,0) e che (x(1),y(1))=(3,1) ]
e se vogliamo calcolare ∫01 dU(x(t),y(t)) dt
otteniamo
∫01 dU(x(t),y(t)) = ∫01 [ (2x(t)+5y(t)) x'(t) dt + (5x(t)+2y(t)) y'(t) dt ]
= .... = U(3,1) - U(1,0) = 32 + 5*3*1 + 12 + C - [ 12 + 5*1*0 + 02 + C ] = 24
(i puntini simboleggiano i calcoli che è bene a svolgere per controllo)
e che verrebbe lo stesso risultato se avessimo scelto invece x(t)= 2 t2 +1 ed y(t)=t3
in quanto anche per queste due funzioni si ha (x(0),y(0))=(1,0) e (x(1),y(1))=(3,1)
come per le precedenti funzioni (anche in questo caso, per convincersi che tutto funziona, è bene fare i calcoli esplicitamente)
Equazione differenziale associata
se volessimo risolvere l'equazione differenziale associata ossia
(2x+5y)dx+ (5x+2y)dy = 0 con condizione iniziale y(x0)=y0
o equivalentemente, ricordando che dy(x)=y'(x) dx l'equazione
y'(x) = - (2x+5y/(5x+2y)
potremmo procedere come segue:
Cerchiamo una funzione y(x) per la quale U(x,y(x))=C, dove U è la funzione trovata precedentemente, ossia una funzione per la quale
x2 + 5xy(x) + y(x)2 = C
Per trovare la funzione y(x) possiamo intanto trovare l'unico valore C per cui
(x0)2 + 5x0y(x0) + y(x0)2 = (x0)2 + 5x0y0 + (y0)2= C
e poi chiedere che per ogni x
y(x) sia soluzione dell'equazione di secondo grado in y
x2 + 5xy + y2 = (x0)2 + 5x0y0 + (y0)2,
ovvero, ad esempio nel caso x0=0 e y0=1 l'equazione per y(x) diviene
y2 + 5xy +x2-1=0
le cui soluzioni sono y(x) = ( -5x ± √[ (5x)2 - 4(x2 - 1) ] )/2 = ( -5x ± √[ 21x2 +4 ] ) /2
Tuttavia solo la soluzione y(x)= - (5/2) x + √[ 21x2 +4 ] /2
è la soluzione cercata perché solo per questa si ha che y(0)= √[4] /2 = 1
mentre per l'altra soluzione y(x)= - (5/2) x - √[ 21x2 +4 ] /2 si ha y(0)= -1
FINE DELLA PARTE NUOVA
..
lunedì 12 gennaio 2015 Aula C di Medicina Legale (ore 11-13)
Introduzione alla statistica
Differenza tra Statistica DESCRITTIVA e Statistica INFERENZIALE
DATI QUALITATIVI e DATI QUANTITATIVI
DATI RAGGRUPPATI
DIAGRAMMI A BARRE
ISTOGRAMMI
DIAGRAMMI A TORTA o AREOGRAMMI
INDICI DI POSIZIONE: Media aritmetica (o algebrica), Moda, Mediana, Media geometrica
Altri indici: utili per gli indici di dispersione Varianza, quartili
INDICI DI DISPERSIONE: Scarto quadratico medio (anche detto Deviazione standard):= radice quadratica della varianza, Distanza interquartile=q3-q1
Per questa parte, oltra al libro si consigliano le slide della Prof. Anna Torre al link http://www-dimat.unipv.it/atorre/farmacia2013-2014/lezioni.html
e quelle della prof.ssa Pacchiarotti al link
http://www.mat.uniroma2.it/~processi/dispense-pacchiarotti-biotec.pdf
..
lunedì 12 gennaio 2015 Aula A del Plesso Tecce (ore 15-17)
Panoramica su media aritmetica, geometrica e armonica:
la media aritmetica di x1,x2,...,xn, è quel valore x tale che
n x = x1+x2+...+xn,
ovvero
x = (1/n) [ x1+x2+...+xn]
la media geometrica di x1,x2,...,xn, (N.B. SOLO SE xi >0 per ogni i=1,2,...,n) è quel valore xg tale che (xg)n = x1 x2 ... xn
ovvero xg = (x1 x2 ... xn)1/n
o ancora
xg = exp{ (1/n) [ln(x1)+ln(x2)+...+ln(xn)] }
la media armonica di x1,x2,...,xn, (N.B. SE xi >0 per ogni i=1,2,...,n) è quel valore xh tale che
xh = n/[(1/x1 ) +(1/x2 ) +... +(1/xn)]
ovvero
xh = 1/{(1/n) [(1/x1 ) +(1/x2 ) +... +(1/xn)]}
Proprietà
La media geometrica è sempre minore o uguale alla media aritmetica, con verifica solo nel caso n=2: siano x1 e x2 due numeri strettamente POSITIVI
allora si verifica facilmente che
x = (1/2) [ x1+x2 ] ≥ xg = (x1 x2 )1/2
INFATTI, essendo x1>0 e x2>0 la precedente disuguaglianza equivale a
(1/2)2 [ x1+x2 ]2 ≥ x1 x2
cioè
(x1)2+(x2)2 + 2 x1 x2 ≥ 4 x1 x2
ossia
(x1)2+(x2)2 - 2 x1 x2 ≥ 0 che equivale a [ x1 - x2 ]2 ≥0 (QED)
Esercizi Dal foglio 9:
Esercizio D1 in questo caso la velocità media è la media armonica delle due velocità, infatti posto d=50km v1= e v2= si ha che la velocità media è il percorso totale diviso il tempo totale, ossia 2d/(t1+t2) dove t1=d/v1 e t2=d/v2
e quindi la velocità media è
2d/(t1+t2)=2d/[(d/v1)+(d/v2)]= 2/[(1/v1)+(1/v2)]
che è proprio la media armonica tra v1 e v2.
Esercizio D2: la media dei dati che sono (in ordine crescente, o meglio NON DESCRESCENTE)
0,3,3,3,5,5,5,8
ossia
x(1)=0,x(2)=3,x(2)=3,x(3)=3,x(4)=3,x(5)=5,x(6)=5,x(7)=5,x(8)=8,
vale M = 0(1/8)+3 (3/8) + 5(3/8)+8(1/8)= 4
la varianza vale
s2 = (0-4)2(1/8) + (3-4)2 (3/8) + (5-4)2(3/8)+(8-4)2(1/8) = 2 (16/8) + 2 (3/8)= 19/4
e quindi lo scarto quadratico medio (o deviazione standard vale
s= √(19)/2 = (circa) 4,35/2
e l'ampiezza dell'intervallo (M-s,M+s) vale 2s =(circa) 4,35
per calcolare la distanza interquartile, vanno calcolati il primo quartile q1 e il terzo quartile q3 e poi calcolata q3-q1
per ottenere q1 calcoliamo n/4= 8/4=2 e quindi q1= [x(2)+x(3)]/2= (3+3)/2=3
per ottenere q3 calcoliamo n(3/4)= 8(3/4)=6 e quindi q1= [x(6)+x(7)]/2= (5+5)/2=5
e quindi la distanza interquartile vale q3-q1=5-3=2
e la differenza tra l'ampiezza 2s e la distanza interquartile q3-q1 vale (circa) 4,35-2=2,35
Esericizio D5:
poste XA,YA,ZA,TA, le previsioni di Aldo, XB,YB,ZB,TB, le previsioni di Bruno, e XC,YC,ZC,TC, le previsioni di Carlo e X,Y,Z,T le percentuali ottenute dai candidati
dal problema sappiamo che
XA=X, YA=Y, ZA=Z e TA=T+2%=T+2/100
XB=X+0,5%, YB=Y+0,5%, ZB=Z-0,5% e TB=T-0,5%=T-0,5/100
XC=X, YC=Y, ZA=Z+1% e TA=T-1%=T-1/100
quindi gli errori sono
XA-X=0, YA-Y=0, ZA-Z=0 e TA-T=2%= 2/100
XB-X=0,5%, YB-Y=0,5%, ZB-Z=-0,5% e TB-T=-0,5%=-0,5/100
XC-X=0, YC-Y=0, ZA-Z=1% e TA-T=-1%=-1/100
L'errore commesso da Aldo è quindi la somma dei quadrati degli errori ossia
(XA-X)2 +(YA-Y)2+ (ZA-Z)2+(TA-T)2=0+0+0+(2%)2= 4/1002
(XB-X)2 +(YB-Y)2+ (ZB-Z)2+(TB-T)2=(0,5%)2+(0,5%)2+(-0,5%)2+ (-0,5%)2= 4 (1/2)2/1002 = 1/1002
(XC-X)2 +(YC-Y)2+ (ZC-Z)2+(TC-T)2=0+0+(1%)2+(-1%)2= 2/1002
e quindi, per il criterio usato nella scommessa il vincitore è Bruno
ESERCIZIO D10
se nella popolazione ci sono nD donne di età xD1,xD2,...,xDnD, ed nU uomini di età xU1,xU2,...,xUnU, allora posto n= nD + nU, e xD= 40 e xU= 40 le medie aritmetiche delle donne e degli uomini, rispettivamente, dal testo sappiamo che nD/n=6/11 e che nU/n=5/11 e quindi
l'età media della popolazione vale 40 (6/11) + 45 (5/11) =42,27
Questo deriva dalla formula generale per cui
x = xD (nD/n) + xU (nU/n)
INFATTI
la media aritmetica dell'età delle donne è
xD=[xD1+xD2+...+xDnD]/nD
la media aritmetica dell'età degli uomini è
xU=[xU1+xU2+...+xUnU]/nU
mentre l'età media della popolazione vale
x= ( [xD1+xD2+...+xDnD] + [xU1+xU2+...+xUnU] ) / n
dove n=nD + nU.
si vede quindi facilmente che
x = {[xD1+xD2+...+xDnD]/nD} (nD/n) + { [xU1+xU2+...+xUnU]/nU } (nU/ n)
= xD (nD/n) + xU (nU/n).
..mercoledì 14 gennaio 2015 Aula A del Plesso Tecce (ore 15-17)
Espressione alternativa della varianza:
s2= (1/n) ∑1≤i≤n (xi-x )2 = (1/n) ∑1≤i≤n (xi)2 - ( x )2 = x^2 -( x )2
ossia la varianza si può calcolare come la media dei quadrati (indicata con il simbolo x^2 ) meno il quadrato della media
Distribuzione Normale o gaussiana, definizione e uso delle tavole
Precisazioni sulla differenza tra varianza campionaria e varianza:
se i dati statistici COMPLETI sono N (ad esempio quando si fa un censimento si hanno tutti i dati completi) possiamo parlare di media e di varianza (ad esempio dell'età della popolazione di cui si sta facendo il censimento)e le formule di media e varianza vanno considerate con n=N
se invece facciamo un sondaggio e prendiamo in considerazione solo un campione di numerosità m la media campionaria va fatti sui dati del campione con n=m e la varianza campionaria va fatta sui dati dati del campione e quindi va divisa per m-1 (=n-1) invece che per m. TUTTAVIA, se m è molto grande, usare una o l'altra formula non fa grande differenza: Infatti il rapporto tra varianza campionaria ossia
(1/(m-1)) ∑1≤i≤m (xi-x )2
(dove x1,x2,...,xm rappresentano i valori del sondaggio/campione)
e il valore
(1/m) ∑1≤i≤m (xi-x )2
vale m/(m-1) come è banale verificare: [(1/(m-1)) ∑1≤i≤m (xi-x )2]/ [(1/(m )) ∑1≤i≤m (xi-x )2] = [1/(m-1)]/ [1/m ] =m/(m-1)
e quindi tale rapporto è molto vicino ad 1 (se m è grande) ed è per questo motivo che non fa molta differenza usare l'una o l'altra formula nel calcolare la varianza campionaria.
SPIEGAZIONE DEL SIGNIFICATO DEL TEOREMA CENTRALE DEL LIMITE E USO PER OTTENERE GLI INTERVALLI DI CONFIDENZA
PER QUESTA PARTE RIMANDIAMO ALLE SLIDE DELLA PROFESSORESSA TORRE http://www-dimat.unipv.it/atorre/farmacia2013-2014/lezioni.html (escluso il TEST DI IPOTESI)
Posizione del METODO dei minimi quadrati e retta di regressione (lineare):
DATI IN DUE DIMENSIONI:
a volte i dati forniscono per ogni osservazione due numeri: ad esempio su n individui possiamo avere sia il dato del peso che la sua altezza.
I dati sono quindi del tipo n punti del piano ( x1, y1), (x2, y2),...,(xn, yn).
A volte ci si può chiedere se esiste c'è una "specie di dipendenza lineare" tra i dati. In genere non c'è una precisa dipendenza lineare,
cioè in genere non esiste un a e un b tali che yi=a+bxi per ogni i=1,2,...,n.
TUTTAVIA ci si puo' chiedere se esiste una retta y*(x)=a*+b*x per la quale i dati yi differiscano di poco dal valore y*(xi)=a*+b*xi.
A questo scopo la "differenza/distanza" tra viene calcolata con la somma dei quadrati delle differenze y(xi)-yi
PRECISAMENTE
la "differenza/distanza" tra i dati e una retta generica y(x)=a+bx viene calcolata
come
∑1≤i≤n (a+bxi- yi)2
ci si chiede se esistono a* e b* tali che, per ogni a e b si abbia
∑1≤i≤n (a*+b*xi- yi)2 ≤ ∑1≤i≤n (a+bxi- yi)2
da cui il nome del METODO DEI MINIMI QUADRATI
Ora posto
H(a,b):= ∑1≤i≤n (a+bxi- yi)2 = (a+bx1- y1)2 +(a+bx2- y2)2 +...+(a+bxn- yn)2 ,
la precedente richiesta è equivalente a chiedere che
H(a*,b*) ≤ H(a,b) per ogni a e b
cioè che (a*,b*) sia il minimo globale /assoluto della funzione H(a,b).
Questa notazione ci aiuterà nella spiegazione di come ottenere la retta di regressione.
Si ottiene che tale retta è la retta chiamata RETTA DI REGRESSIONE (lineare)
y-y = CovXY /(s2X ) (x-x )
dove
s2X =(1/n) ∑1≤i≤n (xi-x )2 =(1/n) ∑1≤i≤n (xi)2 - ( x )2 = x^2 - ( x )2
e infine
CovXY= (1/n) ∑1≤i≤n (xi-x )(yi-y ) = (1/n) ∑1≤i≤n (xiyi) - ( x )( y ) = xy - ( x )( y )
NOTA BENE:
introducendo la notazione
s2Y =(1/n) ∑1≤i≤n (yi-y )2 =(1/n) ∑1≤i≤n (yi)2 - ( y )2 = y^2 - ( y )2
(e sY è la radice quadrata di s2Y , cioè la deviazione standard per le ordinate, e analogamente per sX )
e il coefficiente di correlazione
ρXY= CovXY /(sX sY) ( ρ è la lettera greca "rho")
la retta di regressione
y-y = [CovXY /(s2X )] (x-x )
NOTA BENE: si potrebbe anche scrivere come (dividendo per sY)
(y-y )/ sY = CovXY /(s2X ) (x-x )/ sY = CovXY /(sXsY) [(x-x ) / sX]
ovvero
(y-y )/ sY = ρXY [(x-x ) / sX]
SI OSSERVI CHE il coefficiente di correlazione ρXY varia in [-1,1] .
INOLTRE si potrebbe dimostrare che ρXY = ±1, allora i dati sono perfettamente allineati, cioè per ogni i yi = y(xi) = a*+b*xi ,
PROCEDIMENTO PER OTTENERE TALE RISULTATO
OVVIAMENTE, se conoscessimo b* potremmo affermare che
H(a*,b*) ≤ H(a,b*) per ogni a
ossia che la funzione a→ H(a,b*) ammette un minimo globale/assoluto in a*,
e quindi la sua derivata (rispetto ad a) deve essere nulla in a*.
E analogamente se conoscessimo a* potremmo affermare che
H(a*,b*) ≤ H(a*,b) per ogni b
ossia che la funzione b→ H(a*,b) ammette un minimo globale/assoluto in b*,
e quindi la sua derivata (rispetto ad b) deve essere nulla in b*.
Ora ricordando che
H(a,b):= ∑1≤i≤n (a+bxi- yi)2 = (a+bx1- y1)2 +(a+bx2- y2)2 +...+(a+bxn- yn)2 ,
e quindi
a→H(a,b*):= ∑1≤i≤n (a+b*xi- yi)2 = (a+b*x1- y1)2 +(a+b*x2- y2)2 +...+(a+b*xn- yn)2 ,
e
b→H(a*,b):= ∑1≤i≤n (a*+bxi- yi)2 = (a*+bx1- y1)2 +(a*+bx2- y2<)2 +...+(a*+bxn- yn)2 ,
e le derivate di queste due funzioni sono,
(∂/∂a)H(a,b*)=2 (a+b*x1- y1) + 2(a+b*x2- y2) +...+ 2(a+b*xn- yn) ,
e
(∂/∂b)H(a*,b)= 2 (a*+bx1- y1) x1 +2 (a*+bx2- y2)x2 +...+2(a*+bxn- yn)xn,
Le due condizioni di minimo diventano immediatamente le seguenti condizioni NECESSARIE
(∂/∂a)H(a*,b*)=0 e (∂/∂b)H(a*,b*)=0
o in altre parole a* e b* sono soluzioni del sistema (trascurando il fattore comune 2)
(a+bx1- y1) + (a+bx2- y2) +...+ (a+b xn- yn)=0 , (I)
e
(a+bx1- y1) x1 + (a+bx2- y2)x +...+(a+bxn- yn)xn=0 (II)
la prima equazione equivale a
na+b ∑1≤i≤n xi - ∑1≤i≤n yi = n (a+bx - y )=0 cioè a= y - b x ,
la seconda equazione equivale a
a∑1≤i≤n xi + b ∑1≤i≤n (xi)2 - ∑1≤i≤n (xi yi) = n ( a x + b x^2 - xy )= 0
N.B. Abbiamo usato la notazione x^2 = (1/n) ∑1≤i≤n (xi)2 e xy =(1/n) ∑1≤i≤n (xi yi)
Il sistema diviene quindi
a= y - b x , (I)
a x + b x^2 - xy = 0 (II)
e si risolve per sostituzione:
sostituendo nella seconda equazione la prima
si ottiene
(y - b x ) x + b x^2 - xy = 0
ossia
b ( x^2 - ( x )2 ) = xy - (x )(y ) che equivale a b s2X=CovXY
ossia b=CovXY /s2X, e di nuovo utilizzando la prima equazione
otteniamo
che NECESSARIAMENTE a* e b* individuano la retta di regressione
y(x)= a* + b* x = y - b* x + b* x = y + b*(x- x ) = y + CovXY /s2X (x- x )
ATTENZIONE in generale le condizioni che abbiamo richiesto sono solo condizioni necessarie: in genere bisognerebbe controllare se questa coppia di valori è effettivamente un minimo (potrebbe ad esempio essere un massimo, o neanche quello...) MA IN QUESTO CASO si potrebbe dimostrare che è effettivamente un minimo... ma non lo dimostreremo...
..
Giovedì 15 gennaio 2015 Aula E del Dipartimento di Matematica al piano terra (ore 11-13)
(lezione di recupero)Ripresa dell'argomento retta di regressione e spiegazione del coefficiente di correlazione. In realtà la retta
(y-y )/ sY = ρXY [(x-x ) / sX] o equivalentemente y-y = [CovXY /(s2X )] (x-x )
è (più precisamente) la retta di regressione di y rispetto ad x.
In modo analogo si può definire la retta di regressione di x rispetto ad y scambiando il ruolo di x e di y. Osservando che CovXY=CovYX e quindi anche ρXY=ρYX, si ottiene che la retta di regressione di x rispetto ad y è
(x-x )/ sX = ρXY [(y-y ) / sY]
ovvero
(y-y )/ sY = (1/ρXY) [(x-x ) / sX]
In altre parole le due rette di regressione NON sono uguali
OSSERVAZIONE 1: la retta di regressione passa sempre per il punto (x , y )
Questa osservazione, ad esempio, permette di semplificare i conti nell'esercizio D.22 del foglio 9: la retta di regressione dei tre punti A(0,0), B(1,1) e C(2,1) passa per il punto (x , y )=(1, 2/3) e si domanda quale è la distanza verticale tra B e il punto della retta di regressione di ascissa 1. Posto y(x) la retta di regressione la distanza del punto B(xB,yB) dal punto (xB,y(xB) ) vale, per definizione |y(xB) - yB|, ma in questo caso B(xB,yB) = B(1,1) e anche senza calcolare CovXY /(s2X ) sappiamo che la retta di regressione passa per il punto (x , y )=(1, 2/3) [ ossia y(1)=2/3 ]
Di conseguenza possiamo affermare subito che la risposta è |y(xB) - yB|=|y(1)-1|=|2/3 -1|=1/3
OSSERVAZIONE 2: SI PARLA DI REGRESSIONE LINEARE ANCHE QUANDO SI CERCA DI TROVARE UNA FUNZIONE DEL TIPO
y(x)=a*+b* x2 in modo che, qualunque siano a e b
∑1≤i≤n (a*+b*(xi)2 - yi)2 ≤ ∑1≤i≤n (a+b(xi)2- yi)2
La soluzione è la stessa pur di sostituire (xi)2 al posto di xi .
Il motivo per cui si parla di regressione LINEARE è che la funzione che cerchiamo è di tipo lineare in a e b (non in x)
Quindi ad esempio si ottiene che nella formula
y-y = CovXY /(s2X ) (x-x )
al posto di x va messo x^2 = (1/n) ∑1≤i≤n (xi)2
al posto di
s2X =(1/n) ∑1≤i≤n (xi-x )2 =(1/n) ∑1≤i≤n (xi)2 - ( x )2 = x^2 - ( x )2
va messo
s2X2 =(1/n) ∑1≤i≤n [(xi)2 - x^2 ]2 =(1/n) ∑1≤i≤n (xi)4 - ( x^2 )2 = x^4 - ( x^2 )2
e infine al posto di
CovXY= (1/n) ∑1≤i≤n (xi-x )(yi-y ) = (1/n) ∑1≤i≤n (xiyi) - ( x )( y ) = xy - ( x )( y )
va messo
CovX2Y= (1/n) ∑1≤i≤n [(xi)2 - x^2 ](yi-y ) = (1/n) ∑1≤i≤n [(xi)2 yi] - ( x^2 )( y ) = x^2y - (x^2 )( y )
e si ottiene che la funzione y(x)=a+bx2 che minimizza la somma dei quadrati delle distanze è
y-y = CovX2Y /(s2X2) (x2-x^2 )
IL DISCORSO SI GENERALIZZA AL CASO in cui si cerca ad esempio una funzione del tipo y(x)=a+bx+cx2. (CHE E' LINEARE NEI PARAMETRI a,b e c)
ANCHE SE ESULA DAL CORSO, dovete sapere che il procedimento adottato si potrebbe ripetere e porterebbe a un sistema lineare di tre equazioni nelle tre incognite a,b e c.
A QUESTO PUNTO pero' ci si potrebbe chiedere: è meglio la retta di regressione o la parabola ottenuta (CI RIFERIAMO AL CASO DELLA PARABOLA DEL TIPO y(x)=a*+b*x2)
LA SCELTA VA FATTA confrontando i valori ottenuti: OVVERO ponendo per chiarezza,
la retta di regressione yr(x)= ar*+br*x
e la "parabola" di regressione yp(x)= ap*+bp* x2,
dobbiamo calcolare i due "errori quadratici"
∑1≤i≤n (ap*+bp*(xi)2 - yi)2 e ∑1≤i≤n (ar*+br*xi - yi)2
e decidere che la SCELTA MIGLIORE è quella che ha l'errore quadratico più piccolo.
IN QUESTO SENSO SI CONSIGLIA DI GUARDARE L'ESERCIZIO D.53 oppure D.54 del foglio 9.
ESERCIZIO D.21 del foglio 9:
ricordiamo che una funzione del tipo
y(x)= A e -B(x-C)2
è (una densità) gaussiana di parametri μ e σ2
SE SOLO SE è positiva e il suo integrale vale 1
ovvero SE E SOLO SE
A= 1/ (2π σ2)½ B= 1/(2σ2) e C=μ
la funzione y=[1/ (4π)½] e-¼x2 + ½x -½
è (una densità) gaussiana con μ= 1 e σ=√2 (o equivalentemente con σ2=2)
infatti
A=1/ (2π σ2)½ = 1/ (4π)½ SE E SOLO SE σ2=2
a questo punto B=1/4 e quindi si tratta di vedere se
-¼x2 + ½x -¼ = - ¼ (x - μ)2, per qualche valore di μ
cioè se
x2 - 2x +1=(x - μ)2
e ciò è ovviamente verificato per μ=1
COLLEGATI A QUESTI ESERCIZI CI SONO GLI ESERCIZI DEL TIPO dell'esercizio D31 del foglio 9:
si tratta di determinare quanto vale l'integrale tra -∞ e +∞ della funzione
y(x)=(1/3) e - (x+3)2 .
L'idea è la seguente: questa funzione è proporzionale a una (densità) gaussiana [cioè differisce solo per una costante moltiplicativa da una (densità) gaussiana] con (chiaramente μ=-3) e B = 1/(2σ2) =1, ovvero σ2 =1/2.
Posto A=1/ (2π σ2)½= 1/ (2π (1/2))½=1/ (π)½
possiamo riscrivere [ in qunato banalmente (1/A) A=1]
y(x)=(1/3) e - (x+3)2 =(1/3) (1/A) A e - (x+3)2 = (1/3) (π)½ [ (1/(π)½] e - (x+3)2 .
ORA SAPPIAMO CHE L'INTEGRALE tra -∞ e +∞ DI [ (1/(π)½] e - (x+3)2 VALE 1, IN QUANTO LA FUNZIONE [ (1/(π)½] e - (x+3)2 è UNA (DENSITA') GAUSSIANA, E QUINDI L'INTEGRALE tra -∞ e +∞ DI y(x) VALE (1/3) (π)½ .
Esercizi del tipo D.49 del foglio 9:
PREMESSA quando hanno n dati l'ERRORE STANDARD DELLA MEDIA (campionaria) (e.s.m.) è definito come
e.s.m.= s/√n
dove s è lo scarto quadratico medio (se si tratta di un campione sarebbe meglio usare lo scarto quadratico medio campionario, ma se n è grande mettere n-1 o n non cambia molto i valori che si ottengono)
ed entra nella definizione degli intervalli di confidenza: nel senso che grazie al teorema centrale del limite e le sue generalizzazioni, possiamo affermare che l'intervallo di confidenza al 95% per la media è
[x - 1,96 s/√n , x + 1,96 s/√n ],
e
l'intervallo di confidenza al 99% per la media è
[x - 2,58 s/√n , x + 2,58 s/√n ],
la cui interpretazione è del seguente tipo: quando prendo un campione di n individui da una popolazione molto grande (l'ideale sarebbe una popolazione infinita) posso affermare che nel 99% dei casi la media degli individui si trova nell'intervallo di confidenza [x - 2,58 s/√n , x + 2,58 s/√n ] (analoga considerazione per l'altro intervallo.
QUANDO si riassumono dei risultati di un campinamento i dati vengono presentati come x ± s/√n, chiarendo bene anche quanto vale n.
Nella pratica n deve essere abbastanza grande per poter applicare il teorema centrale del limite: in genere si dice che deve essere ≥ 30, ma è ragionevole anche prendere n circa 1000. QUINDI GLI ESERCIZI DEL TIPO DELL'ESERCIZIO D49-----D52, vanno presi come esercizi (con numeri comodi, ma non come metodi da applicare nella pratica)
TESTO dell'esercizio D.49 del foglio 9 si tratta di un campione di 25 individui di 35 anni la cui pressione arteriosa vale 130 con uno scarto quadratico medio s=4
I dati quindi vanno presentati come x ± s/√n, che in questo caso diviene
130 ± 4/√(25) = 130 ± 4/5 = 130 ± 0,8
..
Giovedì 15 gennaio 2015 Aula E del Dipartimento di Matematica al piano terra (ore 14-16) POI (14,20-16,50, con una pausa)
(lezione di recupero)RAPIDISSIMA INTRODUZIONE ALLA PROBABILITA':
Giustificazione breve del fatto che nella probabilità si usa il metodo assiomatico, identificando l'evento certo con un insieme Ω e gli "eventi" con sottoinsiemi E di Ω,le operazioni sugli eventi sono del tipo:
(i) il contrario di E (o la sua negazione) che diviene l'insieme complementare di E, denotato con Ec,
(ii) dati due eventi E ed F si può considerare l'evento: "si verifcano sia l'evento E che l'evento F"= "si verificano E ed F" che corrisponde all'insieme E ∩ F (l'insieme E intersezione F)
(iii) dati due eventi E ed F si può considerare l'evento: "si verifca almeno uno tra l'evento E e l'evento F"= "si verifica E o F" che corrisponde all'insieme E U F (l'insieme E unione F)
e che devono valere le seguenti regole
1) P(Ω)=1,
2) 0 ≤ P(E) ≤ 1
3) se E ∩ F=Ø (cioè se l'intersezione è l'insieme vuoto Ø, che corrisponde all'evento IMPOSSIBILE, ovvero "gli eventi E ed F sono INCOMPATIBILI") allora P(E U F)=P(E)+P(F)
La condizione 3 equivale alle seguenti condizioni
P(E U F) = P(E) + P(F) - P(E ∩ F) e alla condizione (abbastanza naturale) che P(Ø)=0
INOLTRE LA condizione 3) , insieme alla 1) implica che P(E)+P(Ec)=1 :
infatti E ∩ Ec =Ø e E U Ec = Ω (un evento e il suo contrario sono incompatibili ed è certo che si verifica almeno uno tra l'evento E e il suo contrario Ec (principio del tertium non datur) quindi per la 1) , essendo E U Ec = Ω si ha
1= P( Ω) = P(E U Ec )
inoltre, essendo E ∩ Ec =Ø, per la 3) coincide con
P(E U Ec ) = P(E)+P(Ec)
e riassumendo 1= P( Ω) = P(E U Ec ) = P(E)+P(Ec)
ALTRO INGREDIENTE DEL CALCOLO DELLE PROBABILITA' sono le probabilità condizionate:
la probabilità di un evento F condizionata a un altro evento E, con P(E)>0, denotata con P(F/E) vale
P(F/E) = P(F∩E)/P(E)
la cui interpretazione è la valutazione della probabilità di F SAPENDO CHE si è verificato l'evento E.
DALLA DEFINIZONE (moltiplicando ambo i membri della precedente uguaglianza per P(E)) SI OTTIENE IMMEDIATAMENTE che
P(F∩E) = P(F/E) P(E) (detta formula delle probabilità composte)
Osservazione: scambiando il ruolo di E e di F si ottiene anche (se P(F)>0)
P(E∩F)=P(E/F) P(F)
FORMULE IMPORTANTI che legano le probabilità e le probabilità condizionate
dato un evento E con P(E)>0 e P(Ec)>0 allora per ogni evento F vale
a) formula delle probabilità totali
P(F)= P(E∩F)+P(Ec∩F)=P(E) P(F/E) + P(Ec) P(F/Ec)
b) formula di Bayes
P(E/F) = [P(E) P(F/E)]/P(F) = [P(E) P(F/E)]/[P(E) P(F/E) + P(Ec) P(F/Ec)]
Prima di vedere come si ricavano queste due formule vediamo a cosa servono:
Un effetto F può derivate da due possibili cause denotate con E e con Ec,
(ad esempio si veda l'esempio dei test diagnostici)
se conosciamo P(E) e quindi P(Ec)=1-P(E) e conosciamo P(F/E) e P(F/Ec) allora con la formula delle probabilità totali possiamo calcolare
P(F) = P(E) P(F/E) + P(Ec) P(F/Ec)
Inoltre possiamo essere interessati a capire quale delle due cause è maggiore o comunque quanto valgono le probabilità delle due diverse cause dato che si è verificato l'effetto F
ossia calcolare
P(E/F) = [P(E) P(F/E)]/[P(E) P(F/E) + P(Ec) P(F/Ec)]
e
P(Ec/F) = [P(Ec) P(F/Ec)]/[P(E) P(F/E) + P(Ec) P(F/Ec)]
(ovviamente si ha P(Ec/F)=1-P(E/F) come è naturale, in quanto le probabilità condizionate a un evento F fissato sono probabilità e come si ricava immediatamente dalla formula
P(Ec/F) = [P(Ec) P(F/Ec)]/[P(E) P(F/E) + P(Ec) P(F/Ec)]
= {[P(E) P(F/E) + P(Ec) P(F/Ec)]-P(E) P(F/E) }//[P(E) P(F/E) + P(Ec) P(F/Ec)]
= 1- [P(E) P(F/E)]/[P(E) P(F/E) + P(Ec) P(F/Ec)]
a) verifica della formula delle probabilità totali
P(F)= P(E∩F)+P(Ec∩F)=P(E) P(F/E) + P(Ec) P(F/Ec)
si osserva che F=(E∩F) U (Ec∩F) [ ad esempio con i diagrammi di Venn]
ossia F è l'unione di due insiemi INCOMPATIBILI (E∩F) e (Ec∩F)
(del resto F si verifica solo se si verificano entrambi E ed F oppure se si verificano entrambi Ec ed F ) e quindi per la condizione 3) si ha
P(F) = P( (E∩F) U (Ec∩F) ) = P(E∩F)+P(Ec∩F)
inoltre per la formula delle probabilità composte si ha
P(E∩F)=P(E)P(F/E) e P(Ec∩F) = P(Ec) P(F/Ec)
da cui
P(F) = P(E∩F)+P(Ec∩F) = P(E)P(F/E) + P(Ec) P(F/Ec)
b) Verifica della formula di Bayes
P(E/F) = [P(E) P(F/E)]/P(F) = [P(E) P(F/E)]/[P(E) P(F/E) + P(Ec) P(F/Ec)]
infatti, per definizione si ha
P(E/F)=P(E∩F)/P(F)
e per la formula delle probabilità composte si ha P(E∩F)=P(E)P(F/E) e quindi
P(E/F)=P(E∩F)/P(F)=P(E)P(F/E)/P(F)
e infine si applica la formula delle probabilità totali P(F)= P(E) P(F/E) + P(Ec) P(F/Ec) per ottenere
P(E/F)= P(E)P(F/E)/P(F)= [P(E)P(F/E)] / [ P(E) P(F/E) + P(Ec) P(F/Ec) ]
ESEMPIO DEI TEST DIAGNOSTICI:
si prende un campione " rappresentativo" di N persone appartenenti a una popolazione (ad esempio gli italiani tra 18 e 65 anni)
e li sottopone ad un test per diagnosticare una malattia.
Si indica
con M+ l'insieme delle persone del campione che hanno la malattia
e con M- l'insieme delle persone del campione che non hanno la malattia
con T+ l'insieme delle persone del campione che sono risultate positive al test
e con T- l'insieme delle persone del campione che sono risultate negative al test
(attenzione evidentemente c'è un modo per diagnosticare la malattia sicuro e forse "costoso" mentre il test non è sicuro ed "economico)
A questo punto la popolazione è divisa in 4 sottoinsiemi
T+∩ M+ l'insieme dei veri positivi
T-∩ M- l'insieme dei veri negativi
T+∩ M- l'insieme dei falsi positivi
T-∩ M+ l'insieme dei falsi negativi
Se prendiamo una persona a caso tra gli N sottoposti al test,
la probabilità di prendere una persona che ha malattia è
P(M+)=|M+|/N OSSIA, espressa in percentuale, è LA PREVALENZA della malattia nel campione (la prevalenza di una malattia è la percentuale della malattia all'interno di una determinata popolazione)
la probabilità di prendere una persona che non ha la malattia è
P(M-)=|M-|/N = (N-|M+|)/N=1-|M+|/N = 1-P(M+)
la probabilità che di prendere una persona che è risultata positiva al test è
P(T+)=|T+|/N
a probabilità che di prendere una persona che è risultata negativa al test è
P(T-)=|T-|/N = (N-|T+|)/N=1-|T+|/N = 1-P(T+)
ed analogamente per
P(T+∩ M+) = |T+∩ M+|/N la probabilità di prendere un vero positivo
P(T-∩ M-) = |T-∩ M-|/N la probabilità di prendere un vero negativo
P(T+∩ M-) = |T+∩ M-|/N la probabilità di prendere un falso positivo
P(T-∩ M+ ) = |T-∩ M+|/N la probabilità di prendere un falso negativo
P(T+| M+) = P(T+∩ M+)/P(M+)= [ |T+∩ M+|/N ] / (|M+|/N]=|T+∩ M+| / |M+|
la probabilità che la persona sia risultata positiva al test sapendo che la persona ha la malattia ed è detta LA SENSIBILITA' DEL TEST
P(T-| M-) = P(T-∩ M-)/P(M-)= [ |T-∩ M-|/N ] / (|M-|/N]=|T-∩ M-| / |M-|
la probabilità che la persona sia risultata negativa al test sapendo che la persona NON ha la malattia ed è detta LA SPECIFICITA' DEL TEST
Inoltre, di conseguenza,
P(T+| M-) = 1- P(T-| M-)
P(T-| M+ ) = 1 - P(T+| M+)
La probabilità che la persona sia risultata positiva al test (NON CONDIZIONATA) vale (per la probabilità totali)
P(T+) = P(M+)P(T+|M+) + P(M-)P(T+|M-) = P(M+)P(T+|M+) + [1- P(M+)] [1-P(T-|M-)]
quindi se sono noti la sensibilità P(T+|M+) e la specificità P(T-|M-) e P(T+) allora possiamo calcolare la prevalenza della malattia, che soddisfa una semplice equazione lineare
P(T+) = P(M+)P(T+|M+) + 1-P(T-|M-) - P(M+) [1-P(T-|M-)]
= P(M+) [ P(T+|M+) -1 + P(T-|M-) ] + 1-P(T-|M-)
da cui si può calcolare facilmente P(M+)
INOLTRE
P(M+|T+) = P(M+)P(T+|M+)/ [P(M+)P(T+|M+) + P(M-)P(T+|M-) ]
= P(M+)P(T+|M+) / [ P(M+)P(T+|M+) + [1-P(M+)][1-P(T-|M-)] ]
è la probabilità che una persona scelta a caso nel campione abbia la malattia sapendo che la persona scelta è risultato positivo al test.
IMPORTANTE se il campione è scelto in modo "rappresentativo" ed è abbastanza grande possiamo considerare che le probabiltà precedenti (che sono in realtà pensate come frequenze relative) si possano prendere come le probabilità degli eventi relativi agli eventi del tipo
P(M+)=|M+|/N la probabilità che una persona scelta a caso nella popolazione di cui il campione è stato scelto abbia la malattia
P(T+)=|T+|/N la probabilità che una persona scelta a caso nella popolazione di cui il campione è stato scelto risutli positivo alla malattia
(NOTA BENE: questo approccio corrisponde ad usare l'impostazione frequentista delle probabilità)
e così via, e IMPORTANTE
P(M+|T+) = P(M+)P(T+|M+)/ [P(M+)P(T+|M+) + P(M-)P(T+|M-) ]
= P(M+)P(T+|M+) / [ P(M+)P(T+|M+) + [1-P(M+)][1-P(T-|M-)] ]
si può considerare come la probabilità che una persona scelta a caso nella popolazione abbia effettivamente la malattia sapendo che la persona sia risultata positiva al test.
ESEMPIO ESERCIZIO D38 del foglio RA2 (in realtà questo esempio è stato trattato nel ricevimento del 21 gennaio, il 15 gennaio è stato svolto un altro esercizio simile)
DATI del PROBLEMA
P(T+|M+)=90% =90/100=9/10, P(T-|M-)=80%=80/100=8/10, N=10000,
|T-|=7500
da cui |T+|=2500
punto a)
possiamo affermare che
P(T+)=|T+|/N= 2500/10000=1/4
e d'altra parte
P(T+) = P(M+)P(T+|M+) + P(M-)P(T+|M-) = P(M+)P(T+|M+) + [1- P(M+)] [1-P(T-|M-)]
= P(M+) (9/10) + [1- P(M+)][1-(8/10)] = P(M+) (9/10) + [1- P(M+)](2/10)
e quindi
1/4=P(M+)[(9/10) - (2/10)] + (2/10)
da cui la prevalenza della malattia vale
P(M+)= [(1/4)-(2/10)]/(7/10)= ([25-20]/100)*(10/7)= 5/70=(circa) 0,71=7,1%
ATTENZIONE il libro di testo prevede anche un altro modo per risolvere questo tipo di esercizi, che è equivalente al precedente,(vi invito a pensare perché è equivalente) e che qui presento prendendo come incognita |M+| (invece il libreo prende come incognita x=|M-|):
Poiché la specificità Sp=P(T-/M-)=|T-∩M-|/|M-| e ovviamente |T+∩M-|=|M-| - |T-∩M-|, possiamo dire che
|T-∩M-| = Sp |M-| e che |T+∩M-|=|M-| -Sp |M-|=(1-Sp) |M-|
Analogamente, poiché la sensibilità Se=P(T+/M+)=|T+∩M+|/|M+| e ovviamente |T+∩M+|=|M+| - |T-∩M+| , possiamo dire che
Se |M+|= |T+∩M+| e che |T-∩M+|=|M+| -Se |M+|=(1-Se) |M+|
D'altra parte |T-|=|T-∩M-| + |T-∩M+| e |M-|=N-|M+| quindi
|T-|=Sp |M-| + (1-Se) |M+|= Sp (N- |M+|) + (1-Se) |M+|
da cui si può ricavare |M+| direttamente con una semplice equazione.
punto b)
Essendo P(T-∩ M-) = |T-∩ M-|/N e P(T-∩ M-)=P(M-)P(T-| M-) e P(M-)=1-P(M+) ovviamente si ha che il numero dei veri negativi è
|T-∩ M-|= P(T-∩ M-) N = P(M-)P(T-| M-) N = (65/70)*(8/10)*10000=7428,57 approssimato a 7429 (evidentemente la specificità e la sensibilà sono approssimate)
analogamente si potrebbe ottenere
che il numero dei falsi positivi è
|T+∩ M-|= P(T+∩ M-) N = P(M-)P(T+| M-) N = (65/70)*(2/10)*10000=1857,14 approssimato a 1857che il numero dei veri positivi è
|T+∩ M+|= P(T+∩ M+) N = P(M+)P(T+| M+) N = (5/70)*(9/10)*10000=642,857 approssimato a 643 (del resto 1857+643=2500, il numero delle persone risultate positive)e infine che il numero dei falsi negativi è
|T-∩ M+|= P(T-∩ M+) N = P(M+)P(T-| M+) N = (5/70)*(1/10)*10000=71,428 approssimato a 71 (del resto 7429 +71= 7500, il numero delle persone risultate negative)punto c)
scelta a caso una persona che è risultato positivo la probabilità che abbia la malattia, ossia
P(M+/T+)=P(T+∩ M+)/ P(T+) = P(M+)P(T+|M+)/ P(T+)
=P(M+)P(T+|M+)/ [P(M+)P(T+|M+) + P(M-)P(T+|M-) ]
= P(M+)P(T+|M+) / [ P(M+)P(T+|M+) + [1-P(M+)][1-P(T-|M-)] ]
= (7,1/100) (9/10) / [(7,1/100) (9/10) + (91,9/100)(2/100) ]
= 7,1*9/[7,1*9+92,9*2]= 0,2559= (circa) 26%
Ovviamente, se invece la persona è scelta a caso, avremmo potuto utilizzare anche P(T+)=|T+|/N= 2500/10000=1/4 a denominatore invece della formula per cui P(T+)=P(M+)P(T+|M+) + P(M-)P(T+|M-). QUESTA FORMULA E' INVECE IMPORTANTE NEL CASO IN CUI LA PERSONA CHE HA EFFETTUATO IL TEST NON SIA SCELTA A CASO, MA SIA IN UN GRUPPO DI PERSONE A RISCHIO
IMPORTANTE non siate meravigliati del fatto che questa probabilità è piccola: il punto è che abbiamo preso una persona a caso e NON ABBIAMO MOTIVI DI PENSARE CHE abbia la malattia. In genere chi fa il test di solito ha dei motivi che per cui NON E' GIUSTO USARE P(M+)=7,1% come prevalenza della malattia, in quanto appartiene a una sottopopolazione in cui la prevalenza della malattia è più alta, ad esempio se fosse che tale probabilità nella classe delle persone fosse del 50%=1/2 si otterrebbe invece
P(M+/T+)= (1/2) (9/10) / [(1/2) (9/10) + (1/2)(2/100) ]= 9/(9+2)=9/11=(circa)0,818= 81,8%
..
Lunedì 26 gennaio 2015 Aula III del Dipartimento di Matematica al primo piano (ore 14-17)
(ESAME SCRITTO) ATTENZIONE QUESTE REGOLE RIMANGONO VALIDE PER TUTTI GLI APPELLI SUCCESSIVIL'esame scritto consiste in
8 domande a risposta multipla sui seguenti argomenti
1) Calcoli Numerici e/o Geometria Analitica
2) Sistemi di Equazioni e/o Disequazioni
3) Proprietà di Funzioni senza uso di derivate e/o Scala Logaritmica
4) Studio di funzioni con l'ausilio delle derivate
5) Integrali
6) Progressioni e/o Equazioni Differenziali
7) Statistica
8) Probabilità
+ Due domande a risposta apertaSE LO STUDENTE LO DESIDERA L'ESAME ORALE SI SVOLGERA' ENTRO LA SETTIMANA DELLO SCRITTO: IN TALE CASO LO STUDENTE DOVRA' SEGNALARLO SCRIVENDOLO SUL FOGLIO CON LE DOMANDE.
RICORDATE DI PORTARE UN DOCUMENTO DI IDENTITA'!!!
SI PUO' portare UN LIBRO DI TESTO, e una CALCOLATRICE SCIENTIFICA
ma
NON SI POSSONO USARE TELEFONI CELLULARI, TABLET, APPUNTI, FOTOCOPIE E FOGLI (ANCHE BIANCHI) DIVERSI DA QUELLI CHE VI DAREMO NOI.
-
Figura per capire come si scrivono le coordiante cartesiane in termini delle coordinate polari
-
Figura per capire come si scrivono le coordiante cartesiane in termini delle coordinate polari
-