In matematica, in particolare in analisi matematica e geometria, il teorema delle funzioni implicite è un importante strumento che stabilisce quando il luogo di zeri di un'equazione implicita si può esplicitare rispetto a una variabile.

Nella letteratura italiana, il teorema è generalmente detto teorema di Dini in onore del matematico Ulisse Dini, che contribuì ad estenderne la formulazione.

Il teorema di Dini

Il teorema di Dini stabilisce che una funzione reale di classe C 1 {\displaystyle C^{1}} di due variabili del tipo:

F ( x , y ) {\displaystyle F(x,y)}

definisce implicitamente un'unica funzione del tipo:

y = f ( x ) {\displaystyle y=f(x)}

in un intorno di un punto ( a , b ) {\displaystyle (a,b)} tale che (esplicitando rispetto alla variabile y):

F ( a , b ) = 0 , F y ( a , b ) 0. {\displaystyle F(a,b)=0,\qquad {\frac {\partial F}{\partial y}}(a,b)\neq 0.}

Il teorema di Dini fornisce quindi una condizione sufficiente affinché esista un'unica funzione y = f ( x ) {\displaystyle y=f(x)} tale che

F ( x , f ( x ) ) = 0 {\displaystyle F(x,f(x))=0}

sia soddisfatta al variare di x {\displaystyle x} , oppure un'unica funzione x = g ( y ) {\displaystyle x=g(y)} tale che

F ( g ( y ) , y ) = 0 {\displaystyle F(g(y),y)=0}

sia soddisfatta al variare di y {\displaystyle y} .

Questo non significa che sia possibile esplicitare una delle due incognite in funzione dell'altra, ossia che sia possibile trovare y = f ( x ) {\displaystyle y=f(x)} oppure x = g ( y ) {\displaystyle x=g(y)} in forma esplicita, ma mostra piuttosto che esiste almeno una delle due funzioni, detta funzione implicita.

Se ci si limita all'individuazione di particolari tipi di funzione, ad esempio quelle continue e definite su un intervallo, si può dimostrare anche la loro unicità, il che sancisce un'equivalenza formale tra la scrittura implicita F ( x , y ) = 0 {\displaystyle F(x,y)=0} e quella esplicita y = f ( x ) {\displaystyle y=f(x)} oppure x = g ( y ) {\displaystyle x=g(y)} . Ad esempio, l'equazione:

F ( x , y ) = y x 2 e y = 0 {\displaystyle F(x,y)=y x^{2}e^{y}=0}

ben definisce un'unica funzione continua y = f ( x ) {\displaystyle y=f(x)} definita per ogni x {\displaystyle x} reale, che tuttavia non può essere scritta esplicitamente.

Enunciato

Sia F : G R 2 R {\displaystyle F\colon G\subset \mathbb {R} ^{2}\to \mathbb {R} } una funzione a valori reali, differenziabile e le cui derivate parziali prime siano funzioni continue. Sia inoltre ( x 0 , y 0 ) G {\displaystyle (x_{0},y_{0})\in G} tale che:

F ( x 0 , y 0 ) = 0 , F y ( x 0 , y 0 ) 0. {\displaystyle F(x_{0},y_{0})=0,\qquad {\frac {\partial F}{\partial y}}(x_{0},y_{0})\neq 0.}

Il teorema afferma che esiste una funzione derivabile reale:

g : [ x 0 h , x 0 h ] [ y 0 k , y 0 k ] , h , k > 0 , h , k R , {\displaystyle g\colon [x_{0}-h,x_{0} h]\to [y_{0}-k,y_{0} k],\qquad h,k>0,\quad h,k\in \mathbb {R} ,}

la cui derivata prima sia continua. Inoltre, il grafico di g {\displaystyle g} è l'insieme delle coppie:

{ ( x , y ) G : F ( x , y ) = 0 } {\displaystyle \{(x,y)\in G:F(x,y)=0\}}

che sono contenute nel rettangolo:

[ x 0 h , x 0 h ] × [ y 0 k , y 0 k ] . {\displaystyle [x_{0}-h,x_{0} h]\times [y_{0}-k,y_{0} k].}

Il teorema in due dimensioni

Si consideri una funzione di classe C1 F : A R {\displaystyle F\colon A\to \mathbb {R} } definita su un insieme aperto A R 2 {\displaystyle A\subseteq \mathbb {R} ^{2}} , e si consideri l'insieme:

Z = { ( x , y ) A : F ( x , y ) = 0 } . {\displaystyle Z=\{(x,y)\in A:F(x,y)=0\}.}

Se Z {\displaystyle Z} è non vuoto esiste un punto ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} tale che:

F ( x 0 , y 0 ) = 0. {\displaystyle F(x_{0},y_{0})=0.}

Il teorema afferma che se ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} non è un punto critico, ossia:

F ( x 0 , y 0 ) 0 , {\displaystyle \nabla F(x_{0},y_{0})\neq 0,}

allora esiste un intorno U {\displaystyle U} di ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} tale che l'insieme Z U {\displaystyle Z\cap U} è il grafico di una funzione derivabile.

Questo equivale a dire che esiste un'unica funzione del tipo y = y ( x ) {\displaystyle y=y(x)} o del tipo x = x ( y ) {\displaystyle x=x(y)} che mette in relazione le due incognite x {\displaystyle x} e y {\displaystyle y} . Si noti che questo non significa che è davvero possibile esplicitare una delle due variabili in funzione dell'altra, ma solo che l'equazione definisce implicitamente un legame tra le due incognite che è univoco.

Sia g : A R 2 R {\displaystyle g\colon A\subset \mathbb {R} ^{2}\rightarrow \mathbb {R} } una funzione di classe C 1 {\displaystyle {\mathcal {C}}^{1}} nell'aperto A {\displaystyle A} e sia ( x 0 , y 0 ) A {\displaystyle (x_{0},y_{0})\in A} tale che:

g ( x 0 , y 0 ) = 0 , g y ( x 0 , y 0 ) 0. {\displaystyle g(x_{0},y_{0})=0,\qquad g_{y}(x_{0},y_{0})\neq 0.}

Allora esistono un intervallo reale aperto I {\displaystyle I} , con x 0 I {\displaystyle x_{0}\in I} , un intervallo reale aperto J {\displaystyle J} , con y 0 J {\displaystyle y_{0}\in J} , ed una funzione y ( x ) {\displaystyle y(x)} di classe C 1 {\displaystyle {\mathcal {C}}^{1}} in I {\displaystyle I} a valori in J {\displaystyle J} tali che:

y ( x 0 ) = y 0 , y ( x 0 ) = ( g x ( x 0 , y 0 ) g y ( x 0 , y 0 ) ) {\displaystyle y(x_{0})=y_{0},\qquad y'(x_{0})=-\left({\frac {g_{x}(x_{0},y_{0})}{g_{y}(x_{0},y_{0})}}\right)}

e tali che per ogni x I , y J {\displaystyle x\in I,y\in J} la relazione:

g ( x , y ) = 0 {\displaystyle g(x,y)=0}

si verifica se e solo se:

y = y ( x ) . {\displaystyle y=y(x).}

Scambiando i ruoli delle variabili si giunge a definire una funzione x = x ( y ) {\displaystyle x=x(y)} .

Dimostrazioni

Prima dimostrazione

Sia data una funzione continua g : A R 2 R {\displaystyle g\colon A\subset \mathbb {R} ^{2}\to \mathbb {R} } di classe C 1 {\displaystyle {\mathcal {C}}^{1}} in A {\displaystyle A} tale che g ( x , y ) 0 {\displaystyle \nabla g(x,y)\neq 0} in tutti i punti tali che g ( x , y ) = 0 {\displaystyle g(x,y)=0} , cioè nella curva di livello:

V = { ( x , y ) A : g ( x , y ) = 0 } . {\displaystyle V=\{(x,y)\in A:g(x,y)=0\}.}

Sia ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} un punto di V {\displaystyle V} e si consideri il relativo sviluppo al primo ordine di Taylor:

g ( x , y ) = g ( x 0 , y 0 ) g x ( x 0 , y 0 ) ( x x 0 ) g y ( x 0 , y 0 ) ( y y 0 ) o ( ( x x 0 ) 2 ( y y 0 ) 2 ) . {\displaystyle g(x,y)=g(x_{0},y_{0}) g_{x}(x_{0},y_{0})(x-x_{0}) g_{y}(x_{0},y_{0})(y-y_{0}) o({\sqrt {(x-x_{0})^{2} (y-y_{0})^{2}}}).}

Tenendo conto che g ( x 0 , y 0 ) = 0 {\displaystyle g(x_{0},y_{0})=0} , uguagliando a zero la prima parte del termine al primo ordine si ottiene:

g x ( x 0 , y 0 ) ( x x 0 ) g y ( x 0 , y 0 ) ( y y 0 ) = 0. {\displaystyle g_{x}(x_{0},y_{0})(x-x_{0}) g_{y}(x_{0},y_{0})(y-y_{0})=0.}

Per ipotesi, tale equazione di primo grado ha almeno un coefficiente diverso da zero, e si può porre g y ( x 0 , y 0 ) 0 {\displaystyle g_{y}(x_{0},y_{0})\neq 0} . Si può quindi ricavare y {\displaystyle y} in funzione di x {\displaystyle x} :

y = y 0 g x ( x 0 , y 0 ) g y ( x 0 , y 0 ) ( x x 0 ) . {\displaystyle y=y_{0}-{\frac {g_{x}(x_{0},y_{0})}{g_{y}(x_{0},y_{0})}}(x-x_{0}).}

Il teorema mostra che l'errore nella formula di approssimazione al primo ordine non incide sulla possibilità di esprimere una variabile in funzione dell'altra.

La funzione ottenuta ha sviluppo al primo ordine:

y = y 0 g x ( x 0 , y 0 ) g y ( x 0 , y 0 ) ( x x 0 ) o ( x x 0 ) . {\displaystyle y=y_{0}-{\frac {g_{x}(x_{0},y_{0})}{g_{y}(x_{0},y_{0})}}(x-x_{0}) o(x-x_{0}).}

Seconda dimostrazione (teorema delle contrazioni)

Sia data una funzione continua g : A R 2 R {\displaystyle g\colon A\subseteq \mathbb {R} ^{2}\rightarrow \mathbb {R} } di classe C 1 {\displaystyle {\mathcal {C}}^{1}} nell'aperto A {\displaystyle A} tale che per ( x 0 , y 0 ) A {\displaystyle (x_{0},y_{0})\in A} si abbia

g ( x 0 , y 0 ) = 0 , g y ( x 0 , y 0 ) 0 . {\displaystyle {\begin{aligned}g(x_{0},y_{0})=0,\qquad g_{y}(x_{0},y_{0})\neq 0\end{aligned}}.}

Sia definita la funzione

G ( x , y ) = y g ( x , y ) g y ( x 0 , y 0 ) . {\displaystyle {\begin{aligned}G(x,y)=y-{\frac {g(x,y)}{g_{y}(x_{0},y_{0})}}\end{aligned}}.}

Allora G ( x 0 , y 0 ) = y 0 {\displaystyle G(x_{0},y_{0})=y_{0}} e G ( x , y ) = y {\displaystyle G(x,y)=y} per ( x , y ) I × J {\displaystyle (x,y)\in I\times J} . Dunque trovare gli zeri di g ( x , y ) {\displaystyle g(x,y)} si riduce a trovare il punto fisso della funzione G ( x , y ) {\displaystyle G(x,y)} .

Grazie al teorema delle contrazioni sappiamo che, definito

X = { ψ : I J | ψ C 0 } . {\displaystyle X=\{\psi \colon I\rightarrow J\;|\;\psi \in {\mathcal {C}}^{0}\}.}

Siccome G X {\displaystyle G\in X} , ( X , ) {\displaystyle (X,\lVert \cdot \lVert _{\infty })} è facile dimostrare che sia uno spazio metrico completo, allora

! y = f ( x ) : G ( x , f ( x ) ) = f ( x ) . {\displaystyle \exists !\;y=f(x):G(x,f(x))=f(x).}

Sia H : X X {\displaystyle H\colon X\rightarrow X} una contrazione tale che

w H [ w ] ( x ) = G ( x , w ( x ) ) {\displaystyle w\mapsto H[w](x)=G(x,w(x))}

ci basta dimostrare che H {\displaystyle H} sia ben definita, cioè che H [ w ] X {\displaystyle H[w]\in X} . Questa deve avere le seguenti proprietà:

  1. H [ w ] {\displaystyle H[w]} è continua in I ; {\displaystyle I;}
  2. H [ w ] y 0 ε . {\displaystyle \lVert H[w]-y_{0}\rVert _{\infty }\leq \varepsilon .}

La prima è ovvia siccome l'operatore è composizione di funzioni continue. La seconda può essere dimostrata tramite una catena di disuguaglianze:

H [ w ] y 0 = G ( x , w ( x ) ) G ( x 0 , y 0 ) G ( x , w ( x ) ) G ( x , y 0 ) G ( x , y 0 ) G ( x 0 , y 0 ) = = G ( x , w ( x ) ) G ( x , y 0 ) y 0 g ( x , y 0 ) g y ( x 0 , y 0 ) y 0 G y ( x , ξ y ) ( w ( x ) y 0 ) g ( x , y 0 ) | g y ( x 0 , y 0 ) | sup ξ y J | G y ( x , ξ y ) | w ( x ) y 0 g ( x , y 0 ) | g y ( x 0 , y 0 ) | ε , {\displaystyle {\begin{aligned}&\lVert H[w]-y_{0}\rVert _{\infty }=\lVert G(x,w(x))-G(x_{0},y_{0})\lVert _{\infty }\leq \lVert G(x,w(x))-G(x,y_{0})\lVert _{\infty } \lVert G(x,y_{0})-G(x_{0},y_{0})\lVert _{\infty }=\\[10pt]&=\lVert G(x,w(x))-G(x,y_{0})\lVert _{\infty } \lVert y_{0}-{\frac {g(x,y_{0})}{g_{y}(x_{0},y_{0})}}-y_{0}\lVert _{\infty }\leq \lVert G_{y}(x,\xi _{y})(w(x)-y_{0})\lVert _{\infty } {\frac {\lVert g(x,y_{0})\lVert _{\infty }}{|g_{y}(x_{0},y_{0})|}}\leq \\[10pt]&\leq {\underset {\xi _{y}\in J}{\sup }}|G_{y}(x,\xi _{y})|\lVert w(x)-y_{0}\lVert _{\infty } {\frac {\lVert g(x,y_{0})\lVert _{\infty }}{|g_{y}(x_{0},y_{0})|}}\leq \varepsilon ,\end{aligned}}}

dove si è applicato il teorema di Lagrange ed il fatto che

sup ξ y J G y ( x , ξ y ) 1 2  poiché  h , k  possono essere piccoli a piacimento w ( x ) y 0 ε  poiché  w ( x ) X g ( x , y 0 ) | g y ( x 0 , y 0 ) | ε 2 . {\displaystyle {\begin{aligned}&{\underset {\xi _{y}\in J}{\sup }}G_{y}(x,\xi _{y})\leq {1 \over 2}\;\;{\text{ poiché }}h,k\;{\text{ possono essere piccoli a piacimento}}\\[10pt]&\lVert w(x)-y_{0}\lVert _{\infty }\leq \varepsilon \;\;{\text{ poiché }}w(x)\in X\\[10pt]&{\frac {\lVert g(x,y_{0})\lVert _{\infty }}{|g_{y}(x_{0},y_{0})|}}\leq {\varepsilon \over 2}.\end{aligned}}}

Ora basta dimostrare che H {\displaystyle H} sia una contrazione:

H [ w ] H [ v ] = G ( x , w ( x ) ) G ( x , h ( x ) ) sup ξ J | G ( x , ξ ) | w v 1 2 w v . {\displaystyle \lVert H[w]-H[v]\lVert _{\infty }=\lVert G(x,w(x))-G(x,h(x))\lVert _{\infty }\leq {\underset {\xi \in J}{\sup }}|G(x,\xi )|\lVert w-v\lVert _{\infty }\leq {1 \over 2}\lVert w-v\lVert _{\infty }.}

Il teorema in più dimensioni

Sia f : E R n m R n {\displaystyle \mathbf {f} \colon E\subset \mathbb {R} ^{n m}\rightarrow \mathbb {R} ^{n}} una funzione di classe C 1 {\displaystyle {\mathcal {C}}^{1}} , dove R n m {\displaystyle \mathbb {R} ^{n m}} è il prodotto cartesiano R n × R m {\displaystyle \mathbb {R} ^{n}\times \mathbb {R} ^{m}} i cui elementi sono del tipo ( x , y ) = ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) {\displaystyle (\mathbf {x} ,\mathbf {y} )=(x_{1},x_{2},\ldots ,x_{n},y_{1},y_{2},\ldots ,y_{m})} . Sia inoltre ( a , b ) = ( a 1 , a 2 , , a n , b 1 , b 2 , , b m ) E {\displaystyle (\mathbf {a} ,\mathbf {b} )=(a_{1},a_{2},\ldots ,a_{n},b_{1},b_{2},\ldots ,b_{m})\in E} un punto tale che f ( a , b ) = 0 {\displaystyle \mathbf {f} (\mathbf {a} ,\mathbf {b} )=0} .

Data la matrice jacobiana di f {\displaystyle \mathbf {f} } in ( a , b ) {\displaystyle (\mathbf {a} ,\mathbf {b} )} :

( D f ) ( a , b ) = [ f 1 x 1 ( a , b ) f 1 x n ( a , b ) f n x 1 ( a , b ) f n x n ( a , b ) | f 1 y 1 ( a , b ) f 1 y m ( a , b ) f n y 1 ( a , b ) f n y m ( a , b ) ] = [ X | Y ] , {\displaystyle {\begin{matrix}(D\mathbf {f} )(\mathbf {a} ,\mathbf {b} )&=&\left[{\begin{matrix}{\frac {\partial f_{1}}{\partial x_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{1}}{\partial x_{n}}}(\mathbf {a} ,\mathbf {b} )\\\vdots &\ddots &\vdots \\{\frac {\partial f_{n}}{\partial x_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{n}}{\partial x_{n}}}(\mathbf {a} ,\mathbf {b} )\end{matrix}}\right|\left.{\begin{matrix}{\frac {\partial f_{1}}{\partial y_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{1}}{\partial y_{m}}}(\mathbf {a} ,\mathbf {b} )\\\vdots &\ddots &\vdots \\{\frac {\partial f_{n}}{\partial y_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{n}}{\partial y_{m}}}(\mathbf {a} ,\mathbf {b} )\\\end{matrix}}\right]={\begin{bmatrix}X&|&Y\end{bmatrix}}\\\end{matrix}},}

si supponga che X {\displaystyle X} sia invertibile.

Il teorema delle funzioni implicite afferma che vi sono due insiemi aperti U R n m {\displaystyle U\subset \mathbb {R} ^{n m}} e V R m {\displaystyle V\subset \mathbb {R} ^{m}} contenenti rispettivamente ( a , b ) {\displaystyle (\mathbf {a} ,\mathbf {b} )} e b {\displaystyle \mathbf {b} } tali che per ogni y V {\displaystyle \mathbf {y} \in V} esiste un unico x {\displaystyle \mathbf {x} } che soddisfa ( x , y ) U {\displaystyle (\mathbf {x} ,\mathbf {y} )\in U} e f ( x , y ) = 0 {\displaystyle \mathbf {f} (\mathbf {x} ,\mathbf {y} )=0} . Inoltre, la funzione g : V R n {\displaystyle \mathbf {g} \colon V\to \mathbb {R} ^{n}} tale che g ( y ) = x {\displaystyle \mathbf {g} (\mathbf {y} )=\mathbf {x} } è una funzione di classe C 1 {\displaystyle {\mathcal {C}}^{1}} tale che:

g ( b ) = a , ( D g ) ( b ) = X 1 Y , {\displaystyle \mathbf {g} (\mathbf {b} )=\mathbf {a} ,\qquad (D\mathbf {g} )(\mathbf {b} )=-X^{-1}Y,}

dove ( D g ) ( b ) {\displaystyle (D\mathbf {g} )(\mathbf {b} )} è la jacobiana di g {\displaystyle \mathbf {g} } in b {\displaystyle \mathbf {b} } . La relazione:

f ( g ( y ) , y ) = 0 , y V , {\displaystyle \mathbf {f} (\mathbf {g} (\mathbf {y} ),\mathbf {y} )=0,\qquad \mathbf {y} \in V,}

definisce implicitamente g {\displaystyle \mathbf {g} } .

Il teorema stabilisce quindi che il sistema f ( x , y ) = 0 {\displaystyle \mathbf {f} (\mathbf {x} ,\mathbf {y} )=\mathbf {0} } :

{ f 1 ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) = 0 f 2 ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) = 0 f n ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) = 0 {\displaystyle \left\{{\begin{matrix}f_{1}(x_{1},x_{2},\cdots ,x_{n},y_{1},y_{2},\cdots ,y_{m})=0\\f_{2}(x_{1},x_{2},\cdots ,x_{n},y_{1},y_{2},\cdots ,y_{m})=0\\\vdots \\f_{n}(x_{1},x_{2},\cdots ,x_{n},y_{1},y_{2},\cdots ,y_{m})=0\\\end{matrix}}\right.}

può essere risolto esplicitando ( x 1 , x 2 , , x n ) {\displaystyle (x_{1},x_{2},\cdots ,x_{n})} in funzione di ( y 1 , y 2 , , y m ) {\displaystyle (y_{1},y_{2},\cdots ,y_{m})} in un intorno di b {\displaystyle \mathbf {b} } se il sistema è risolvibile in ( a , b ) {\displaystyle (\mathbf {a} ,\mathbf {b} )} e se X {\displaystyle X} è invertibile. Le soluzioni così trovate sono inoltre funzioni di classe C 1 {\displaystyle {\mathcal {C}}^{1}} . Il teorema può essere generalizzato al caso di funzioni analitiche.

Il teorema si estende anche agli spazi di Banach.

Note

Bibliografia

  • Walter Rudin, Principi di analisi matematica, Milano, McGraw-Hill, 1991, ISBN 88-386-0647-1.
  • V.Barutello, M.Conti, D.L.Ferrario, S.Terracini, G.Verzini, Analisi matematica. Con elementi di geometria e calcolo vettoriale, Apogeo Editore, 2008, ISBN 8850324235.

Voci correlate

  • Derivata
  • Derivata direzionale
  • Derivata parziale
  • Funzione differenziabile
  • Funzione implicita
  • Gradiente
  • Matrice jacobiana
  • Teorema della funzione inversa

Collegamenti esterni

  • (EN) Eric W. Weisstein, Implicit Function Theorem, su MathWorld, Wolfram Research.

Limiti di funzioni Dimostrazioni teoremi spiegate

Teorema del Dini (o delle funzioni implicite) Lezione 12 iMathematica

Funzioni implicite Appunti di analisi matematica

realanalysis Un uso del Teorema de la Función Implícita

Teorema del Dini (o delle funzioni implicite) Lezione 12 iMathematica