Differential-Matrix < mehrere Veränderl. < reell < Analysis < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 14:53 Do 04.06.2009 | Autor: | Unk |
Aufgabe | [mm] L:\mathbb{r}^n\rightarrow \mathbb{R}^m [/mm] lineare Abbildung.
Bestimme DL(x) für [mm] x\in \mathbb{R}^n. [/mm] |
Hallo,
ganz allgemein haben wir [mm] (Df)(x)=(\frac{\partial f_{i}}{\partial x_{j}}(x))_{\underset{1\leq j\leq n}{1\leq i\leq m}} [/mm] so definiert, wobei [mm] f_{i}:\mathbb{R}^{n}\rightarrow\mathbb{R}^{m} [/mm] partiell diffbar in x sein soll.
Wenn ich das jetzt für eine lineare Abbildung ausrechnen soll, habe ich dann nicht einfach:
[mm] DL(x)=(\frac{\partial L_{i}}{\partial x_{j}}(x)?
[/mm]
Das fände ich witzlos, wenn es so wäre. Da muss ich doch noch irgendwas machen oder?
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:49 Do 04.06.2009 | Autor: | fred97 |
> [mm]L:\mathbb{r}^n\rightarrow \mathbb{R}^m[/mm] lineare Abbildung.
>
> Bestimme DL(x) für [mm]x\in \mathbb{R}^n.[/mm]
> Hallo,
>
> ganz allgemein haben wir [mm](Df)(x)=(\frac{\partial f_{i}}{\partial x_{j}}(x))_{\underset{1\leq j\leq n}{1\leq i\leq m}}[/mm]
> so definiert, wobei
> [mm]f_{i}:\mathbb{R}^{n}\rightarrow\mathbb{R}^{m}[/mm] partiell
> diffbar in x sein soll.
>
> Wenn ich das jetzt für eine lineare Abbildung ausrechnen
> soll, habe ich dann nicht einfach:
> [mm]DL(x)=(\frac{\partial L_{i}}{\partial x_{j}}(x)?[/mm]
Und was ist das ??
Berechne mal
[mm] \bruch{L(x+h)-L(x)-L(h)}{||h||}
[/mm]
was stellst Du fest ?
FRED
> Das
> fände ich witzlos, wenn es so wäre. Da muss ich doch noch
> irgendwas machen oder?
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 16:19 Do 04.06.2009 | Autor: | Unk |
Dann kommt 0 raus.
Kriege ich dann die Nullmatrix oder was?
Das fände ich in sofern komisch, als das der zweite Aufgabenteil fordert:
Sei [mm] H:\mathbb{R}^m \rightarrow \mathbb{R}^k [/mm] diff.bar.
Wie berechnet sich dann die Funktionalmatrix [mm] D(H\circ [/mm] L)(x) für [mm] x\in \mathbb{R}^m [/mm] (Kettenregel).
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 16:44 Do 04.06.2009 | Autor: | Marcel |
Hallo,
> Dann kommt 0 raus.
> Kriege ich dann die Nullmatrix oder was?
> Das fände ich in sofern komisch, als das der zweite
> Aufgabenteil fordert:
Du musst schon genau gucken, wo man bei Freds Term die 'Ableitung' findet. Zur Erinnerung:
Wiki: Fréchet-Ableitung.
(P.S.: Beachte: [mm] $$\lim_{h \to 0}\frac{\|L(x+h)-L(x)-L(h)\|}{\|h\|}=0$$
[/mm]
ist hier trivial. Warum?)
Überlege nun: Wie hängt das [mm] $A\!\,'(\varphi)\,h$ [/mm] aus Wiki zusammen mit dem [mm] $\,L(h)\,$ [/mm] aus Freds Hinweis? (Bei Dir: [mm] $\varphi=x$ [/mm] und [mm] $U=\IR^n$.)
[/mm]
P.S.:
Du kannst auch mal mit Matrizen rechnen (das Ergebnis wird das gleiche sein):
Weil $L: [mm] \IR^n \to \IR^m$ [/mm] linear ist, existiert eine Matrix $B [mm] \in \IR^{m \times n}$ [/mm] so, dass [mm] $L(x)=B*x\,$ [/mm] für alle $x [mm] \in \IR^n$ [/mm] (wobei die Matrix [mm] $B\,$ [/mm] die Gestalt [mm] $B=\big(b_{i,k}\big)_{\substack{i=1,\,\ldots,\,m\\k=1,\,\ldots,\,n}}$ [/mm] hat).
Dann gilt:
[mm] $$L(x)=\vektor{l_1(x_1,\,\ldots,\,x_n)\\.\\.\\.\\l_m(x_1,\,\ldots,\,x_n)}=\vektor{\sum\limits_{k=1}^n b_{1,k}\;*x_k\\.\\.\\.\\\sum\limits_{k=1}^n b_{m,k}\;*x_k}\,.$$
[/mm]
Jetzt wirst Du sicher herausfinden, was dann [mm] $DL(x)\,$ [/mm] ist...
Gruß,
Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 17:31 Do 04.06.2009 | Autor: | Unk |
Ich hab das jetzt mal mit den Matrizen gerechnet:
> Dann gilt:
>
> [mm]L(x)=\vektor{l_1(x_1,\,\ldots,\,x_n)\\.\\.\\.\\l_m(x_1,\,\ldots,\,x_n)}=\vektor{\sum\limits_{k=1}^n b_{1,k}\;*x_k\\.\\.\\.\\\sum\limits_{k=1}^n b_{m,k}\;*x_k}\,.[/mm]
>
> Jetzt wirst Du sicher herausfinden, was dann [mm]DL(x)\,[/mm] ist...
>
Dann [mm] DL(x)=\begin{pmatrix}\frac{\partial}{\partial x_{1}}\sum b_{1,k}x_{k}\\
\vdots\\
\frac{\partial}{\partial x_{n}}\sum b_{m,k}x_{k}\end{pmatrix}. [/mm] Ich komme dann auf [mm] =\begin{pmatrix}b_{11}\\
b_{22}\\
\vdots\\
b_{mn}\end{pmatrix}. [/mm] Ist das denn richtig? Ich kann es mir nicht vorstellen...
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:22 Do 04.06.2009 | Autor: | Marcel |
Hallo,
> Ich hab das jetzt mal mit den Matrizen gerechnet:
>
>
> > Dann gilt:
> >
> >
> [mm]L(x)=\vektor{l_1(x_1,\,\ldots,\,x_n)\\.\\.\\.\\l_m(x_1,\,\ldots,\,x_n)}=\vektor{\sum\limits_{k=1}^n b_{1,k}\;*x_k\\.\\.\\.\\\sum\limits_{k=1}^n b_{m,k}\;*x_k}\,.[/mm]
>
> >
> > Jetzt wirst Du sicher herausfinden, was dann [mm]DL(x)\,[/mm] ist...
> >
>
> Dann [mm]DL(x)=\begin{pmatrix}\frac{\partial}{\partial x_{1}}\sum b_{1,k}x_{k}\\
\vdots\\
\frac{\partial}{\partial x_{n}}\sum b_{m,k}x_{k}\end{pmatrix}.[/mm]
> Ich komme dann auf [mm]=\begin{pmatrix}b_{11}\\
b_{22}\\
\vdots\\
b_{mn}\end{pmatrix}.[/mm] Ist das denn
> richtig? Ich kann es mir nicht vorstellen...
nein, es ist
[mm] $$DL(x)=\pmat{\frac{\partial}{\partial x_1}l_1(x), & \frac{\partial}{\partial x_2}l_1(x), & . & . & . & \frac{\partial}{\partial x_n}l_1(x)\\\frac{\partial}{\partial x_1}l_2(x), & \frac{\partial}{\partial x_2}l_2(x), & . & . & . & \frac{\partial}{\partial x_n}l_2(x)\\.\\.\\.\\\frac{\partial}{\partial x_1}l_m(x), & \frac{\partial}{\partial x_2}l_m(x), & . & . & . & \frac{\partial}{\partial x_n}l_m(x)}\,.$$ [/mm]
Damit Du mal eine Idee hast, was rauskommen soll:
Beispiel für lineare Funktionen $L: [mm] \IR^3 \to \IR^2$, [/mm] charakterisiert durch die Matrix $B [mm] \in \IR^{2 \times 3}$:
[/mm]
Sei [mm] $B=\pmat{b_{1,1} & b_{1,2} & b_{1,3}\\b_{2,1} & b_{2,2} & b_{2,3}}\,.$ [/mm] Dann ist [mm] $l_1(x)=b_{1,1}*x_1+b_{1,2}*x_2+b_{1,3}*x_3$ [/mm] und [mm] $l_2(x)=b_{2,1}*x_1+b_{2,2}*x_2+b_{2,3}*x_3\,.$
[/mm]
Dann ist
[mm] $$DL(x)=\pmat{\frac{\partial}{\partial x_1}l_1(x), & \frac{\partial}{\partial x_2}l_1(x), & \frac{\partial}{\partial x_3}l_1(x)\\\frac{\partial}{\partial x_1}l_2(x), & \frac{\partial}{\partial x_2}l_2(x), & \frac{\partial}{\partial x_3}l_2(x)}=\pmat{b_{1,1} & b_{1,2} & b_{1,3}\\b_{2,1} & b_{2,2} & b_{2,3}}=B\,.$$
[/mm]
Wie sieht es wohl allgemein aus? Und wenn Du nun wieder [mm] $B\,$ [/mm] mit der linearen Funktion [mm] $L\,$ [/mm] identifizierst, dann weißt Du auch, was Fred Dir sagen wollte.
Gruß,
Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 21:37 Do 04.06.2009 | Autor: | Unk |
> Wie sieht es wohl allgemein aus?
Dann erhalte ich doch auch wieder B.(?)
Wenn jetzt [mm] F:\mathbb{R}^m\rightarrow \mathbb{R}^k [/mm] diffbar sein soll und ich [mm] D(F\circ [/mm] L)(x) berechnen soll, erhalte ich ja nach Kettenregel erstmal
[mm] D(F\circ L)(x)=D(F(L(x)))\cdot [/mm] D(L(x)).
Wie rechne ich jetzt aber D(F(L(x))) aus? Ich weiß nicht so recht, wie ich das mit dem F anfangen soll. Das ist ja jetzt nicht einfach eine lineare Abbildung.
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:13 Do 04.06.2009 | Autor: | Marcel |
Hallo,
>
> > Wie sieht es wohl allgemein aus?
>
> Dann erhalte ich doch auch wieder B.(?)
>
> Wenn jetzt [mm]F:\mathbb{R}^m\rightarrow \mathbb{R}^k[/mm] diffbar
> sein soll und ich [mm]D(F\circ[/mm] L)(x) berechnen soll, erhalte
> ich ja nach Kettenregel erstmal
> [mm]D(F\circ L)(x)=D(F(L(x)))\cdot[/mm]Eingabefehler: "{" und "}" müssen immer paarweise auftreten, es wurde aber ein Teil ohne Entsprechung gefunden (siehe rote Markierung)
D(L(x)).
das ist schlecht notiert. Das erste $D\,$ rechterhand bezieht sich dabei ja auf $F\,,$ d.h. du solltest schreiben:
$$D(F \circ L)(x)=DF(L(x))*DL(x)\,.$$
(In Worten: Die Ableitung von $F \circ L$ ausgewertet an der Stelle $x\,$ ergibt sich, indem man die Ableitung von $F\,$ an der Stelle $\,L(x)$ auswertet und dieses Ergebnis mit der Ableitung von $L\,$ an der Stelle $x\,$ multipliziert. Wobei die Ableitung an einer Stelle oben ja - vgl. Definition der Fréchet-Ablkeitung - eigentlich selbst wieder ein (beschränkter) linearer Operator ist. Und oben hast Du ja eigentlich nur $m \times n$ bzw. $k \times m$ Matrizen, die Matrizenmultiplikation kann man dann gerade als Hintereinanderschaltung der entsprechenden linearer Abbildungen auffassen.)
> Wie rechne ich jetzt aber D(F(L(x))) aus? Ich weiß nicht so
> recht, wie ich das mit dem F anfangen soll. Das ist ja
> jetzt nicht einfach eine lineare Abbildung.
Nein, es steht ja auch nirgends, dass Du das noch weiter vereinfachen solltest (ich wüßte auch nichts anderes zu schreiben; ich persönlich würde nur $J_F(L(x))$ anstatt $DF(L(x))\,$ schreiben, also das ganze mit der Jacobimatrix notieren. Das ist aber sicher nicht zwingend!).
Und für beliebige diff'bare Funktionen $F: \IR^m \to \IR^k$ kann man ja i.a. nicht ohne weiteres eine konkrete Formel für $\,DF(x)$ ($x \in \IR^m$ fest) angeben. Genausowenig weißt Du ja für eine diff'bare Funktion $f:\;\IR \to \IR\,,$ wie $f\!\,'$ aussieht, wenn $f\,$ nicht etwas 'konkreter' angegeben wird (das muss keine konkrete Funktionsvorschrift sein, aber gewisse Funktionenklassen würden schon helfen: $f\,$ linear, oder $f\,$ Polynom, oder $f\,$ trigonometrisches Polynom... mit solchen Eingrenzungen könnte man dann jedenfalls drauf schließen, welche Form $f\!\,'$ hat!)
Aber bei
$$D(F \circ L)(x)=DF(L(x))*DL(x)$$
kannst Du $DL(x)}\,$ aus dem ersten Teil einsetzen.
Gruß,
Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 22:25 Do 04.06.2009 | Autor: | Unk |
> Aber bei
> [mm]D(F \circ L)(x)=DF(L(x))*DL(x)[/mm]
> kannst Du [mm]DL(x)}\,[/mm] aus dem
> ersten Teil einsetzen.
>
> Gruß,
> Marcel
Ich könnte doch auch noch für [mm] L(x)=Bx=\begin{pmatrix}\overset{n}{\underset{i=1}{\sum}}b_{1,i}x_{i}\\
\vdots\\
\overset{n}{\underset{i=1}{\sum}}b_{m,i}x_{i}\end{pmatrix} [/mm] einsetzen. Ja und dann eben B=DL(x). Käme ich zu
D(F [mm] \circ L)(x)=DF(\begin{pmatrix}\overset{n}{\underset{i=1}{\sum}}b_{1,i}x_{i}\\
\vdots\\
\overset{n}{\underset{i=1}{\sum}}b_{m,i}x_{i}\end{pmatrix} [/mm] )*B
Darf man das so aufschreiben?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 00:46 Fr 05.06.2009 | Autor: | Marcel |
Hallo,
> > Aber bei
> > [mm]D(F \circ L)(x)=DF(L(x))*DL(x)[/mm]
> > kannst Du [mm]DL(x)}\,[/mm]
> aus dem
> > ersten Teil einsetzen.
> >
> > Gruß,
> > Marcel
>
> Ich könnte doch auch noch für
> [mm]L(x)=Bx=\begin{pmatrix}\overset{n}{\underset{i=1}{\sum}}b_{1,i}x_{i}\\
\vdots\\
\overset{n}{\underset{i=1}{\sum}}b_{m,i}x_{i}\end{pmatrix}[/mm]
> einsetzen. Ja und dann eben B=DL(x). Käme ich zu
>
> D(F [mm]\circ L)(x)=DF(\begin{pmatrix}\overset{n}{\underset{i=1}{\sum}}b_{1,i}x_{i}\\
\vdots\\
\overset{n}{\underset{i=1}{\sum}}b_{m,i}x_{i}\end{pmatrix}[/mm]
> )*B
>
> Darf man das so aufschreiben?
ja klar. Aber wie gesagt:
Du solltest halt die Vorüberlegung, dass die lineare Abbildung [mm] $L\,$ [/mm] durch die Matrix [mm] $B\,$ [/mm] charakterisiert wird, irgendwo erwähnen. Dazu findest Du aber sicher eine Übungsaufgabe aus der LA oder aus der Analysis, auf die Du dann entsprechend verweisen kannst. Oder Du musst Dir mal kurz selber überlegen, wieso, wenn $L: [mm] \IR^n \to \IR^m$ [/mm] linear ist, dann eine Matrix $B [mm] \in \IR^{m \times n}$ [/mm] existiert, so dass [mm] $L(x)\,=\,B*x$ [/mm] für alle $x [mm] \in \IR^n$ [/mm] gilt.
Und eigentlich wollte ich Dich mit der 'Idee über den Umweg mit der Matrix [mm] $B\,$' [/mm] eigentlich darauf führen, wie Du [mm] $DL(x)\,$ [/mm] nur mit [mm] $L\,$ [/mm] ausdrücken kannst... ich wollte es Dir halt erstmal 'rechnerisch' klarmachen, da es mir schien, dass Du mit Freds Hinweis nicht ganz zurechtgekommen seist.
Also:
Die Idee war, wenn [mm] $L(x)=B*x\;\;\;\;(x \in \IR^n)$ [/mm] ist, so repräsentiert ja [mm] $B\,$ [/mm] gerade [mm] $L\,,$ [/mm] und wenn Du nochmal bei Freds Rechnung reinguckst, und Dir klarmachst, dass dann [mm] $L(x)=B(x):=B*x\;\;\;\;(x \in \IR^n)$ [/mm] aufgefasst werden kann, dann ist [mm] $DL(x)=B=L\;\;\;\;(x \in \IR^n)\,.$ [/mm]
Du kannst also, ohne mit einer Matrix [mm] $B\,$ [/mm] zu hantieren, auch einfach
$$D(F [mm] \circ [/mm] L)(x)=DF(L(x)) [mm] \circ [/mm] L$$
schreiben (beachte, dass für jedes [mm] $x\in \IR^n$ [/mm] dann $D(F [mm] \circ [/mm] L)(x)$ ein (beschränkter) linearer Operator [mm] $\IR^n \to \IR^k$ [/mm] ist; zudem ist [mm] $DF(\underbrace{L(x)}_{\in \IR^m}): \IR^m \to \IR^k$ [/mm] ein (beschränkter) linearer Operator und $L: [mm] \IR^n \to \IR^m$ [/mm] ist ein (beschränkter) linearer Operator, so dass die Verknüpfung $DF(L(x)) [mm] \circ [/mm] L: [mm] \IR^n \to \IR^k$ [/mm] ein (beschränkter) linearer Operator ist!), wobei Du, wenn Du mit entsprechenden Matrizen rechnest, die Verknüpfung [mm] $\circ$ [/mm] der obenstehenden linearen Abbildungen als Matrizenmultiplikation aufzufassen hast (dabei: $DF(L(x))$ kann mit einer $k [mm] \times [/mm] m$-Matrix identifiziert werden und [mm] $DL(x)=L\,$ [/mm] mit einer $m [mm] \times [/mm] n$-Matrix, so dass das Produkt dieser beiden Matrizen gerade eine $k [mm] \times [/mm] n$-Matrix ergibt, welche wiederum einen (beschränkten) linearen Operator [mm] $\IR^n \to \IR^k$ [/mm] repräsentiert).
Gruß,
Marcel
|
|
|
|