Chain Rule

    f는 g(a)에서 미분 가능하고 g는 a에서 미분 가능할 때

    \[ (f(g(a)))' = f'(g(a))g'(a) \]


    먼저 일반적인 미분의 정의를 이용해서 접근해볼 수 있다.

    \[ (f(g(a)))' = \lim _{h \rightarrow 0} \frac {f(g(a+h)) - f(g(a)) }{h} = \lim _{h \rightarrow 0 } \frac {g(a+h) - g(a)}{h} \frac { f(g(a+h)) -f(g(a))}{g(a+h) -g(a)} \]

    문제는 g(a+h)를 g(a)+h로 분리해서 볼 수 없다는 것이다. 다루기 어려운 limit을 빼고 생각하기 위해 다른 미분의 정의를 생각해보자.


    f가 a에서 미분가능하다면

    \[ \lim _{h \rightarrow 0} \frac {f(a+h) -f(a)}{h} =A \]인 A가 존재한다.

    \(h \rightarrow 0 \)일 때

    \[ f(a+h) - f(a) = hA \]

    여기서 h에 대한 극한을 제거한 형태로 쓰면 다음과 같다.

    \[ \lim _{h \rightarrow 0} \epsilon (h) = 0, \quad f(a+h) = f(a) +Ah + \epsilon (h) h\]


    이걸 원래의 문제에 적용시켰을 때 f는 g(a)에서 미분가능하고 g는 a에서 미분 가능하므로

    \[ \exists A \in \mathbb{R} \quad \mathrm{such \ that} \quad f(g(a)+h) = f(g(a)) + Ah + \epsilon_1 (h) h \]

    \[ \exists B \in \mathbb{R} \quad \mathrm{such \ that} \quad g(a+k) = g(a) + Bk + \epsilon_2 (k) k \]


    최종적으로 원하는 형태는 \(f(g(a+k))\)이므로 \(h = g(a+k) - g(a) \)를 시도해보면

    \[ f(g(a+k)) = f(g(a)) + A(g(a+k) -g(a) ) + \epsilon_1 ( g(a+k) -g(a)) (g(a+k) -g(a)) \\ = f(g(a)) + A(Bk + \epsilon_2 (k) k ) + \epsilon_1 (Bk + \epsilon_2 (k) k ) (Bk + \epsilon_2 (k) k ) \\ = f(g(a)) + ABk + k(A \epsilon _2 (k) + (B+ \epsilon_2 (k))\epsilon_1 (Bk + \epsilon_2 (k) k )) \]

    \[AB = f'(g(a)) g'(a) , \quad \lim _{k \rightarrow 0 } A \epsilon _2 (k) + (B + \epsilon_2 (k) )\epsilon_1 (Bk + \epsilon_2 (k)k) = 0 \]

    이므로 chain rule은 증명되었다.


    Posted by Lamplighter