Hola
Vayamos por partes:
¿Qué significa "practicamente cero"?
En realidad no puse "practicamente cero", sino "cero practicamente en cualquier...". Sea como sea quizá me falto una coma.
En definitiva quiero decir que

es CERO, CERO PATATERO, con las interpretaciones posibles que a mi se me ocurren de diferencial segunda. Me llama la antención que se discuta si

es o no cero, al mismo tiempo que se discute que significa la diferencial segunda. Si no sabemos que significa, ¿cómo vamos a decir si es cero?.
Ahora bien YO SI DIGO QUE ES CERO, con las dos interpretaciones que indiqué, y que reitero:
I -

es CERO, porque el incremento de segundo orden de la función

es CERO.
II-

es CERO, porque la segunda derivada de la función

es CERO. (aunque me parece más intuitiva, la I).
Quizá tu/vosotros estéis manejando otra interpretación (que no alcanzo a ver) donde no sea 0.
Te recuerdo que la definición de df(x) es una función que depende de h, el incremento de la variable, luego es imposible que tal definición dependa de un límite en el que h tiende a 0. Revisa eso por favor
Como diría cierta persona, la definición de diferencial de una función f de R en R en un punto x es la que puse antes (bueno habrá otras equivalentes), "...aquí y en la china popular y en la otra..."

. La reitero: se trata de una aplicación lineal denotada por df(x) que verifica:

La ventaja además es que esta definición se extrapola directamente a funciones de varias variables. Pero para que se vea que no es un desvarío mío (por si hay duda), doy tres razones:
I- INTUITIVA - La función constante que mejor aproxima f en x es la cte f(x). Si se la restamos el siguiente para aproximar f(x) sería estudiar la función lineal que "mejor aproxima" f(x)-cte. Eso es lo que hacemos con ese límite.
II - EQUIVALENCIA CON OTRA - Es equivalente a la que tu escribes. Tu pones directamente que:

como apliación lineal es la que lleva:

donde h es el "incremento" que queramos. Si sustituyes en la expresión que puse verás que te queda f'(x) igualado a la definición clásica de derivada.
III- BIBLIOGRAFÍA: Algunas referencias donde ver esa definición:
Definición 2.1:
http://www.personal.us.es/jocar/_private/amii/tema2-0506.pdfDefinición 3.1:
http://delta.cs.cinvestav.mx/~gmorales/Biberstein/fvd/node73.htmlSección 1.2:
http://www.satd.uma.es/matap/personal/garvin/04Ca12.pdfDefinición 1.2:
http://www.union-matematica.org.ar/reunion_anual/anteriores/derivacion1.pdfSección 3.4.1:
http://www.ugr.es/~dpto_am/miembros/cabello/anteriores/metodos_matematicos/capIII.pdfMás cosas:
A)
Me choca el desarrollo que plantea Island para ir deduciendo la expresión de la diferencial enésima. No porque esté mal. Si no porque curiosamente, si lo entiendo bien, es más una aproximación formal que intuitiva; más algebraica que analítica.
Parte de:

y a partir de ahí vuelves a aplicar el "operador d" imponiendo que cumpla la regla de la cadena. Esto es justo el tipo de definición algebraica que se maneja de diferencial: como un operador que cumple unas determinadas propiedades que nos permite "hacer cuentas" con él. Desde ese punto de vista me convence lo que haces pero no me parece intuitivo; al menos no como lo es la interpretación de la diferencial primera.
B)
¿Cómo se introduce normalmente la diferencial enésima?.B.1)
Para funciones de una variable.
Vimos que la diferencial primera en un punto x es una aplicación lineal df(x) que cumple, bla, bla,bla.
Una apliación lineal queda determinada por su matriz asociada respecto a la base canónica. En este caso como es de R en R simplemente es un número que coincide con f'(x).
Eso nos permite definir una aplicación (la derivada segunda) de R en R que lleva cada punto x a la matriz asociada a su diferencial en ese punto. Pues bien podemos calcular de nuevo la diferencial de esa aplicación y tenemos la diferencial segunda.
Recursivamente a partir de esta construimos la tercera y así sucesivamente.
En este caso la construcción es totalmente equivalente a ir simplemente calculando las derivadas sucesivas, pero la forma de plantearla nos permite generalizarla fácilmente a varias variables.
B.2)
Para funciones de varias variables. Dada

la diferencial primera es una aplicación lineal Df(x) de

cumpliendo que el límite, bla, bla,bla.
Eso nos permite asignar a cada punto x de

la matriz asociada a Df(x), que será de dimensión

. Es decir definir una aplicación:

Como el espacio de matrices es isomorfo a

, de nuevo podemos calcular la diferencial de esa aplicación, y llegamos a la diferencial segunda.
Recursivamente tenemos la diferencial k-nésima. Está en general vendrá dada por un tensor (que generaliza la idea de matriz asociada a una ap lineal), de dimensión:

cuyos coeficientes puede probarse que vienen dados por las parciales:

Además estas se intrepretan como aplicaciones multilineales de:

Por ejemplo la diferencial segunda sería bilineal. Eso nos permite calcuar la imagen de dos vectores:

que aunque no es inmediato darse cuenta (y es lo que no me gusta de este desarrollo) representa el comportamiento de f cerca del punto x respecto a "incrementos de segundo orden". u y v son esos dos incrementos.
C) C.1)
Otra aproximación a la diferencial k-ésima para una variable es la que expuse en mi anterior correo. De manera resumida sería una aplicación multineal de

verificando que:

Como expliqué (con poco éxito) en mi anterior post, esto generaliza de manera natural la idea de diferencial primera; esta aproxima linealmente los incrementos de primer orden. En general con esta definición la diferencial enésima aproxima mediante una forma k-lineal los incrementos de orden k.
C.2)
Para varias variables quedaría así. La aplicación k-diferencial de una aplicacióm

sería una aplicación mutilineal:

verificando que:

Es decir se generaliza de manera inmediata.
D) Para entender bien la definición anterior es útil ir calculando los incrementos de orden k en 0 para los monomios

. Iremos viendo como incluso sin pasar al límite los incrementos de orden k para

se anulan cuando k>n. Por el polinomio de Taylor (y es a esto a lo que me refería), (casi) cualquier función se descompone como suma de estos monomios. Esto es una forma de ver que las cosas funcionan bien.
Saludos.
P.D. Me ha salido un mensaje largo estilo argentinator

P.D.D. Lo de "...aquí y en la china popular y en la otra..." es una pequeña broma que supongo sólo se entenderá en España.