{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "On cherche à fabriquer un toboggan partant du point $A=(x_A,y_A)$ et arrivant\n", "au point $B=(x_B,y_B)$ de telle sorte que le temps mis par une bille qui part\n", "sans vitesse du point $A$ arrive le plus vite possible au point $B$. On suppose\n", "que cette bille n'est soumise qu'à la gravitation et à la réaction\n", "du toboggan, sans frottement. Si la forme du toboggan est donnée par la courbe d'équation $y=f(x)$,\n", "le temps mis par la boule pour aller de $A$ vers $B$ est\n", "\n", "$$\n", "T(f)\\,=\\, \\int_{x_A}^{x_B} \\sqrt{\\frac{1+(f'(x))^2}{2\\,g\\,(y_A-f(x))}} \\,dx\n", "$$\n", "\n", "o\\`u $g=9,8 m\\,s^{-2}$ est l'accélération de la pesanteur. Dans la suite on suppose $x_A=0$ et $B=(1,0)$, \n", "on cherche donc une solution du problème\n", "\n", "$$\n", "(P) \\quad \\quad \\inf\\left\\{ T(f):\\,\\,\\, f: [0,1] \\to \\mathbb{R}, \\,f(0)=y_A, \\,f(1)=0 \\right\\}.\n", "$$\n", "\n", "Afin de résoudre ce problème de manière approchée, on le discrétise par\n", "la méthode des éléments finis.\n", "Pour $N \\geq 1$ fixé, on considère l'ensemble $\\mathcal{A}_N$ des fonctions\n", "affines par morceaux $f: [0,1] \\to \\mathbb{R}$ telles que $f(0)=y_A$, $f(1)=0$ et\n", "\n", "$$\n", "\\forall n \\in \\{0,\\ldots,N\\}, \\quad \\quad\n", "\\mbox{$f$ affine sur }\\left[\\frac{n}{N+1},\\frac{n+1}{N+1}\\right].\n", "$$\n", "\n", "Toute fonction $f \\in \\mathcal{A}_N$ est alors caractérisée par le vecteur $y \\in \\mathbb{R}^{N+2}$\n", "donné par\n", "\n", "$$\n", "\\forall n \\in \\{0,\\ldots,N+1\\}, \\quad \\quad y_n = f\\left(\\frac{n}{N+1}\\right).\n", "$$\n", "\n", "L'ensemble des vecteurs ainsi obtenus est alors\n", "\n", "$$\n", "\\mathcal{B}_N = \\{ y \\in \\mathbb{R}^{N+2}\\,:\\, y_0 = y_A, \\, y_{N+1} = 0\\}. \n", "$$\n", "\n", "On doit alors résoudre le problème :\n", "\n", "$$\n", "(P_N) \\quad \\quad \\inf\\{ J(y) \\,:\\, y \\in \\mathcal{B}_N \\}\n", "$$\n", "\n", "où $J(y) = T(f)$ pour la fonction affine $f \\in \\mathcal{A}_N$ associée au vecteur $y$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Pour commencer, on va donc déclarer les variables du problème discrétisé sous Octave, et afficher les valeurs pour l'utilisateur. On définit donc $N$, $y_A$ et $y_B$ :" ] }, { "cell_type": "code", "execution_count": 47, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "nombre de points de discretisation : N = 9 \n", "valeurs de y_A et y_B : y_A = 0.200000 , y_B = 0.000000\n", "\n" ] } ], "source": [ "N=9;\n", "printf(\"nombre de points de discretisation : N = %d \\n\",N);\n", "yA=0.2;\n", "yB=0;\n", "printf(\"valeurs de y_A et y_B : y_A = %f , y_B = %f\\n\\n\",yA, yB);" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On aura aussi besoin d'un vecteur initial pour la méthode de la plus grande pente, on prend l'interpolation affine entre les valeurs $y_A$ et $y_B$ sur les $N+2$ points $\\frac{i}{N+1}$ pour $i \\in \\{0,\\ldots,N+1\\}$. Ainsi le vecteur $y$ est de taille $N+2$, avec $y_1 =y_A$ et $y_{N+2}=y_B$ fixés, et les autres points sont obtenus par interpolation : " ] }, { "cell_type": "code", "execution_count": 48, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "y =\n", "\n", " 0.20000\n", " 0.18000\n", " 0.16000\n", " 0.14000\n", " 0.12000\n", " 0.10000\n", " 0.08000\n", " 0.06000\n", " 0.04000\n", " 0.02000\n", " 0.00000\n", "\n" ] } ], "source": [ "y=zeros(N+2,1);\n", "i=1;\n", "while (i <= N+2)\n", " y(i) = ((N+2-i)*yA+(i-1)*yB)/(N+1);\n", " i=i+1;\n", "endwhile\n", "y" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Désormais on définit les paramètres $\\rho$ (le pas) et $\\varepsilon$ (la précision) pour la méthode de la plus grande pente :" ] }, { "cell_type": "code", "execution_count": 49, "metadata": {}, "outputs": [], "source": [ "rho=10^(-2);\n", "epsilon=10^(-2);\n", "eps = epsilon^2;\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On va maintenant déclarer une fonction funcJ pour calculer le temps $T_N(y)$ associé au toboggan correspondant à la fonction affine dont les valeurs aux points de discrétisation sont contenues dans $y$. Pour cela, on s'appuie sur la formule\n", "\n", "$$\n", "J(y) \\,\\, = \\,\\, T(f)\\,\\,=\\,\\, \\sum_{n=0}^N \\int_{\\frac{n}{N+1}}^{\\frac{n+1}{N+1}}\n", "\\sqrt{\\frac{1+(f'(x))^2}{y_A-f(x)}} \\,dx,\n", "$$\n", "\n", "où on oublie volontairement la constante $2g$.\n", "Chaque terme de cette somme\n", "ne dépend que de $y_n$ et $y_{n+1}$ et peut être calculé par la formule :\n", "\n", "\\begin{align*}\n", "\\int_{\\frac{n}{N+1}}^{\\frac{n+1}{N+1}} \\sqrt{\\frac{1+(f'(x))^2}{(y_A-f(x))}} \\,dx\n", "&= \\frac{2\\,\\sqrt{1+((N+1)\\,(y_{n+1}-y_n))^2}}{(N+1)\\,(y_{n+1}-y_n)}\\left(\\sqrt{y_A-y_n} - \\sqrt{y_A-y_{N+1}} \\right)\\\\\n", "&= \\frac{2\\,\\sqrt{1+((N+1)\\,(y_{n+1}-y_n))^2}}{(N+1)\\,(\\sqrt{y_A-y_n} + \\sqrt{y_A-y_{N+1}})}\\,.\n", "\\end{align*}\n", "\n", "Notons que cette dernière formule est bien définie même dans le cas $y_n = y_{n+1}$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On obtient donc la fonction suivante en sommant ces $N$ termes :" ] }, { "cell_type": "code", "execution_count": 50, "metadata": {}, "outputs": [], "source": [ "function r=funcJ(x)\n", " r=0.;\n", " n=length(x);\n", " yA=x(1);\n", " i=1;\n", " while (i <= n-1)\n", " a = x(i);\n", " b = x(i+1);\n", " r = r + 2*sqrt(1+((b-a)*(n-1))**2)/((n-1)*(sqrt(yA-a) + sqrt(yA-b)));\n", " i = i+1;\n", " endwhile\n", "endfunction\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On utilise ensuite une fonction gradJ pour la différenciation de $J$, dans laquelle on fait attention à ce que les dérivées partielles pour la première et la dernière coordonnée soient nulles : il ne faut pas faire varier les valeurs $y_A$ et $y_B$ dans le vecteur y !\n", "\n", "Les dérivées partielles sont calculées grâce à la formule de différence finie :\n", "\n", "$$\n", "\\frac{\\partial J}{\\partial x_i} \\,=\\, \\frac{J(x+h \\, e_i) - J(x-h \\,e_i)}{2\\,}\n", "$$\n", "\n", "où $e_i$ est le $i$-ème vecteur de la base canonique de $\\mathbb{R}^{N+2}$.\n" ] }, { "cell_type": "code", "execution_count": 51, "metadata": {}, "outputs": [], "source": [ "function z=gradJ(x)\n", " h=10^(-8);\n", " n=length(x); \n", " i=2;\n", " z=zeros(n,1);\n", " while (i <= (n-1))\n", " vecbase = zeros(n,1);\n", " vecbase(i)=1;\n", " z(i)=(funcJ(x+h*vecbase)-funcJ(x-h*vecbase))/(2*h);\n", " i=i+1;\n", " endwhile\n", "endfunction\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Enfin on applique la méthode de la plus grande pente et on affiche les résultats : le vecteur $y$ et le nombre d'itérations $k$ :" ] }, { "cell_type": "code", "execution_count": 52, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "solution calculéee :\n", "y =\n", "\n", " 0.20000\n", " 0.00008\n", " -0.07206\n", " -0.11881\n", " -0.14759\n", " -0.16143\n", " -0.16148\n", " -0.14774\n", " -0.11901\n", " -0.07227\n", " 0.00000\n", "\n", "nombre d'iteration k = 211\n" ] } ], "source": [ "k=0; #compteur\n", "while (gradJ(y)'*gradJ(y) > eps)\n", " y=y-rho*gradJ(y);\n", " k=k+1;\n", " #printf(\"test k=%d : %f\\n\", k,sqrt(gradJ(y)'*gradJ(y))) #Afficher pour chaque iteration la valeur du test\n", " endwhile\n", "printf(\"solution calculéee :\\n\");\n", "y\n", "printf(\"nombre d'iteration k = %d\\n\", k);" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Et pour finir, on trace le toboggan obtenu. Pour cela, il faut définir le vecteur $x$ des abscisses, puis tracer." ] }, { "cell_type": "code", "execution_count": 53, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "x=zeros(N+2,1);\n", "i=1;\n", "while (i <= N+2)\n", " x(i) = (i-1)/(N+1);\n", " i=i+1;\n", "endwhile\n", "\n", "plot(x,y);" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On pourra tester les expériences suivantes :\n", "\n", "- faire varier $N$ dans $\\{1,5,10,20\\}$, \n", "\n", "- faire varier $\\rho$ dans $\\{10^{-1}, 5 \\times 10^{-2}, 10^{-2}, 5 \\times 10^{-3}, 10^{-3} \\}$\n", "\n", "- faire varier $\\varepsilon$ dans $\\{ 10^{-2}, 10^{-4}, 10^{-6}\\}$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Pour pouvoir prendre des valeurs plus grandes de $N$, il faut faire appel à la recherche linéaire de Wolfe afin de\n", "calculer un meilleur pas que le pas constant à chaque iteration de la boucle principale.\n", "\n", "Rappelons que cette méthode fait appel à deux fonctions : une fonction principale Wolfe_search qui cherche un\n", "intervalle $[t_g, t_d]$ dans lequel il existe au moins un pas qui satisfait les conditions de Wolfe, et une fonction\n", "Zoom_search qui cherche un pas $\\rho$ dans dans cet intervalle.\n", " " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Rappelons que dans la méthode de Wolfe, il s'agit de trouver un pas $\\rho$ tel que\n", "\n", "$$\n", "q(\\rho) \\leq q(0) + c_2 \\,q'(0)\\,\\rho \\quad \\quad \\text{et} |q'(\\rho)| \\leq - c_1 \\,q'(0) \n", "$$\n", "\n", "où $0 < c_1 < c_2 < 1$ sont des paramètres fixés, et $q$ est la fonction définie sur $\\mathbb{R}_+$ par\n", "\n", "$$\n", "q(t) \\, = \\, J( y - t\\, \\nabla J (y)).\n", "$$\n", "\n", "On rappelle que dans ce cas $q'(t) = - \\nabla J( y - t\\, \\nabla J (y)) \\cdot \\nabla J (y)$, et en particulier\n", "$q'(0) = - \\lVert \\nabla J (y) \\rVert^2$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Dans les fonctions suivantes, on doit passer les paramètres suivants :\n", "- le pas $\\rho$ utilisé à l'itération précédente;\n", "- le vecteur $y$ de l'itération précédente;\n", "- $g = \\nabla J (y)$ ;\n", "- $qp_0 = q'(0) = - \\lVert \\nabla J (y) \\rVert^2$ ;\n", "- les paramètres $c_1$ et $c_2$, ainsi que le nombre maximal d'itérations dans la recherche de Wolfe." ] }, { "cell_type": "code", "execution_count": 54, "metadata": {}, "outputs": [], "source": [ "function t=Wolfe_search(rho,y,g,qp_0,c1,c2,nmax)\n", " q_0=funcJ(y);\n", " c1qp=c1*qp_0;\n", " c2qp=c2*qp_0;\n", " test=0;\n", " tg=0.;\n", " td=2*rho;\n", " t=rho;\n", " while (test==0)\n", " qt=funcJ(y-t*g);\n", " if (qt>(q_0+c2qp*t))\n", " test =1;\n", " t = Zoom_search(tg,t,y,g,q_0,c1qp,c2qp,nmax);\n", " else\n", " qp=-gradJ(y-t*g)'*g;\n", " if (abs(qp) <= -c1qp)\n", " test=2;\n", " elseif (qp >=0)\n", " test=3;\n", " t = Zoom_search(tg,t,y,g,q_0,c1qp,c2qp,nmax);\n", " else\n", " tg=t;\n", " td=10*td;\n", " t=0.5*(tg+td);\n", " endif\n", " endif\n", " endwhile\n", "endfunction\n", "\n", "function t=Zoom_search(tg,td,y,g,q_0,c1qp,c2qp,nmax)\n", " n=0;\n", " testZ=0;\n", " while and(testZ==0,n(q_0+c2qp*t))\n", " td=t;\n", " else \n", " qp=-gradJ(y-t*g)'*g;\n", " if (abs(qp) <= -c1qp)\n", " testZ=1;\n", " elseif (qp >=0)\n", " td=t;\n", " else\n", " tg=t; \n", " endif\n", " endif\n", " n=n+1;\n", " endwhile\n", "endfunction" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "A vous d'intégrer cette méthode dans une méthode de plus grande pente !" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Octave", "language": "octave", "name": "octave" }, "language_info": { "file_extension": ".m", "help_links": [ { "text": "GNU Octave", "url": "https://www.gnu.org/software/octave/support.html" }, { "text": "Octave Kernel", "url": "https://github.com/Calysto/octave_kernel" }, { "text": "MetaKernel Magics", "url": "https://github.com/calysto/metakernel/blob/master/metakernel/magics/README.md" } ], "mimetype": "text/x-octave", "name": "octave", "version": "4.0.0" } }, "nbformat": 4, "nbformat_minor": 2 }