Rapport d'activité au CNRS 2003--2004]
(de janvier 2003 à septembre 2004)
CNRS, Université de Provence, LATP, UMR 6632, CMI, 39 rue Joliot-Curie,
13453 Marseille Cedex 13, France
merker@cmi.univ-mrs.fr 00 33 / (0)4 91 11 36 72 / (0)4 91 53 99 05
http://www.cmi.univ-mrs.fr/~merker/Rapports/CNRS/
curriculum-cnrs-2003.pdf
Des renseignements complémentaires sont disponibles sur la page principale /~merker/index.html, qui est régulièrement remise à jour.
1988 : Baccalauréat série C à Besançon.
1990 : Entrée à l'École Normale Supérieure
de Paris, en candidat libre, après deux Deugs (mathématiques
et philosophie) suivis en parallèle à Besançon.
1992 : Agrégation de mathématiques.
1994 : Service militaire en tant que scientifique du contingent
à Autun (Saône-et-Loire) ; agrégation de Philosophie
(après une Licence et une Maîtrise à la Sorbonne en
1991 et en 1992).
1995 : Caïman << mathématiques et philosophie
>> à l'ENS Ulm sur un poste d'ATER, durant deux années.
1996 : Doctorat de l'université de Paris 6 en Mathématiques,
sous la direction de Jean-Marie Trépreau, professeur.
1997 : Entrée comme CR2 au CNRS et affectation au LATP,
CMI, Université de Provence.
2001 : Accession au grade de CR1 au CNRS.
2004 : Participation à l'Ultra-Trail
du Tour du Mont-Blanc : 155km, 8500m de dénivellation positive
(et négative) ; tour complet bouclé en 30h35mn de course
non-stop.
· Organisateur,
responsable financier et webmestre du Séminaire
d'Analyse et Géométrie, l'un des trois séminaires
de la nouvelle équipe de Mathématiques
Fondamentales au LATP.
http://www.cmi.univ-mrs.fr/~merker/
AG/SE/2004/anageom.html
· Directeur adjoint,
secrétaire (rédaction scientifique) et webmestre du GDR 2252
<< Analyse et géométrie complexe en plusieurs variables
>>, dirigé par Pascal Thomas.
http://www.cmi.univ-mrs.fr/~merker/
AC/Rapports/GDR/gdr.html.
· Co-responsable
du séminaire << Gilles Châtelet >>, IUFM, Besançon.
http://www.cmi.univ-mrs.fr/~merker/
Philosophie/SE/2005/seminaire-chatelet-2005.html
· Webmestre1
de la page internet du Master Recherche deuxième
année en Mathématiques Fondamentales de l'Université
de Provence :
http://www.cmi.univ-mrs.fr/~merker/dea/index.html
· Depuis 1999 : membre titulaire de la commission de spécialistes (Section 25 du CNU) de l'Université de Provence. Vice Président (Collège B) entre juin 2001 et juin 2004.
Cela fait précisément sept annnées que je suis au LATP à Marseille, le laboratoire d'affectation que j'avais demandé lors de mon recrutement au CNRS le 1er octobre 1997. Je suis très satisfait de cette structure, des échanges intellectuels et des collaborations scientifiques que j'ai pu y engager.
Toutefois, il me semble maintenant que j'ai quelque peu épuisé les possibilité de collaboration au LATP à Marseille. De plus, je ressens un besoin << instinctif >> de changer d'université, pour rompre les habitudes et me libérer des << routines >> de laboratoire, qui prennent trop le pas sur l'ouverture et sur la nouveauté. Enfin, bien que je m'implique le moins possible dans la politique locale de l'UFR MIM et du LATP afin de préserver ma liberté d'esprit et un maximum de temps pour la recherche et pour la rédaction d'articles, il ne me semble pas souhaitable de coexister encore de nombreuses années avec certains professeurs influents pour qui l'activité de recherche n'occupe pas le premier plan.
Par ailleurs, je souhaite toujours ardemment poursuivre mes activités en philosophie des mathématiques. Lorsque j'étais à Paris, je pouvais participer à plusieurs séminaires, échanger fréquemment, être présent à divers colloques. Depuis mon arrivée à Marseille, cette activité a légèrement baissé. L'éloignement géographique du centre parisien, et le trop petit nombre de personnes intéressées par la philosophie des mathématiques au LATP m'ont conduit à me concentrer sur la recherche en mathématiques fondamentales. J'ai consacré presque tout mon temps à élaborer quelques travaux spécialisés d'importance, tels que [10], [11], [14], [15], [18], [19], [21], [26], [27], [A], [B], [C] et [F] ci-dessous
Cependant, en acceptant de me rendre environ cinq fois par an à Paris à mes propres frais, j'ai pu conserver des contacts. En effet, durant ces trois dernières années, j'ai participé régulièrement à un << Séminaire-Groupe de travail >> organisé à l'ENS Ulm par Ivahn Smadja, ex-caïman de philosophie nouvellement nommé Maître de Conférences à l'Université de Caen, et Jean-Jacques Szczeciniarz, ex-professeur de philosophie à l'Université de Bordeaux 1 nouvellement muté à Paris 7. Cette année, j'ai pu échanger avec des astronomes (Marc Lachièze-Rey, DR CNRS, par exemple), ainsi qu'avec des historiens des sciences (Michel Paty, DR CNRS, par exemple) lors d'une rencontre à Cargèse en février 2004 et lors d'un colloque à l'Observatoire de Paris en mai 2004. Ces échanges me paraissent très fructueux et sont appelés à se développer. Afin de susciter l'intérêt de ces physiciens, en collaboration avec deux étudiants de Maîtrise, j'ai entrepris de lire le mémoire d'Élie Cartan paru 1922 dans lequel il démontre que le tenseur géométrique qu'Einstein avait introduit en 1917 dans ses équations de la gravitation est essentiellement unique (référence [A] ci-dessous). Après enquête, il semblerait que les relativistes français ne connaissent pas le contenu de ce mémoire difficile, que Hermann Weyl lui-même n'aurait jamais déchiffré ; il faut mentionner qu'Élie Cartan sous-entend trop d'éléments théoriques qu'il a lui-même élaborés pendant toute sa carrière. Dans l'avenir, je souhaite approfondir d'autres thèmes de l'oeuvre d'Élie Cartan qui ont des applications en physique théorique.
En définitive, je souhaiterais revenir à Paris pour une période transitoire de une à quatre années, sachant que je pourrais fort bien choisir d'opter pour l'enseignement supérieur en province après cette période ; pour des raisons personnelles, je préfère en effet vivre en province et je n'envisage pas pour le moment que la suite de ma carrière se déroule uniquement à Paris.
Voici cinq arguments principaux pour justifier cette demande de mutation.
· Lecture et
méditation des mémoires de Cartan sur les équations
de la gravitation d'Einstein et sur les connexions affines, conformes et
projectives.
· Histoire et
philosophie de la géométrie différentielle ; impact
des travaux de Sophus Lie et d'Élie Cartan.
· Classification
des algèbres de Lie réelles et complexes.
· Approche structurale
des systèmes d'équations aux dérivées partielles.
· Application
des méthodes algorithmiques d'algèbre différentielle
à l'étude des systèmes d'équations aux dérivées
partielles.
· Classification
des actions de groupes de Lie locaux agissant localement sur un ouvert
de C3.
· Recherche de
procédés de calcul pour mieux maîtriser l'explosion
des calculs dans la << méthode d'équivalence >> d'Élie
Cartan.
· Éclatements
locaux en géométrie analytique et application à l'étude
de la géométrie des variétés CR analytiques
réelles.
· Problème variationnel inverse.
Avec Egmont Porten : (Humboldt Universität zu Berlin)
· Élimination
des singularités de codimension 1 en dimension CR égale à
1.
· Minimalisation
des systèmes de champs de vecteurs.
Avec Stéphane Rigat : (Université de Provence)
· Étude
des techniques de désingularisation et application à la structure
des courants résiduels.
· Conférence
internationale Reelle Methoden der Komplexen Analysis,
organisée par Klas Diederich, Takeo Ohsawa et Edgar Lee Stout à
Oberwolfach (Allemagne) du 23 février au 1er
mars 2003. Intitulé de l'exposé (1h) : Symmetries of partial
differential equations and CR geometry.
· Colloque Philosophie
et mathématique, organisé par Alain Badiou, Ivahn
Smadja et Quentin Meillassoux à l'École Normale Supérieure
(rue d'Ulm) le 25 mai 2003. Intitulé de l'exposé (1h) : Métaphysique
de l'ouverture mathématique.
· Conférence
internationale Workshop Komplexen Analysis,
organisée par Judith Brinkschulte à Leipzig (Allemagne) du
2 au 5 juillet 2003. Intitulé de la série de deux exposés
d'une heure chacun : Equivalences of second order completely integrable
systems of partial differential equations.
· Conférence
internationale Cauchy-Riemann analysis and geometry,
organisée par I. Lieb et G. Schmalz au Max-Planck Institut de Bonn,
du 22 au 26 septembre 2003. Intitulé de l'exposé (1h) : Explicit
Chern-Moser tensors.
· Rencontres
internationales Autumn School in Complex Analysis,
organisée par Hervé Gaussier et Kang-Tae Kim au CIRM les
deux premières semaines d'octobre 2003. Intitulé de l'exposé
: An explicit differential characterization of the Newtonian free particle
system.
· Rencontres
nationales Mathématique, Physique, Philosophie,
organisées par Marc Lachièze-Rey au Centre International
de Physique Théorique à Cargèse (Corse) du 16 au 20
février 2004. Intitulé de l'exposé (1h) : Équivalences
locales entre variétés pseudo-riemanniennes et applications
à la relativité générale.
· Rencontres nationales Journées Complexes du GDR 2252, organisées par Karim Kellay et Stéphane Rigat au CIRM du 4 au 6 juin 2004. Intitulé de l'exposé (1h) : Sur les équations de la gravitation d'Einstein, d'après Élie Cartan.
·Séminaire
d'Analyse, organisé par P. Dolbeault, G. Henkin, H. Skoda
et J.-M. Trépreau à l'Université de Paris 6. Intitulé
de l'exposé donné le 14 janvier 2003 : Sur la géométrie
locale des systèmes différentiels analytiques complètement
intégrables ; application à la géométrie CR.
·Séminaire
d'Analyse Complexe, organisé par A. Zeriahi à l'Université
Paul Sabatier de Toulouse. Intitulé de l'exposé donné
le 22 mai 2003 : Variété des solutions d'un système
rigide d'équations aux dérivées partielles.
·Séminaire
de Géométrie Complexe, organisé par S. Ivashkovich
à l'Université de Lille 1. Intitulé de l'exposé
donné le 5 juin 2003 : Singularités éliminables
de codimension 1 en dimension CR égale à 1 et en codimension
supérieure ou égale à 2.
·Séminaire
de Philosophie des mathématiques, organisé par Tatiana
Roque et Sara Franceschelli au Collège International de Philosophie
(Paris). Intitulé de l'exposé donné le 28 novembre
2003 (2h) : Connexions affines, connexions conformes et connexions projectives,
d'après Élie Cartan.
·Séminaire d'Analyse, organisé par P. Dolbeault, G. Henkin, H. Skoda et J.-M. Trépreau à l'Université de Paris 6. Intitulé de l'exposé donné le 27 janvier 2004 : Caractérisation géométrique des sous-ensembles analytiques réels ne contenant pas de courbes holomorphes.
· Organisation à Besançon d'un Séminaire--Groupe de travail intitulé Gilles Châtelet, en collaboration avec Philippe Roy, formateur en mathématiques, physique et philosophie à Gray, et Maryvonne Menez-Hallez, Maître de Conférence en mathématiques à Paris 7.
· Rencontres
nationales Journées Complexes du GDR2252,
organisées par Chantal Menini et Andreas Hartmann à Carcassonne
du 27 au 29 novembre 2003.
· Colloque national Sciences de la nature, organisé par Joseph Kouneiher à l'Observatoire de Paris, fin mai 2004.
·Cours
et TD d'histoire et d'épistémologie des mathématiques
(second semestre 2004, pour un total de 50h) ; rédaction par les
étudiants de 18 mémoires de 30 à 80 pages, sur des
sujets distincts.
·Cours
de DEA de Tronc commun et de spécialité (premier semestre
2004--2005, pour un total de 37h), en coopération avec El Hassan
Youssfi : théorie de Cartan et problème variationnel inverse.
·Cours d'histoire et d'épistémologie des mathématiques (second semestre 2005, pour un total de 25h).
· Travaux
d'encadrement et de recherche (TER), Maîtrise de mathématiques
pures, Université de Provence, printemps 2004, pour un total de
24h.
· Stage
de première année de l'ENS Lyon, six semaines en Juin-juillet
2004. Nicolas Bovetto : Classification des algèbres de Lie complexes
semi-simples, d'après Wilhelm Killing et Élie Cartan.
L'idée d'inviter chaque chercheur à établir lui-même
le classement de ses travaux selon leur ordre d'importance m'agrée
pleinement. En effet, par manque de connaissance précise des innombrables
domaines de recherche scientifique, les rapporteurs sont trop souvent contraints
--- malgré leur volonté --- de n'évaluer
un dossier scientifique qu'en fonction de la renommée des revues
spécialisées qui sont référencées dans
une liste de publications. Une telle méthode a du sens, eu égard
à la complexité croissante des dossiers scientifiques, mais
elle a ses limites, étant donné qu'une proportion non négligeable
d'articles de jeunes chercheurs parus dans des revues prestigieuses ou
très établies l'ont été grâce à
la tutelle bienveillante de leaders de la communauté scientifique
à laquelle ils appartiennent. Les chercheurs très indépendants
qui, eux, ne bénéficient pas du soutien de puissants aînés,
publient leurs travaux dans des revues correctes, mais moins prestigieuses,
et ils apprennent à attendre patiemment --- une et même
deux décennies parfois --- le moment où
quelques-uns de leurs travaux seront publiés dans des journaux très
prisés sur la scène internationale.
Les trois thèmes de recherche principaux en mathématiques
auxquels j'ai contribué dans mes textes écrits sont les suivants
:
Ces trois thèmes étant par nature relativement étrangers
les uns aux autres, il est impossible d'établir une hiérarchie
commune. Je propose donc de classer les articles en trois << grades
>> pour chacun des trois thèmes, ce qui donne neuf groupes. Pour
déterminer le groupe auquel chaque article appartient, mon évaluation
s'effectue prioritairement en fonction de la difficulté du problème
principal qu'il résout ; je place un article au premier grade si
le problème principal est difficile et s'il est résolu complètement
; si la résolution complète du problème principal
ne présente pas de réelle difficulté et si le travail
présente un degré d'achèvement formel satisfaisant,
je place l'article en question au deuxième grade ; si le problème
principal n'est pas résolu, je le place au troisième et dernier
grade ; enfin, dans chaque groupe, je classe les articles dans l'ordre
de préférence personnelle en les accompagnant d'un bref commentaire
appréciatif.
Pour préserver la confidentialité des recherches en
cours (à cause de pillages systématiques), arrêt de
ces messages d'annonce à partir de janvier 2001 jusqu'au printemps
2004. Après une période de silence électronique qui
s'est accompagnée d'un essoufflement de la production de certains
concurrents, reprise des envois sur le site arXiv.org.
http://www.cmi.univ-mrs.fr/~merker/
AC/Rapports/GDR/gdr.html
· Rédaction
et mise à jour du rappport de l'Équipe d'Analyse
et Géométrie Complexe (absorbée dans l'Équipe
de Mathématiques Fondamentales depuis janvier 2004) pour
la demande de renouvellement du Contrat Quadriennal (UMR 6632) du Laboratoire
d'Analyse, Topologie et Probabilités, en juin 2002 et en novembre
2003.
http://www.cmi.univ-mrs.fr/~merker/
AC/Rapports/Quadriennal/2002/quadriennal-2002.html
· Rédaction d'un projet d'ACI Nouvelles Interfaces des mathématiques, soumis au ministère en mai 2003. Le projet n'a pas été retenu parmi les 20 sur 150 qui ont été sélectionnés.
·Chamonix-Courmayeur,
28 août 2003, 70 km, 4100 m de dénivellation positive, 24ième
sur 240.
·La Grande Course des Templiers, 24 octobre 2003, 65km, 2900m de dénivellation positive, Nant (12), 65ième sur 1800.
·La
course pédestre la plus longue et la plus difficile d'Europe : Ultra-Trail
Tour du Mont-Blanc, du 27 au 29 août 2004, 155km, 8500m
de dénivellation positive, 3 pays traversés ; 51ième
sur 1570 en 30h35mn ; 420 arrivants sur la course complète.
11. Objectifs universitaires et pédagogiques
pour les quatre prochaines années 11.
12. Objectifs en recherche mathématique pour les quatre prochaines années 12.
13. Présentation des travaux en mathématiques fondamentales 13.
Lorsque les questions que je me suis fixées en commençant un brouillon amélioré sont complètement résolues, je fais relier le manuscrit, afin de conserver une trace complète de tous les raisonnements et de tous les calculs intermédiaires qui ne seront pas tapés en Latex ; en effet, conserver cette trace m'évitera d'avoir à refaire les calculs que j'aurai à re-vérifier pour la publication finale. Pendant la recherche sur brouillon amélioré, ou bien à la fin de la recherche, je commence aussi à taper un texte en Latex. Ce texte sera volontairement abandonné dans un état d'inachèvement --- en quelque sorte en jachère --- et je travaille sur un autre sujet. C'est le cas pour [A], [B], [C] et [F]. Les fichiers Latex de [D], [E] et [G] ne sont pas encore vraiment commencés.
Je rappelle mon appréciation personnelle du §7.6 :
Pour simplifier, je propose d'exposer de manière détaillée
(et si possible accessible) les résultats principaux des cinq travaux
[21], [27], [C], [G], [22] et [A], avant de résumer très
rapidement le contenu essentiel de [F], [E], [B], [D]. Pour que ces descriptions
soient bien saisies, je m'inspire librement des introductions de ces textes,
lorsqu'elles ont un caractère achevé, comme c'est le cas
pour [21], [27], [C], [22] et [A]. Enfin, pour que ce rapport d'activité
qui m'aura coûté une dizaine de jours de rédaction
(corrections comprises) n'empiète pas au-delà sur mon temps
de recherche, je m'autorise à décrire les travaux [27], [C],
[G] et [22] en langue anglaise. Les descriptions des travaux [21], [27],
[C], [G], [22], [A] et [E] seront toutes suivies d'une bibliographie spécialisée.
Dans cet article [21] qui m'a été commandé par un éditeur des Annales de la Faculté des Sciences de Toulouse, je démontre un théorème de convergence fin et plus général, valable sans aucune hypothèse de non-dégénérescence, et qui confirme la rigidité de la catégorie CR. Ce résultat s'interprète alors comme un principe de symétrie de Schwarz formel pour les applications CR. J'en déduis que toute équivalence CR formelle entre deux sous-variétés de Cn génériques, analytiques réelles et minimales est convergente si et seulement si les deux sous-variétés sont holomorphiquement non-dégénérées (au sens de N. Stanton). Enfin, j'établis que deux sous-variétés de Cn génériques, analytiques réelles et minimales sont formellement CR équivalentes si et seulement si elles sont biholomorphiquement équivalentes.
Conjecturalement, on s'attend à ce que presque tous les principes de réflexion connus soient valides dans le cas où M et M' sont toutes deux analytiques réelles. Malheureusement, la finitude intrinsèque au concept d'algébricité, qui est fortement utilisée dans ces travaux, fait défaut dans le cas général où M' est analytique réelle. On peut alors se demander si une sous-variété analytique réelle peut être rendue algébrique dans un système de coordonnées locales adéquat.
Un tel phénomène général de <<non-algébrisabilité>> locale générique (au sens de R. Baire) laisse entrevoir que les résultats précités, qui utilisent fortement l'algébricité, sont d'une portée restreinte. C'est pourquoi je préfère raisonner avec des outils purement analytiques, par exemple les espaces de jets ou ce que j'appellerai l'application de réflexion associée à h.
Pour énoncer le résultat principal de [21], je commencerai par définir les applications CR formelles inversibles, je définirai le concept de minimalité, puis j'introduirai cinq notions de non-dégénérescence en les exprimant en fonction des jets de sous-variétés de Segre, et enfin, je définirai l'application de réflexion CR formelle.
Dans les coordonnées holomorphes t: = (t1, ..., tn) canoniques de Cn, la sous-variété M, entendue comme sous-ensemble de Cn, peut être représentée comme l'ensemble des tÎ Cn où s'annulent exactement d séries entières analytiques rj (t, t)ÎC { t, t}, pour j=1, ..., d ; de telles séries entières doivent satisfaire aux conditions de réalité rj (t, t) º rj ( t, t) pour j=1, ..., d, s'annuler pour t=0 et posséder des différentielles réelles dr1, ..., drd qui sont indépendantes à l'origine. La généricité de M équivaut alors au fait que les différentielles complexes ¶ r1, ..., ¶ rd sont elles aussi, de surcroît, indépendantes à l'origine.
De même, soient r1' (t' , t') = 0, ..., rd'' (t', t') = 0 des équations cartésiennes définissant une autre sous-variété locale de C n', analytique réelle, générique, passant par l'origine, qui est de codimension d' ³ 1 et de dimension CR égale à m':= n'- d'³ 1, toutes deux strictement positives.
Soit h(t) := (h1 (t), ..., hn (t)) une collection de séries formelles hi (t) Î C [[ t ]], i=1, ..., n, dont les termes constants s'annulent. Par définition, h induit une application CR formelle entre M et M' s'il existe une matrice de taille d' × d de séries formelles b(t , t) telle que l'on a l'identité formelle vectorielle r'( h(t) , h ( t )) º b (t, t) r(t , t), interprétée dans le produit C [[ t, t]]d := C[[ t, t ]] × ··· × C[[ t, t ]] contenant exactement d facteurs. On notera h: (M, 0) ¾® F (M', 0) une telle application, avec en indice la lettre F, initiale du mot <<formel>>, car une telle application n'a rien d'une application ponctuelle.
On vérifie (voir le §3.2 pour des explications) que dans tout système de coordonnées holomorphes locales (z , w) ÎCm × C d telles que T0 M + ( { 0} × C d ) = T0 C n , la sous-variété complexifiée M peut être représentée par d équations analytiques complexes graphées de la forme x j = Q j( z, t), pour j=1, ..., d, où t = ( z, x ) Î Cm × C d. Dans ce système de coordonnées, la collection de séries entières Q j Î C { z, t} est alors unique.
Commençons par présenter en résumé le concept de minimalité. On renvoie à la Section 3 pour une exposition de sa signification géométrique. Soit p un point M de coordonnées (zp, wp, zp, xp) Î Cm × Cd × Cm × Cd. Soit z1 Î Cm et soit z1 ÎCm. On définit les deux applications
| ì
í î |
Lz1(zp, wp, zp, xp) := | æ
è |
zp+z1, |
|
(zp+z1, zp, xp), zp, xp | ö
ø |
et |
|
z1(zp, wp, zp, xp):= | ( | zp, wp, zp+z1, Q(zp+z1, zp, wp) | ) | . | (1) |
|
2(z1, z2):= Lz2( |
|
z1(0)), (2) |
|
4 (z1, z2, z3, z4) := Lz4( |
|
z3( L z2 ( |
|
z1 (0 )))), (3) |
On dira que M est minimale (au sens de J.-M. Trépreau et A.E. Tumanov) s'il existe un entier µ0 tel que l'image par Gµ0 d'un voisinage de l'origine arbitrairement petit dans Cmµ0 contient un voisinage de 0 dans M. On démontre que cette condition est invariante par changement de coordonnées holomorphes locales. C'est tout ce qu'il suffira de savoir au sujet de la géométrie de la sous-variété source M. Dans le §3.20 de [21], on trouvera des éléments de comparaison avec la théorie concurrente des << ensembles de Segre >> qu'ont développée S.M. Baouendi P. Ebenfelt et L.-P. Rothschild à partir de 1995--96, sans observer le lien direct avec la construction due à H.J Sussmann des orbites de systèmes de champs de vecteurs.
Fixons t'Î Cn' et k Î N. La sous-variété de Segre complexifiée conjuguée est la sous-variété analytique complexe de C n' définie par S t'' := { (z', x ') Î C n' : x' = Q ' (z', t')}. Définissons alors l'application de ses jets d'ordre k explicitement par
| jk'(z', t') := | æ
ç ç ç ç ç è |
z', | æ
ç ç è |
|
¶z'b'Qj''(z', t') | ö
÷ ÷ ø |
|
ö
÷ ÷ ÷ ÷ ÷ ø |
. (4) |
Dans [26], je démontre que ces cinq conditions ne dépendent pas du système de coordonnées (z', w') dans lequel on a représenté M' sous la forme x ' = Q'( z', t').
Bien entendu, par souci de pureté, on pourrait en toute rigueur éviter d'introduire une terminologie spécifique pour de telles conditions de non-dégénérescence. Néanmoins, puisque l'usage a déjà consacré les quatre conditions que sont (nd1), (nd2), (nd3) et (nd5), dans [26], [21], j'adopte ces dénominations établies, et j'en introduirai de nouvelles ultérieurement.
La nécessité d'introduire la condition (nd4) est due à un exemple intéressant que l'on trouve page 721 de [].
Dans [26], j'établis les quatre implications
Les conditions (nd2) et (nd3) apparaissent explicitement dans []. C.K. Han obtient dans [] un principe de réflexion avec une formulation différente de (nd2). Il est important de noter que (nd1), (nd2) sont des hypothèses de rang constant sur l'application de jets 4 ; c'est pourquoi elles sont des plus aisées à manipuler (cf. [], [], [], [], [], []). Quant à la condition (nd3), elle n'est pas très éloignée de (nd2) du point de vue de la théorie des singularités ; elle a été répétitivement posée comme hypothèse du principe de réflexion analytique, suite au travail [] qui développait une technologie adéquate (cf. [], [], [], [], [], [] et [] pour une synthèse récente ; voir aussi [] pour une approche alternative, plus géométrique).
Il est important de remarquer que les quatre premières conditions (nd1), (nd2), (nd3) et (nd4) sont ponctuelles, tandis que la dernière ne l'est pas, puisqu'il s'agit d'un rang générique. Il existe des exemples de sous-variétés génériques qui sont holomorphiquement non-dégénérées, mais qui ne sont ni finiment non-dégénérées, ni essentiellement finies, ni même Segre non-dégénérées en certains points appartenant à un sous-ensemble analytique réel non vide de M'. Ainsi, la notion de non-dégénérescence holomorphe est la plus fine des cinq.
La condition intermédiaire (nd4), qui apparaît dans [], est déjà plus délicate. En vérité, pour les sous-variétés M' dites rigides dont les fonctions définissantes Q j'' º Q j' '( z', z') ne dépendent pas de w', on vérifie que les conditions (nd4) et (nd5) sont équivalentes. Comme la condition (nd5), la condition (nd4) autorise que les fibres ( jk' ) -1 ( jk' ( z', t' )) de l'application de jets soient de dimension non localement constante au voisinage de l'origine. Il est bien connu alors que les concepts standard de géométrie différentielle sont insuffisants : on entre dans le domaine de la théorie des singularités analytiques complexes.
Dans [], H. Hironaka met au point un procédé d'éclatements locaux successifs qui permet, par transformations strictes successives, de remplacer tout morphisme analytique local par un morphisme <<redressé>> qui satisfait la condition algébrique dite de <<platitude>> introduite par J.-P. Serre. Ce théorème dit d'<<aplatissement local>> implique la constance locale de la dimension des fibres, lorsque les espaces d'arrivée et de but du morphisme <<aplati>> sont lisses. L'existence de ce procédé suggère de l'appliquer à l'étude des applications CR formelles (cf. []). J'ai constaté que cette approche aboutit dans le cas des applications CR définies par des séries entières, mais dans [21], je n'utilise pas la théorie de H. Hironaka. En effet, grâce à un théorème dit d'approximation dû à M. Artin (voir Théorème 2.5 ci-dessous), je peux résumer en partie la complexité causée par les singularités de l'application de jets d'ordre infini 4, pour k=¥ ; l'utilisation de ce théorème dans le sujet remonte à M. Derridj dans [], d'après une suggestion de A. Douady. La complexité de la preuve du résultat principal (Théorème [21]--1.23) ci-dessous demeurera substantielle, car elle implique un grand nombre de collections infinies d'identités formelles.
La condition de non-dégénérescence holomorphe est connue pour être la condition nécessaire la plus naturelle pour qu'un principe de réflexion soit valide (cf. le premier article [] contenant une telle observation dans un cadre algébrique, cf. [10] pour un résultat sans condition de rang dans le cadre algébrique, et cf. [14] pour un résultat récent dans le cadre C ¥). Rappelons-en le principe. Soit X' := å i'=1 n' ai' ' (t') ¶ / ¶ ti'' un champ de vecteurs non nul et à coefficients holomorphes qui est tangent à M'. Soit (s', t') exp(s' X')(t') le flot local de X', où s'Î C et t'ÎCn'. Grâce à la condition de tangence, ce flot induit une famille à un paramètre d'automorphismes holomorphes locaux de M'. Dans [21], je vérifie qu'il existe de nombreuses séries entières non convergentes v' ( t') Î C[[ t' ]] dont le terme constant est nul, telles que la composition du flot avec la substition du temps complexe s' par v'(t'), c'est-à-dire t' |® F exp (v'(t') X') (t'), est une auto-application CR formelle inversible de M' non convergente. Une obstruction similaire au principe de réflexion se produit lorsque M' est holomorphiquement non-dégénérée, dans la catégorie algébrique, C¥ ou C0.
La simplicité de cette obstruction laisse évidemment deviner que la non-dégénérescence holomorphe pourrait être une condition nécessaire et suffisante à la convergence de h. En supposant M minimale à l'origine, j'établis la réciproque attendue. C'est le premier résultat principal de [21], annoncé dans [11].Théorème [21]--1.11 Soit h: (M, 0) ® F (M', 0) une équivalence CR formelle entre sous-variétés de Cn analytiques réelles, génériques, de même codimension d ³ 1 et de même dimension CR égale à m := n-d ³ 1. Si M est minimale à l'origine et si M' est holomorphiquement non-dégénérée, l'application CR formelle h est convergente.
Reste à s'interroger sur la nécessité de supposer
M minimale à l'origine. On pourrait formuler et démontrer
une version formelle du Théorème 2.7 de [10] énoncé
dans un cadre algébrique, ce qui donnerai : si M n'est nulle
part minimale et s'il existe un groupe à un paramètre réel
d'auto-applications holomorphes locales stabilisant M, il existe
de nombreuses auto-applications CR formelles de M qui ne sont pas
convergentes. Par ailleurs, il a été démontré
dans [] que le principe de réflexion algébrique pour les
biholomorphismes est valide en supposant seulement que la sous-variété
source M est minimale en tout point hors d'un sous-ensemble analytique
réel strict. On parle alors de minimalité
en
un point Zariski-générique. Il existe donc une
conjecture <<folklorique>> d'après laquelle le Théorème
[21]--1.11 devrait être vrai en supposant seulement que M
est minimale en un point Zariski-générique, ce qui signifie
qu'elle n'est pas forcément minimale à l'origine, mais qu'elle
est minimale en des points arbitrairement proches de l'origine.
Il s'agit là d'une hypothèse fine qui pourrait à nouveau impliquer la théorie des singularités. Pour l'instant, bien que quelques résultats soient connus pour le principe de réflexion C ¥ entre hypersurfaces non minimales, aucun analogue formel n'est connu. Les idées font défaut, mais je considère que cette question mérite d'être étudiée.
Pour une application CR formelle h : (M, 0) ¾®F (M', 0), cet invariant se présente comme suit. Soient xj'' - Q j''( z', t')=0, j'= 1, ..., d', des équations complexes arbitraires pour M' dans un voisinage de l'origine. Alors l'application de réflexion associée à h et à ce système de coordonnées s'exprime par une série formelle vectorielle à deux variables t' Î Cn' et t Î Cn :
En 1998, inspiré par mes conjectures sur l'application de réflexion prépubliées dans [] et par la remarque de la page 1098 du preprint de [] (issu en partie de cette prépublication), N. Mir5 a démontré de manière indépendante dans [] que l'application de réflexion associée à un biholomorphisme entre hypersurfaces algébriques est algébrique. Sa définition de l'application de réflexion élimine la variable x' dans 6 ; celle-ci a pourtant un sens géométrique, puisque la définition de Rh' est intrinsèquement reliée aux sous-variétés de Segre complexifiées. Ni dans ce travail, ni dans d'autres travaux ultérieurs [], [], [] consacrés à l'application de réflexion, N. Mir ne traite l'invariance biholomorphe de cette application. Or, pour peu que l'on établisse que l'algébricité de Rh' est une propriété invariante par changement de coordonnées algébriques (cf. [10] et [14]), le résultat principal de [] devient un corollaire élémentaire de []. En effet (cf. le §11 de [10]), en déplaçant légèrement le point de référence en un point où l'application de jets 4 est de rang localement constant -- ce qui est autorisé puisque l'application considérée est déjà holomorphe dans un ouvert -- et en éliminant des variables muettes, on se ramène à un biholomorphisme local entre deux sous-variétés algébriques réelles, génériques et finiment non-dégénérées contenues dans des espaces euclidiens complexes de dimensions inférieures ; alors les résultats de [] (codimension 1) ou de [] (codimension quelconque) s'appliquent directement. En résumé, pour le principe de réflexion algébrique, l'algébricité de la fonction de réflexion équivaut à l'algébricité d'une application holomorphe entre sous-variétés génériques de dimension inférieure (cf. le Théorème 11.4 de [10] qui établit cette équivalence sans aucune hypothèse de rang).
En revanche, pour les applications CR formelles (ou C¥), il est vraiment impossible de déplacer la situation locale en un point où les singularités de l'application de jets 4 disparaissent.
Avant d'énoncer notre résultat principal, présentons une deuxième liste hiérarchisée, comportant cinq conditions CR-horizontales de non-dégénérescence.
Pour exprimer ces conditions, travaillons d'emblée avec les équations complexes graphées pour M', ou plutôt avec les équations conjuguées wj' = Qj'' (z', t'), j'=1, ..., d', qui sont équivalentes. Représentons aussi la complexification M de M par des équations complexes de la forme wj = Qj (z, t ), j = 1, ..., d dans des coordonnées adaptées t = (z, w) Î Cm × Cd. Posons rj (t, t) := wj - Q j (z, t) et rj'' (t', t') := wj''- Qj'' (z', t'). Par hypothèse, il existe une matrice de taille d' × d de séries formelles b (t, t) telle que r' ( h (t), h (t) ) º b(t , t) r (t, t) dans C [[ t, t ]]d. Décomposons les composantes de l'application d'une manière compatible avec le scindage (z', w')Î C m' × C d' des coordonnées, ce qui donne h(t) =: ( f(t), g(t))Î C [[ t ]] m' × C [[ t ]] d'. En remplaçant w par Q (z, t) dans l'identité fondamentale r' ( h (t ), h (t) ) º b( t, t) r (t, t), le second membre s'annule identiquement et on obtient les identités formelles suivantes, valables dans C [[ z, t ]] :
| gj' | æ
è |
z, |
|
(z, t) | ö
ø |
º |
|
j'' | æ
è |
f(z, |
|
(z, t), |
|
( t)) | ö
ø |
, (7) |
| gj' | æ
è |
z, |
|
(z, 0) | ö
ø |
º |
|
j'' | æ
è |
f(z, |
|
(z, t), 0 ) | ö
ø |
. (8) |
| Cm ' z F | æ
è |
f | æ
è |
z, |
|
(z, 0) | ö
ø |
, |
|
' | æ
è |
f | æ
è |
z, |
|
(z, 0), 0 | ö
ø |
ö
ø |
ö
ø |
Î Cm' × C d'. (9) |
| Cm ' z F f | æ
è |
z, |
|
(z, 0) | ö
ø |
Î Cm'. (10) |
Dans [26], je vérifie les quatre implications
Le préfixe commun aux cinq conditions <<CR->> se justifie de la manière suivante : puisque l'espace tangent au point 0 ÎS0 coïncide avec l'espace tangent complexe à M en 0, lequel absorbe la structure CR infinitésimale de M en 0, on peut penser que l'application formelle induite hS0 : ( S0, 0) ¾®F ( S0', 0) est un <<prolongement>> de l'application CR tangente dh : T0c M ® T0c M'.
Sélectionnons maintenant la condition (cr5), puisque c'est la plus générale.
| F' | æ
è |
f1 | æ
è |
z, |
|
(z, 0) | ö
ø |
, ..., fm' | æ
è |
z, |
|
(z, 0) | ö
ø |
ö
ø |
º 0, (12) |
Dans le §4.30 de [21], je démontre que si cette propriété
de convergence est satisfaite dans un tel système de coordonnées
(z', w'), alors pour tout autre système de coordonnées
(z'', w'') centrées à l'origine dans
lesquelles la complexification de la sous-variété transformée
est représentée par des équations similaires xj'''-
Qj'''(
z'', t'') = 0, j'=1,
..., d', l'application de réflexion associée
est elle aussi convergente.
La force principale de ce théorème réside dans le fait qu'il ne requiert aucune condition de non-dégénérescence sur M'. Comme pour le Théorème [21]--1.11, je pense bien entendu qu'il demeure valide en supposant seulement que M est minimale en un point Zariski-générique.
Attention, il y a un piège ! Par souci de généralité, on pourrait être tenté comme dans [] de raisonner avec des équations définissantes analytiques réelles arbitraires r j' '( t', t') = 0 pour M', telles qu'introduites au tout début. L'application de réflexion associée serait alors définie par Rh' (t', t):= r j'' (h(t), t') Î C [[ t, t' ]] d', et le Théorème [21]--1.23 exprimerait, sous les mêmes hypothèses, qu'elle est convergente. Mais en 1997, J.-M. Trépreau m'a fait remarquer qu'un tel énoncé serait trivialement faux (et sur le coup, cela a été dur !).
En effet, choisissons une série entière non convergente v( z2) Î C [[ z2]] telle que v (z2) = z2 + O(z22) et considérons l'application formelle définie par h(z1, z2, w ):= (z1, v(z2), w). C'est une équivalence CR formelle entre l'hypersurface algébrique M de C3 définie par w= w + i z1 z1 et (la même !) l'hypersurface de C3 définie par r ' =0, où r' := w' - w' + i z1' z1'. Notons que M' est holomorphiquement dégénérée, puisque le champ holomorphe ¶ / ¶ z2' lui est tangent. Il est vrai que l'application de réflexion Rh' (t', t) égale à x' - w + i z1 z1 ' est convergente. Par contre, il est vraiment faux que l'application de réflexion associée à une équation définissante arbitraire pour M' est convergente. En effet, prenons par exemple la fonction r'(t', t') : = [1+ z1' z1' + z2' z2'] r'(t', t') ; son lieu d'annulation coïncide avec M'. Si l'application de réflexion
| Rh' ( t', t) := | [ | 1+ z1 z1 ' + v(z2) z2']· [x' - w + iz1 z1' | ] | (13) |
Comme je l'ai mentionné précédemment, N. Mir a obtenu dans [] une démonstration du Théorème [21]--1.23 pour les équivalences formelles dans le cas d= d' =1, mais la méthode, astucieuse, achoppe dès que la codimension d de M est supérieure ou égale à 2. La première version de [9], qui a circulé avant [], contenait seulement le Théorème [21]--1.11 dans le cas d = d' =1. Dans cette référence, l'existence de paires d'identités de réflexion conjuguées apparaissait clairement, bien qu'exploitée de manière insuffisante. En fait, dans la version publiée [9], il a suffi d'inclure le court §9 pour obtenir le Théorème [21]--1.23 pour les équivalences formelles dans le cas d= d' = 1. Cette paire d'identités de réflexion conjuguées étant absolument cruciale pour la démonstration du Théorème 1.23, je vais l'exposer ci-dessous.
En mai 2000, une démonstration complète du Théorème [21]--1.23 pour les équivalences CR formelles a été annoncée (math.CV/0005290). Cette annonce électronique a donné lieu à la publication résumée [11]. Sept mois plus tard, en décembre 2000, S.M. Baouendi, N. Mir et L.-P. Rothschild ont annoncé électroniquement le même type de résultats, avec les raffinements attendus sur le rang de l'application h, lesquels ne s'élèvent pourtant que jusqu'au niveau (cr4). Un examen de la publication [] à laquelle a donné lieu ce travail (qui ne contient plus les références à nos travaux présentes dans la version électronique) montre que ces auteurs utilisent les paires d'identités de réflexion conjuguées, ce que seul l'ultra-spécialiste peut déceler dans le coeur technique de la démonstration principale (voir les équations 5.2 et 5.3, la Proposition 6.1 et le Lemme 7.1 de []). Par ailleurs, ces auteurs, qui n'emploient pas la terminologie <<application de réflexion>> (utilisée pourtant dans [], []), introduisent une notion alternative d'<<idéal de Segre>>, laquelle est définie au moyen d'équations analytiques réelles arbitraires r j' '( t', t') =0 pour M'. Ce choix pour énoncer leurs théorèmes de convergence, les contraint à quelques circonlocutions, puisque la convergence de R h' (t', t) := rj'' (h(t), t') Î C [[ t, t' ]] d' n'est satisfaite que pour les représentants graphés de l'idéal engendré par les séries entières complexifiées r j' ' (t', t'), comme on vient de le voir.
En conclusion de ce paragraphe, la prolixité et le raffinement
des résultats présentés dans [] confinent à
un certain hermétisme auquel je n'adhère pas, puisque les
quatre concepts analytico-géométriques qui sont impliqués
dans le sujet sont relativement simples :
Ce sont ces hypothèses multiples, combinées souvent à l'alternative entre catégorie algébrique et catégorie analytique, qui sont responsables de la combinatoire de théorèmes possibles publiés récemment sur le principe de réflexion analytique. Toutefois, cette diversité s'exerce au détriment de résultats plus rares où une difficulté substantielle a été surmontée et elle occulte leur repérage.
Exposons maintenant le point-clé qui est à la base de la démonstration du Théorème [21]--1.23.
| ì
í î |
Lk:= |
|
+ |
|
|
(z, t) |
|
, k=1,..., m, |
|
k:= |
|
+ |
|
|
(z, t) |
|
, k=1,..., m. | (14) |
| ì
í î |
|
j' | ( | z, Q (z, t) | ) | ºQ j' ' | æ
è |
|
(z, Q (z, t)), h(t) | ö
ø |
,gj' | æ
è |
z, |
|
(z, t) | ö
ø |
º |
|
j'' | æ
è |
f | æ
è |
z, |
|
(z, t) | ö
ø |
, |
|
( t) | ö
ø |
. | (15) |
| R | h' (t', t) = x' - |
|
(z')g ' Q g ' '( h(t)). (16) |
En utilisant le même développement partiel en séries entières des Q j', g''(z', t'), on peut aussi réécrire les relations fondamentales 15 sous une forme plus explicite, dont le mérite principal est de faire clairement apparaître toutes les composantes de l'application de réflexion :
| ì
í î |
|
(t) = |
|
|
(t)g ' Qg' ' (h(t)),g (t) = |
|
f(t)g ' |
|
g' ' | æ
è |
|
(t) | ö
ø |
, | (17) |
| ì
í î |
Lb:= ( L 1 ) b1( L 1 ) b2 ··· ( L m) bm et |
|
b:= ( |
|
1 ) b1 ( |
|
1 ) b2 ··· ( |
|
m) bm. | (18) |
Classiquement, on applique les dérivations antiholomorphes
( L 1
) b1 (
L1
) b2
··· ( L m)
bm au premier
jeu d'équations 17. De manière équivalente,
à une conjugaison près, on pourrait appliquer les dérivations
conjuguées ( L 1
) b1(
L 1
) b2
··· ( L m)
bm au second
jeu d'équations 17. Au total, les deux procédés
reviennent à choisir une fois pour toutes les variables t
ou les variables t pour écrire les identités de réflexion.
C'est le point de vue qui est adopté dans tous les travaux consacrés
au principe de réflexion analytique que sont [], [], [], [], [],
[], [], [], [], [], [], [], [], [], [], [], [], [], [], [10], [], [14],
[], [] et [].
Il faut respecter une exigence de complétude : on dispose de deux jeux de d' équations formelles fondamentales 17 et de deux jeux infinis de dérivations fondamentales 18. Au total, ce ne sont donc pas deux mais quatre identités de réflexion que l'on devrait obtenir.
Pour les écrire, on observe que Lk (h) º 0 et que L k ( h ) º 0 pour k = 1, ..., m, ce qui est évident d'après les formules 14. Il en découle que Lb( h ) º 0 et que L b( h ) º 0 puis aussi LbQg' '( h) º 0 et L b( Q ' ( h ) ) º 0, pourvu bien sûr que b ¹ 0.
Ainsi, en appliquant les dérivations 18 pour b ¹ 0 aux identités 17, on obtient quatre familles infinies d'identités de réflexion. Disposons-les en deux paires conjuguées comme suit : première paire :
| ì
í î |
|
b |
|
(t) = |
|
|
b | é
ë |
|
(t)g ' | ù
û |
Qg' ' (h(t)),0 = |
|
f(t)g ' |
|
b | é
ë |
|
g' ' | æ
è |
|
(t) | ö
ø |
ù
û |
; | (19) |
| ì
í î |
L | bg (t) = |
|
Lb | [ | f(t)g ' | ] |
|
g' ' | æ
è |
|
(t) | ö
ø |
,0 = |
|
|
(t)g ' Lb | [ | Qg' ' (h(t)) | ] | . | (20) |
La différence a son importance pour la raison suivante. D'après la propriété mentionnée après 16, le Théorème [21]--1.23 énonce essentiellement que les composantes Q g''( h(t)) de l'application de réflexion sont des séries convergentes. Il n'énonce nullement que toutes les composantes de l'application h(t) sont convergentes. L'exemple élémentaire discuté après le Théorème [21]--1.23 (ou d'autres analogues) montre qu'en général, aucune contrainte de convergence n'est exercée sur les composantes de h qui n'apparaissent pas dans les composantes de l'application de réflexion. C'est pourquoi la première identité de réflexion 19 a le défaut majeur de faire intervenir inévitablement les dérivées d'éventuelles <<mauvaises>> composantes de h, tout du moins celles qui ne sont pas intrinsèquement liées à l'application invariante Rh'. Au contraire, dans la seconde identité 19 (tout aussi bien que dans la première identité 20), on différentie les vrais objets invariants que sont les composantes Q g'' ( h ) (ou leurs conjuguées Q g ' '( h )).
À notre connaissance, les seuls travaux dans lesquels on considère aussi les seconde identités de réflexion 19 (ainsi que sa conjuguée, la première identité de 20) sont : [9], [10] et [].
In the past fifteen years, remarkable progress has been made towards the understanding of the holomorphic extendability properties of CR functions. At the origin of this development, the most fundamental achievement was the deep discovery, due to the effort of numerous mathematicians, that the so-called CR orbits are the adequate underlying objects for the semi-local CR analysis on a general embedded CR manifold. As an independent and now established theory in several complex variables, one may find a precise correspondence between such orbits and progressively attached analytic discs covering a thick part of the envelope of holomorphy of CR manifolds, cf. [], [], [], [], [], [], [], [] and [] for a recent synthesis.
Within this framework, it became mathematically accessible to endeavour the general study of removable singularities on embedded CR manifolds MÌ Cn of arbitrary CR dimension and of arbitrary codimension, not necessarily being the boundaries of (strictly) pseudoconvex domains. With respect to their size or ``mass'', the interesting singularities can be essentially ordered by their codimension in M. For instance, provided it does not perturb the fact that M consists of a single CR orbit, an arbitrary closed subset CÌ M which is of vanishing 2-codimensional Hausdorff content is always removable, as is shown in [] in the hypersurface case and in [], Theorem 1.1, in arbitrary codimension. Hence one is left to study the removability of singularities of codimension at most two. Since the general problem of characterizing removability seems at the moment to be out of reach (even for M being a hypersurface), it is advisible to focus on geometrically accessible singularities, namely singularities contained in a CR submanifold of M. A complete study of the automatic removability of two-codimensional singularities may be found in Theorem 4 of []. Having in mind the classical Painlevé problem, we will mainly consider in this paper singularities which are closed sets C contained in a codimension one submanifold M1 of M which is generic in Cn.
The known results on singularities of codimension one can be subdivided into two strongly different groups according to the CR dimension of M. If CRdim M ³ 2, then a generic hypersurface M1Ì M is itself a CR manifold of positive CR dimension, and singularities CÌ M1 can be understood on the basis of the interplay between C and the CR orbits of M1. Deep results in this direction were established when M is a hypersurface of Cn in [], [] and then generalized to CR manifolds of arbitrary codimension in []: the geometric condition insuring automatic removability is simply that C does not contain any CR orbit of M1.
On the other hand, if CRdim M=1 the geometric situation becomes highly different, as a generic hypersurface M1Ì M is now (maximal) totally real. Fortunately, as a substitute for the CR orbits of M1, one can consider the so-called characteristic foliation of M1, obtained by integrating the characteristic line field Tc M|M1 Ç TM1. But removability theorems exploiting this concept were only known for hypersurfaces in C2 and, until very recently, only in the strictly pseudoconvex case. Furthermore, a geometric condition insuring automatic removablitity has not yet been clearly delineated.
Hence, with respect to the current state of the art, there was a two-fold gap about codimension one removable singularities contained in generic submanifolds M of CR dimension one: firstly, to establish a satisfying theory for non-pseudoconvex hypersurfaces in C2 and secondly, to understand the situation in higher codimension. This second main task was formulated as the first open problem in a list p. 432 of [] (see also the comments pp. 431--432 about the relative geometric simplicity of the case CRdim M ³ 2). A priori, it is not clear at all whether the two directions of research are related somehow, but in the present work, we shall fill in this two-fold gap by devising a new semi-local approach which applies uniformly with respect to codimension.
For the detailed discussion of our result we have to introduce some terminology which will be used throughout the article. Let M be a generic submanifold of Cn and let C be a closed subset of M. Recall from [] that a wedgelike domain attached to a generic submanifold M'Ì Cn is a domain containing a local wedge of edge M' at every point of M'. Our wedgelike domains will always be nonempty. Let us define three basic notions of removability. Firstly, we say that C is CR-removable if there exists a wedgelike domain W attached to M to which every continuous CR function fÎ CCR0(M\ C) extends holomorphically. Secondly, as in [], p. 486, we say that C is W-removable if for every wedgelike domain W1 attached to M\ C, there is a wedgelike domain W2 attached to M and a wedgelike domain W3 Ì W1 Ç W2 attached to M\ C such that for every holomorphic function fÎ O( W1), there exists a holomorphic function FÎ O( W2) which coincides with f in W3. Thirdly, with p ÎRÈ {+¥} satisfying p ³ 1, we say that C is Lp-removable if every locally integrable function fÎ Llocp(M) which is CR in the distributional sense on M\ C is in fact CR on all of M.
The first notion of removability is a generalization of the kind of removability considered in most of the pioneering papers [], [], [], [], [], [], [], [] about removable singularities in boundaries of domains DÌ Ì Cn. We observe that a wedgelike open set attached to a hypersurface M is just a (global) one-sided neighborhood of M, namely a domain w with wÉ M such that for every point pÎ M, the domain w contains the intersection of a neighborhood of p in Cn with one side of M. If now a closed set C contained in a C1-smooth bounded boundary ¶ D is CR-removable, then an application of the Hartogs-Bochner theorem shows that CR functions on ¶D\ C can be holomorphically extended to D. The second notion of removability is a way to isolate the part of the question related to envelopes of holomorphy. The third notion of removability has the advantage of being completely intrinsic with respect to M and may be relevant in the study of non-embeddable CR manifolds.
To avoid confusion, we state precisely our submanifold notion: Y is a submanifold of X if Y and X are equipped with a manifold structure, if there exists an immersion i of Y into X and if the manifold topology of Y and the topology of i(Y) inherited from the topology of X coincide, so that one may identify the submanifold Y with the subset i(Y)Ì X. Furthermore, our submanifolds will always be connected.
Let us now enter the discussion of the case n=2. Here we shall denote the submanifold M1Ì M, which is a surface in C2, by S. In [], E. Bishop showed that a two-dimensional surface in C2 of class at least C2 having an isolated complex tangency at one of its points p may be represented by a complex equation of the form w=z z+l(z2+ z2)+o( z2), in terms of local holomorphic coordinates (z,w) vanishing at p, where the real parameter lÎ [0,¥) is a biholomorphic invariant of S. The point p is said to be elliptic if lÎ [0,1/2), parabolic if l = 1/2 and hyperbolic if l Î (1/2, ¥). Recall that M is called globally minimal if it consists of a single CR orbit (cf. [], []; [], pp. 814--815; and [], pp. 266--269). Throughout this paper, we shall work in the C 2, a-smooth category, where 0 < a < 1. Our first main new result is as follows.Theorem 1.1 Let M be a globally minimal C 2, a-smooth hypersurface in C2 and let D Ì M be a C 2, a-smooth surface which is
As a corollary, one obtains a corresponding result about holomorphic
extension from ¶W\ K for the case
that M is the boundary of a relatively compact domain WÌC2.
Note that ¶ W
is automatically globally minimal ([], Section 2). We will first recall
the historical background of Theorem 1.1 and explain afterwards on this
basis the main ideas and techniques necessary for the proof.
In 1988, applying a global version of the Kontinuitätssatz, B. Jöricke [] established a remarkable theorem: every compact subset of a totally real C2-smooth 2-disc lying on the boundary of the unit ball in S3=¶ B2Ì C2 is CR-removable. This discovery motivated the work [] by F. Forstneric and E.L. Stout, where it is shown that every C2-smooth compact 2-disc contained in a strictly pseudoconvex C2-smooth boundary ¶W contained in a 2-dimensional Stein manifold M which is totally real except at a finite number of hyperbolic complex tangencies is removable; the proof mainly relies on a previous work by E. Bedford and W. Klingenberg about the hulls of 2-spheres contained in such strictly pseudoconvex boundaries W Ì M, which may be filled by Levi-flat 3-spheres after a generic small perturbation ([], Theorem 1). Indirectly, it followed from [] and [] that such compact totally real 2-discs DÌ ¶ W (possibly having finitely many hyperbolic complex tangencies) are O(W)-convex and in particular polynomially convex if D=B2 and M=C2, thanks to a previous work [] by E.L. Sout, where it is shown (Theorem II.10) that a compact subset K of a C2-smooth strictly pseudoconvex boundary ¶ W in a Stein manifold is removable if and only if K is O(W)-convex. It is also established in [] that a neighborhood of an isolated hyperbolic complex tangency in C2 is polynomially convex. These papers have been followed by the work [], where the question of O(W)-convexity of arbitrary compact surfaces S (with or without boundary, not necessarily diffeomorphic to a 2-disc) contained in a C2-smooth strictly pseudoconvex domain WÌ C2 is dealt with directly. Using K. Oka's characterization of the envelope of a compact, J. Duval shows that the essential hull Kess:= KO ( W ) \ K must cross every leaf of the characteristic foliation on the totally real part of S and he deduces that a compact 2-disc having only hyperbolic complex tangencies is O ( D )-convex.
All the above proofs heavily rely on strong pseudoconvexity, in contrast to the experience, familiar at least in the case CRdim M ³ 2, that removability should depend rather on the structure of CR orbits than on Levi curvature. The first theorem for the non-pseudoconvex situation was established by the second author in []. He proved that every compact subset of a totally real disc embedded in a globally minimal C¥-smooth hypersurface in C2 is always CR-removable. We would like to point out that, seeking theorems without any assumption of pseudoconvexity leads to substantial open problems, because one loses almost all of the strong interweavings between function-theoretic tools and geometric arguments which are valid in the pseudoconvex realm, for instance: Hopf Lemma, plurisubharmonic exhaustions, envelopes of function spaces, local maximum modulus principle, Stein neighborhood basis, etc.
To discuss the main elements of our approach, let us briefly explain the geometric setup of the proof of Theorem 1.1. The characteristic foliation has isolated singularities at the hyperbolic points, where it looks like the phase diagram of a saddle point. In particular there are four local separatrices accumulating orthogonally at each hyperbolic point. Hence we can decompose the 2-disc D as a union D=TD È Do, where TD consists of the union of the hyperbolic points of D together with the separatrices issuing from them, and where Do:= D \ TD is the remaining open submanifold of D, contained in the totally real part of D. By H. Poincaré and I. Bendixson's theory, TD is a tree of C2,a-smooth curves which contains no subset homeomorphic to the unit circle, cf. []. Accordingly, we decompose K:= K TD È Co, where KTD:= K Ç TD is a proper closed subset of the tree TD and where Co := K Ç Do is a relatively closed subset of Do.
The hard part of the proof, which was actually the starting point of the whole paper, will consist in removing the closed subset Co of the 2-dimensional surface S:=Do lying in M \ TD. Thereafter the removal of the remaining part KTD will be done by means of an investigation of the behaviour of the CR orbits near TD, close in spirit to our previous methods in [] (see Section 12 below for the details).
Let us formulate the first crucial part of the above argument as an
independent theorem about the removal of closed subsets contained in a
totally real surface S. We point out that now S may have
arbitrary topology.Theorem 1.2 Let M be a
C 2, a
-smooth globally minimal hypersurface in C2,
let S Ì M be a C2,
a-smooth
surface, open or closed, with or without boundary, which is totally real
at every point. Let C be a proper closed subset of S and assume that the
following topological condition holds:
Then C is CR-, W- and L
p-removable.
The condition FSc
{C } is a common condition on C and on the characteristic
foliation FSc,
namely on the relative disposition of FSc
with respect to C, not only on S; an illustration may be
found in Figure 2 below. In the strictly pseudoconvex
context, this condition appeared implicitly during the course of the proofs
given in []. Note that the relevance of the characteristic foliation had
earlier been discovered in contact geometry, cf. [], []. It is interesting
to notice that it re-appears in the situation of Theorem 1.2, where the
underlying distribution Tc M
is allowed to be very far from contact.
As is known, it follows from a subcase of H. Poincaré and I. Bendixson's theory that if S is diffeomorphic to a real 2-disc or if S=Do as above, then FSc {C} is automatically satisfied for an arbitry compact subset C of S. On the contrary, it may be not satisfied when for instance S is an annulus equipped with a radial foliation together with C containing a continuous closed curve around the hole of S. Crucially, it is elementary to construct an example of such an annulus which is truly nonremovable. Indeed, the small closed curve C which consists of the transversal intersection of a strictly convex boundary ¶ D with a complex line close to a boundary point may be enlarged as a thin maximally real strip SÌ ¶ D which is diffeomorphic to an annulus; in this setting, C is obviously nonremovable and the characteristic foliation is everywhere transversal to C. Consequently, the geometric condition FSc{C} is the optimal one insuring automatic removability for all choices of M, S and C. Further examples of closed subsets in surfaces with arbitrary genus equipped with such foliations may be exhibited.
In the proof of Theorem 1.2, after some contraction C' of C, we may assume that no point of C' is locally removable (see Sections 2 and 3 below). Then the very assumption FSc{C} yields the existence of a characteristic segment g[-1,1], such that C' lies on one side of g[-1,1]. Reasoning by contradiction, our aim is to show that there exists at least one special point pÎ C'Ç g(-1,1), which is locally CR-, W- and Lp-removable. The choice of such a point p, achieved in Section 5 below, will be nontrivial.
The strategy for the local removal of p is to construct an analytic disc A such that a segment of its boundary ¶ A is attached to S and touches C' in only one point p. Several geometrical assumptions have to be met to ensure that a sufficiently rich family of deformations of A have boundaries disjoint from C', that analytic extension along these discs is possible (i.e. appropriate moment conditions are satisfied), and that the union of these good discs is large enough to give analytic extension to a one-sided neighborhood of M: this is where the (semi)localization and the choice of the special point pÎ C' will be key ingredients. Let us explain why localization is crucial.
Working globallly, the second author produced in [] a convenient disc by applying the powerful E. Bedford and W. Klingenberg theorem to an appropriate 2-sphere containing a neighborhood of the entire singularity C'. This method requires global properties of S like S being a totally real 2-disc, which ensures the existence of a nice Stein neighborhood basis of C'. Already for real discs with isolated hyperbolic points, it is not clear whether this argument can be generalized (however, we would like to mention that recent results of M. Slapar in [] indicate that this could be possible at least if the geometry near the hyperbolic points satisfies some additional assumptions). In the case where M is an arbitrary globally minimal hypersurface, where S has arbitrary topology and has complex tangencies, the reduction to E. Bedford and W. Klingenberg's theorem seems impossible, cf. the example of an unknotted nonfillable 2-sphere in C2 constructed by J.E. Fornæss and D. Ma in []. Also, to the authors' knowledge, the possibility of filling by Levi-flat 3-spheres the (not necessarily generic) 2-spheres lying on a nonpseudoconvex hypersurface is a delicate open problem. In addition, for the higher codimensional generalization of Theorem 1.2, the idea of global filling seems to be irrelevant at present times, because no analog of the E. Bedford and W. Klingenberg theorem is known in dimension n³ 3. As we aim to deal with surfaces S having arbitrary topology and to generalize these results in arbitrary codimension, we shall endeavour to firmly localize the removability arguments, using only small analytic discs.
Thus, our way to overcome these obstacles is to consider local discs A which are only partially attached to S. The delicate point is that we have at the same time (i) to control the geometry of ¶ A near pÎ C' and (ii) to guarantee that the rest of the boundary stays in the region where holomorphic extension is already known. In fact, (ii) will be incorporated in our very special and tricky choice of pÎ C'. For (i), we have to sharpen known existence theorems about partially attached analytic discs and to combine it with a careful study of the complex/real geometry of the pair (M,S). Importantly, our construction of such analytic discs is achieved elementarily in a self-contained way. A precise description of the proof in the hypersurface case (only) may be found in Section 2 below. With some substantial extra work, we shall generalize this purely local strategy of proof to higher codimension.
To conclude with the removal of surfaces, let us formulate a more general version of Theorem 1.1, whitout the restricted topological assumption that S be diffeomorphic to a real disc. Applying Theorem 1.2 for the removal of KÇ (S\ TS) and a slight generalization of Theorem 4 (ii) in [] for the removal of KÇ TS (more precisions will be given in §13 below), we shall obtain the following statement, implying Theorem 1.1 as a direct corollary.Theorem 1.3 Let M be a C 2, a -smooth globally minimal hypersurface in C2, let S Ì M be a C2, a-smooth totally real surface, open or closed, with or without boundary, which is totally real outside a discrete subset of isolated complex tangencies which are hyperbolic in the sense of E. Bishop. Let TS be the union of hyperbolic points of S together with all separatrices issued from hyperbolic points and assume that TS does not contain any subset which is homeomorphich to the unit circle. Let K be a proper compact subset of S and assume that FS\ TSc {K Ç (S \ TS)} holds.
Then K is CR-, W- and L p-removable.
As was already emphasized, our main motivation for this work was
to
devise a local strategy of proof for Theorems 1.1, 1.2 and 1.3 in
order to generalize them to higher codimension. In fact, we will realize
the program sketched above for generic submanifolds of CR dimension 1 and
of arbitrary codimension. Thus, let M be a
C2,a-smooth
globally minimal generic submanifold of codimension (n-1) in Cn,
hence of CR dimension 1, where n³
2. Let M1 be a maximally real
C2,a-smooth
one-codimensional submanifold of M which is generic in Cn.
As in the surface case, M1 carries
a
characteristic foliation FM1c,
whose leaves are the integral curves of the line distribution TM1ÇTcMM1.
Of course the assumption that the singularity lies on one side of some
characteristic segment is no longer reasonable. We will generalize it as
a condition requiring (approximatively speaking) that there be always a
characteristic segment which is accessible from the complement of C
in M1 along one direction normal
to the characteristic segment.
The generalization of Theorem 1.2, which is our principal result in this paper, is as follows.Theorem 1.2' Let M, M1, FM1c be as above and let C be a proper closed subset of M. Assume that the following topological condition, meaning that C is not transversal to the characteristic foliation, holds:
Then C is CR-, W- and L
p-removable.
The condition F
M1c
{C }, which is of course independent of the choice of the transversal
R1 and of the thin neighborhood
V1, is illustrated in Figure
8 of §5.1 below; clearly, in the case n =2, it means
that C' Ç V1
lies completely in one side of g [-1, 1], with
respect to the topology of M1, as
written in the statement of Theorem 1.2. Applying some of our previous
results in this direction ([], []), we shall provide in the end of Section
13 below some formulations of applications of Theorem 1.2', close to being
analogs of Theorem 1.3 in higher codimension.
Importantly, in order to let the geometric condition FM1c{C} appear less mysterious and to argue that it provides the adequate generalization of Theorem 1.2 to higher codimension, in the last Section 14 below, we shall describe an example of M, M1 and C in C3 violating the condition FM1c{C}, such that C is transversal to the characteristic foliation and is truly nonremovable. This example will be analogous in some sense to the example of a nonremovable annulus discussed after the statement of Theorem 1.2. Since there is no H. Poincaré and I. Bendixson theorem for foliations of 3-dimensional balls by curves, it will be even possible to insure that M and M1 are diffeomorphic to real balls of dimension 4 and 3 respectively. We may therefore conclude that Theorem 1.2' provides the desirable answer to the (already cited supra) Problem 2.1 raised by B. Jöricke in [], p. 432.
To pursue the presentation of our results, let us comment the assumption that M be of codimension (n-1). Geometrically speaking, the study of closed singularities C lying in a one-codimensional generic submanifold M1 of a generic submanifold MÌ Cn which is of CR dimension m³ 2 is more simple. Indeed, thanks to the fact that M1 is of CR dimension m-1³ 1, there exist local Bishop discs completely attached to M1, and this helps much in describing the envelope of holomorphy of a wedge attached to M\ C. On the contrary, in the case where M is of CR dimension 1, small analytic discs attached to a maximally real M1 are (trivially) inexistent. This is why, in the proof of our main Theorems 1.2 and 1.2', we shall deal only with small analytic discs whose boundary is in part (only) contained in M1. Such discs are known to exist; we would like to mention that historically speaking, the first construction of discs partially attached to maximally real submanifolds was exhibited by S. Pinchuk in [], who developed the ideas of E. Bishop [].
Finally we will test our main Theorem 1.2' in applications. First of all, we clarify its relation to known removability results in CR dimension greater than one. Here the motivation is simply that most questions of CR geometry should be reducible to CR dimension 1 by slicing. It turns out that the main known theorems about removable singularities, due to E. Chirka, E. L. Stout, and B. Jöricke for hypersurfaces, and by the authors in higher codimension ([], Theorem 1 about L p-removability; [], Theorem 3 about CR- and W- removability) are all a rather direct consequence of Theorem 1.2'. Since these results have not yet been published in complete form, we take the occasion of including them in the present paper, as a corollary of Theorem 1.2', yet devising a new geometric approach.Theorem 1.4 Let M be a C2, a-smooth globally minimal generic submanifold of Cn of CR dimension m³ 2 and of codimension d=n- m³ 1, let M1 Ì M be a C2, a-smooth one-codimensional submanifold which is generic in Cn and let C Ì M1 be a proper closed subset of M. Assume that the following condition holds:
Notice the difference with the case m=1, where the analog
of CR orbits would consist of characteristic curves: the condition
FM1c{C}
does not say that C should not contain any maximal
characteristic curve. In fact, we observe that there cannot exist a uniform
removability statement covering both the case m=1 and the case m³
2, whence Theorem 1.2' is stronger than Theorem 1.4. Indeed, the elementary
example of a nonremovable circle in an annulus contained in the boundary
of a strictly convex domain of C2
shows that C may be truly nonremovable whereas it does not contain
any characteristic curve. In the strictly pseudoconvex hypersurface setting,
it is well known that Hopf's Lemma implies that boundaries of Riemann surfaces
contained in C (and also the track on C of its essential
hull, cf. []) should be everywhere transversal to the characteristic
foliation. Of course, this implies conversely that C cannot contain
such boundaries (unless they are empty) if FM1c{C}
is satisfied. The reason why FM1c{C}
implies that C is removable also in the nonpseudoconvex setting
and in arbitrary codimension will be appearant later. Finally, we mention
that the Lp-removability
of C in Theorem 1.4 holds more generally with no assumption of global
minimality on M, as already noticed in [], [], []. However, since
the case where M is not globally minimal essentially reduces to
the consideration of its CR orbits, which are globally minimal by definition,
we shall only deal with globally minimal generic submanifolds M
throughout this paper.
As a final comment, we point out that, because the previously known proofs of Theorem 1.4 were of local type, it is satisfactory to bring in this paper a purely local framework for the treatment of Theorems 1.1, 1.2, 1.3 and 1.2'.
Our second group of applications concerns the classical edge of the wedge theorem. Typically one considers a maximally real edge E to which an open double wedge ( W1, W2) is attached from opposite directions. One may interprete this configuration as a partial thickening of a generic CR manifold MÌ EÈ W1È W2 containing E as a generic hypersurface. The classical edge of the wedge theorem states that functions which are continuous on W1 È W2 È E and holomorphic in W1 È W2 extend holomorphically to a neighborhood of E. Theorem 1.2' implies that it suffices to assume continuity outside a removable singularities of E. This allows us to derive an edge of the wedge theorem for meromorphic extension (Section 13 below).
This paper is divided in two parts: Part I contains the strategy per absurdum for the proof of Theorem 1.2', the construction of what we call a semi-local half-wedge and the choice of a special point to be removed locally. Part II contains the explicit construction of families of half-attached analytic discs, the end of proof of Theorem 1.2' and the proofs of the various applications. The reader will find a more detailed description of the content of the paper in §2.16 below.
Heureusement, ma méthode suit les traces de la théorie de S. Lie, et non celle de la théorie de É. Cartan ; mes calculs massifs, explicites et délicats sont donc apparemment nouveaux. Par ailleurs, M. Hachtroudi travaille seulement avec un système différentiel, jamais avec la sous-variété des solutions associée ; aussi toute la technologie de calculs manuels que j'ai élaborée sera réapplicable dans plusieurs situations nouvelles. Seul bémol : les textes écrits vont << gonfler >>, au point qu'il me sera sûrement difficile de faire publier mes résultats.
For instance, according to an early and often cited theorem due to S. Lie, the Newtonian free particle equation YXX=0, with one degree Y of freedom and one independent variable X; we use the index notation to denote partial derivatives, is the unique (up to coordinate changes) second order ordinary differential equation which admits a point symmetry group of maximal dimension equal to eight ; then its symmetry group is unique and consists of the full group of two-dimensional projective transformations. Sometimes, this equation is called flat, such a terminology being inspired by the notion of zero curvature in the sense of C.F. Gauss and B. Riemann, after that É. Cartan attached in [] a projective connection, together with some curvature, to any second order differential equation, the class of equations equivalent to YXX=0 being precisely characterized by the vanishing of the curvature. More importantly, S. Lie also obtained in 1883 an explicit characterization of the local equivalence to the Newtonian free particle equation with one degree of freedom YXX=0, which appears to be rather fundamental, with respect to practical purposes.Theorem 1.2 (Sophus Lie, [], pp. 362--365) Let K=R of C. Let xÎ K and yÎ K. A local second order ordinary differential equation yxx =F( x, y, yx) is equivalent under an invertible point transformation (x, y)|® (X (x,y), Y (x,y)) to the free particle equation Y XX =0 if and only if the following two conditions are satisfied:
| ì
í î |
0 = -2 Gyy + |
|
Hxy - |
|
Lxx+ + 2 (G L)y-2 Gx M-4 G Mx+ |
|
H Lx- |
|
H Hy,0 = - |
|
Hyy + |
|
Lxy - 2 Mxx+ +2 G My+4 Gy M- 2 (H M)x- |
|
Hy L+ |
|
L Lx. | (1.4) |
Notice that the second equation in 1.4 is obtained formally
from the first equation in 1.4, by replacing (G,H,L,M)
(-M, -L, -H, -G) and (x,y)|®
(y,x).
The first part of this paper is devoted to a detailed exposition of the original proof of Theorem 1.2 due to S. Lie himself; in fact, to the author's knowledge, there is no modern restitution of this proof in the contemporary literature, whereas the description of an alternative proof of Theorem 1.2 by means of É. Cartan's equivalence method appears in the references [], [], [], []; see [], [], [] for background about É. Cartan's theory. We note that in these references (except notably []), the already substantial computations are stopped just after the reduction to an {e}-structure on a eight-dimensional (local) principal bundle over the three-dimensional first order jet space. The vanishing of two (among four) fundamental tensors in the structure equations of the obtained {e}-structure yields two partial differential equations satisfied by the right hand side F(x,y,yx), which are equivalent to (i) and (ii) of Theorem 1.2. We note that with the help of Maple programming, L. Hsu and N. Kamran achieved in [] the complete reduction to an {e}-structure on the base (not only on the principal bundle) in the simpler case of so-called fiber-preserving transformations, namely point transformations leaving invariant the ``vertical'' foliation {x=ct.}. In the classical reference [], applying S. Lie's theory of differential invariants (cf. []) and S. Lie's group classification of second order differential equations, A. Tresse produces the complete list of differential invariants for each class of differential equation with fixed group, uneder general point transformations. To the autor's knowledge, the complete confirmation of A. Tresse's results by means of É. Cartan's method has never been achieved, possibly because the computations are much harder than in S. Lie's theory; even a complete modern rewriting of A. Tresse's thesis would require a substantial amount of work.
In sum, we would like to point out that for just characterizing the flat equation YXX=0, S. Lie's original proof in [] is, from the point of view of the size of computations, much shorter than the reduction to an {e}-structure through É. Cartan's method of equivalence. In the references [], [], [], most straightforward intermediate computations for the reduction to an {e}-structure are essentially left to the reader (as well as in most of É. Cartan's works), but they are consequent.
On the contrary, in this paper, since we want to provide two generalizations of S. Lie's Theorem 1.2, we shall carefully detail each intermediate computational step, seeking first the combinatorics of the formal calculations in the case m=1 and devising then the underlying combinatorics for the case m³ 2. Actually, the size of differential expressions is relatively impressive, as will become clear soon.
| yxx1(x) =F1 | ( | x, y(x), yx(x) | ) | , ... ..., yxxm(x) =Fm | ( | x, y(x), yx(x) | ) | (1.6) |
Our first main theorem provides the generalization of S. Lie's theorem to the case of m³ 2 dependent variables. Before stating it, we would like to mention that, throughout this article, we shall not adopt the summation convention. Indeed, from our point of view, it is more convenient to see explicitely the classical summation symbol å when dealing with rather massive expressions, because it helps to see clear differences between apparently similar terms. (However, the reader used to the summation convention may well read the identities by dropping the sums, looking at repetitions of indices.) Also, we always put commas between the indices, to prevent ambiguities like: ``does 11 mean ``one-one'' or ``eleven''?''; finally, a partial differentiation of an indexed quantity is always appended in index notation, also separated from the indices by a comma: for instance Ll1, l3,y l2j denotes ¶ Ll1, l3j/ ¶ y l2.Theorem 1.7 Suppose m³ 2. A local system of m second order ordinary differential equations yxxj=Fj(x,y,yx), j=1,..., m, is equivalent under an invertible point transformation (x,y)|® (X(x,y), Y(x,y)) to the free particle system YXXj=0, j=1,...,m, if and only if the following two conditions are satisfied:
| yxxj= Gj+ |
|
yxl1 Hl1j+ |
|
|
yxl1 yxl2 Ll1,l2j+yxj· |
|
|
yxl1 yxl2 Ml1,l2. (1.8) |
| ì
í î |
0= -2 Gyl1j+ Hl1,xj+ 2 dl1j Gyl2l2 -dl1j Hl2, xl2+ + 2 |
|
Gk Ll1,kj-2 dl1j |
|
Gk Ll2,kl2+ + |
|
dl1j |
|
Hl2k Hkl2- |
|
|
Hl1k Hkj, | (I) |
| ì
í î |
0 = Ll1,l2,xj- |
|
Hl1,yl2j- |
|
dl1j Ll2,l2,xl2- |
|
dl2j Ll1,l1,xl1+ |
|
dl1j Hl2,yl2l2+ + |
|
dl2j Hl1,yl1l1+ Gj Ml1,l2- |
|
dl1j Gl2 Ml2,l2- |
|
dl2j Gl1 Ml1,l1+ + |
|
dl1j |
|
Gk Ml2,k- |
|
dl2j |
|
Gk Ml1,k- - |
|
|
Hkj Ll1,l2k + |
|
|
Hl1k Ll2, kj+ + dl1j | æ
ç ç è |
|
|
Hkl2 Ll2, l2k- |
|
|
Hl2k Ll2, kl2 | ö
÷ ÷ ø |
+ + dl2j | æ
ç ç è |
|
|
Hkl1 Ll1,l1k - |
|
|
Hl1k Ll1, kl1 | ö
÷ ÷ ø |
, | (II) |
| ì
í î |
0 = Ll1,l2, yl3j- Ll1,l3, y l2j+ dl3j Ml1,l2,x- dl2j Ml1, l3,x+ + |
|
Hl3j Ml1, l2- |
|
Hl2j Ml1, l3+ + |
|
dl1j |
|
Hl3k Ml2, k- |
|
dl1j |
|
Hl2k Ml3, k+ + |
|
dl3j |
|
Hl1k Ml2, k- |
|
dl2j |
|
Hl1k Ml3, k+ + |
|
Ll1, l3k Ll2, kj- |
|
Ll1, l2k Ll3, kj, | (III) |
| ì
í î |
0= Ml1,l2, yl3- Ml1,l3, yl2- |
|
Ll1,l2k Ml3, k+ |
|
Ll1,l3k Ml2,k, | (IV) |
Of course, the form of the right hand side in 1.8 is the analog
of the form of the right hand side in 1.3 of S. Lie's theorem (however,
we notice that the right hand side of 1.8 is not the most general
degree three polynomial in the variables
yxj,
j=1,...,m: some coefficients of the cubic terms vanish).
On the contrary, whereas the system satisfied by the functions G,
H, L and M was of second order in S. Lie's Theorem
1.2, for m³ 2, the system satisfied
by the functions
Gj, Hl1j,
Ll1,l2j
and Ml1, l2
is of first order.
We mention that we recover the main theorem of [] in the linear case where Fj := G0j(x)+ ål=1m yl G1,lj(x)+ål1=1m yxl1 Hl1j(x): putting this expression in the system (I) (the three others vanish identically), one recovers the necessary and sufficient condition discovered in [] for local flatness of linear systems. We also mention that in [], the parametric computations are achieved after restriction to the identity of the (prolonged) (prolonged) G-structure, which lightens substantially the computations. The vanishing of the two tensors P ij and S iklj at the identity of the structure group, namely, as computed in Lemma 4.1 of [], yields (translating into our notation)
| ì
í î |
0 = | ( Siklj) | \vert | Id= Fyxi yxkyxlj- |
|
|
|
ds(l)j Fyxl1yxs(i)yxs(k)l1,0 = | ( Pij) | \vert | Id= |
|
D | ( | Fyxij | ) | - Fyij- |
|
|
Fyxkj Fyxik- - |
|
dij | é
ê ê ë |
|
D | æ
ç ç è |
|
Fyxkk | ö
÷ ÷ ø |
- |
|
Fykk- |
|
|
|
Fyxkl Fyxlk | ù
ú ú û |
, | (1.9) |
Finally, even if the expressions 1.9 are more compact than the (equivalent) conditions in Theorem 1.7, we prefer the expressions of Theorem 1.7, since they are more explicit. If the reader prefers compact expressions and ``short'' theorems, (s)he may replace the conditions of Theorem 1.7 by 1.9.
| yxj1xj2(x) = Fj1, j2 | ( | x, y(x), yx1(x),...,yxn(x) | ) | , j1,j2= 1,... n, (1.11) |
| Dxj3 | ( | Fj1,j2 | ) | =Dxj2 | ( | Fj1,j3 | ) | , (1.12) |
| Dxj:= |
|
+ yxj |
|
+ |
|
Fj,l |
|
. (1.13) |
In suitable local holomorphic coordinates (z,w)=(z1,...,zn, w)ÎCn+1, such a real analytic hypersurface passing through the origin may be represented locally as the set of (z,w)Î Cn+1 satisfying a holomorphic graphed equation of the form
| w= |
|
(z, z, w), (1.15) |
| w º |
|
(z, z , Q( z, z, w)), (1.16) |
| {(z,w)Î Cn+1: w- |
|
(z,z, x)=0} (1.17) |
| wzk= |
|
zk(z,z, x). (1.18) |
| (z,x) | æ
è |
|
(0, z,x) , |
|
z1(0, z,x),......, |
|
zk(0,z,x) | ö
ø |
ÎCn+1 (1.19) |
| ì
í î |
wzj1zj2 = |
|
zj1zj2( z, z, x) = |
|
zj1zj2 | ( | z, Y(z, w, wz) | ) | =: Fj1, j2(z, w, wz). | (1.21) |
The equivalence method for Levi-nondegenerate hypersurfaces in C2 has been considered by É. Cartan in part II of []. In fact, immediately after he discovered the observation of B. Segre that a second order ordinary differential equation may be associated to a real analytic hypersurface in C2, É. Cartan, who knew perfectly S. Lie's and A. Tresse's works on differential equations, started his memoir on pseudo-conformal invariants of hypersurfaces in C2. Later, in 1974, S.-S. Chern (a student of É. Cartan) jointly with J.K. Moser studied in [] the equivalence method for Levi nondegenerate hypersurfaces in Cn+1 for n³ 2. In 1975, with slight modifications, S.-S. Chern applied in [] the equivalence method for complete, completely integrable systems of partial differential equations of the form 1.21, coming from a hypersurface. As observed in [], not all systems of the form 1.11 come from a real analytic hypersurface, but the reduction to an {e}-structure achieved by S.-S. Chern in [] is valid, without almost any modification, for all systems of the general form 1.11, cf. also [] and []. It is important to emphasize that S.-S. Chern's computations have never been achieved in a parametric way, though there has been a vivid continuation of S.-S. Chern and J.K. Moser's work on real analytic hypersurfaces (cf. for instance [], [], [], [] and the references therein).
Recently, S. Neut implemented in [] a general Maple program for the É. Cartan equivalence algorithm. The program takes a differential system as input, the appropriate G-structure (which depends on the chosen class of transformations: fiber preserving, point, contact, Bäcklund, etc.) and it provides an associated {e}-structure together with all relations between the tensors appearing in the final structure equations. The main fruit of this program is the characterization of differential systems for which all invariant tensors on the {e}-structure are constant, hence having in most cases a symmetry group of maximal possible dimension. For the time being, the program does not incorporate the discussion of the relations between invariants in the case of lower dimensional symmetry groups, as is done for instance in []. In the case n=2, this program has been applied to the system 1.11. After three hours of Maple computations, the {e}-structure obtained in a non-parametric way by S.-S. Chern in [] is obtained parametrically by the computer machine (with slightly different normalizations) together will all covariant differential relations between the tensors, whose storage costs 1.1 Mo of memory; one gets that the differential algebra generated by the tensors is generated by a single tensor, over a family of forty eight. The vanishing of this tensor yields the following linear system of second order partial differential equations satisfied by the right members Fj1,j2(x,y,yx), extracted from [] and []:
| ì
í î |
0 = |
|
,0 = |
|
,0 = |
|
- |
|
,0 = |
|
- |
|
,0 = |
|
-4 |
|
+ |
|
. | (1.22) |
Our second main theorem treats the general case n³ 2 by means of hand computations and following the strategy of S. Lie, cf. []. Since the proof resembles a lot to the proof of Theorem 1.7, we shall not write down the details. We would like to mention that C. Bièche also obtained recently in [] a complete proof of this theorem by computing explicitely some (and sufficiently many) of the tensors of S.-S. Chern. But of course, she does not compute all the tensors explicitely, which does the computer program in the case n=2. Finally, we mention that for general n³ 2, the only if part of Theorem 1.23 just below was established in [], [] (in a slightly different form) and that the ``if'' part was stated there as an open problem.Theorem 1.23 (n=2: [] []; general n³ 2: [], []) Suppose n³ 2. The above system 1 is equivalent to the system YXj1Xj2=0, j1,j2 =1,...,n if and only if there exist arbitrary functions Gj1,j2, Hj1,j2k1, Lj1k1 and Mk1 of the variables (x1,...,xn,y) for 1£ j1,j2,k1£ n satisfying (of course!) the two symmetry conditions Gj1,j2=Gj2,j1 and Hj1,j2k1=Hj2,j1k1, such that the equation 1.11 is of the specific cubic polynomial form
| ì
í î |
yxj1xj2= Gj1,j2+ |
|
yxk1 | æ
ç ç è |
Hj1,j2k1 + |
|
yxj1 Lj2k1+ |
|
yxj2 Lj1k1 + yxj1yxj2 Mk1 | ö
÷ ÷ ø |
, | (1.24) |
Again, the explicit form of the right hand side of 1.24 is the analog
of the form of the right hand side of 1.3 in S. Lie's Theorem 1.2;
however, we again notice that the right hand side of 1.24 is not
the most general degree three polynomial in the variables yxj.
Apparently, the statement seems to be much simpler (and perhaps mysterious
or maybe false!) than the statement of Theorem 1.7 above, and even simpler
than S. Lie's Theorem 1.2 in the case n=1, because the analog of
conditions (ii) there do not appear in Theorem 1.23. However, by
generalizing S. Lie's computations for the proof of Theorem 1.2, we shall
see that there exists in fact a system of second order partial
differential equations satisfied by the functions Gj1,j2,
Hj1,j2k1,
Lj2k1
and Mk1
which is the combinatorial counterpart of the second order system appearing
in (ii) of Theorem 1.2. By a strange phenomenon, this system of
second order partial differential equations is in fact a consequence of
the compatibility conditions 1.12. A similar phenomenon also holds
for Theorem 1.7: there also exists a system of second order partial
differential equations satisfied by the functions Gj,
Hl1j,
Ll1,l2j
and Ml1,l2
which is the combinatorial counterpart of the second order system appearing
in (ii) of Theorem 1.2 and which is a consequence of the four families
of first order partial differential equations (I), (II),
(III)
and (IV).
Hence to see explicitely what is the analog of (I), (II), (III) and (IV) in Theorem 1.23, we must develope the compatibility conditions 1.12, in the case where the right hand sides Fj1,j2 are given by the cubic polynomial 1.24. After some nontrivial manual work, we obtain the equation 1.12 in length:
| 0 = Gj1,j2, xj3- Gj1,j3, xj2+ |
|
Hj1,j2k1 Gk1, j3- |
|
Hj1, j3k1 Gk1, j2+ (1.25) |
| + |
|
yxk1 | é
ê ê ë |
dj3k1 Gj1,j2, y- dj2k1 Gj1,j3, y+ Hj1, j2, xj3k1- Hj1, j3, xj2k1+ + |
|
Gj1, j3 Lj2k1- |
|
Gj1, j2 Lj3k1+ + |
|
dj1k1 |
|
Gk2, j3 Lj2k2- |
|
dj1k1 |
|
Gk2,j2 Lj3k2+ + |
|
dj2k1 |
|
Gk2, j3 Lj1k2- |
|
dj3k1 |
|
Gk2,j2 Lj1k2+ + |
|
Hk2, j3k1 Hj1, j2k2- |
|
Hk2, j2k1 Hj1, j3k2 | ù
ú ú û |
+ |
| + |
|
|
yxk1 yxk2 | é
ê ê ë |
dj3k2 Hj1, j2, y- dj2k2 Hj1, j3, yk1+ |
|
dj2k2 Lj1, xj3k1+ |
|
dj1k2 Lj2, xj3k1- - |
|
dj3k2 Lj1, xj2k1- |
|
dj1k2 Lj3, xj2k1+ + dj2k2 Gj1, j3 Mk1- dj3k2 Gj1, j2 Mk1+ + dj1,j2k1,k2 |
|
Gk3, j3 Mk3 - dj1, j3k1, k2 |
|
Gk3, j2 Mk3+ + |
|
dj1k1 |
|
Hk3, j3k2 Lj2k3 - |
|
dj1k1 |
|
Hk3, j2k2 Lj3k3+ + |
|
dj2k1 |
|
Hk3, j3k2 Lj1k3- |
|
dj3k1 |
|
Hk3, j2k2 Lj1k3+ + |
|
dj3k1 |
|
Hj1, j2k3 Lk3k2- |
|
dj2k1 |
|
Hj1, j3k3 Lk3k2 | ù
ú ú û |
+ |
| + |
|
|
|
yxk1 yxk2 yxk3 | é
ê ê ë |
|
dj3, j1k3, k2 Lj2, yk1- |
|
dj2, j1k3, k2 Lj3, yk1+ + dj2, j1k3, k2 Mxj3k1- dj3, j1k3, k2 Mxj2k1+ + dj2, j1k3, k1 |
|
Hk4, j3k2 Mk4- - dj3, j1k3, k1 |
|
Hk4, j2k2 Mk4+ + |
|
dj1, j3k1, k3 |
|
Lk4k2 Lj2k4- - |
|
dj1, j2k1, k3 |
|
Lk4k2 Lj3k4 | ù
ú ú û |
. |
If M is a local real analytic hypersurface of Cn defined by an equation r(z, z) = 0, if pÎ M, the order of contact of M with holomorphic curves at p (defined according to De Angelo) is the sup over all local holomorphic curves f : C ® Cn with f(0) =p of the quotient: order0 (r ° f)/ order0 (f). This number is called the type of M at p and is denoted by D(M, p).
Being independent of the choice of a defining function, this concept has nonetheless some defects. The type is neither a upper nor a lower semi-continuous function of p, whereas good numerical invariants about analytico-geometrical (possibly singular) objects should, as usual, be upper semicontinuous in one or the other sense. Fortunately, De Angelo was able to prove that finiteness of the type at a point entails finteness of the type at every nearby point, even in the C¥ realm.
But the main flaw of this definition is that the type is uncomputable, except in very particular specially cooked examples. This is unavoidable, since the quantification is made over the infinite family of all local complex curves passing through p, which is a huge family. Consequently, this definition may perhaps be meaningful and useful in the realm of pure, abstract functional analysis, but definitely not in the realm of concrete, intuitive geometry. Most of all, as the finiteness of the type is known to be equivalent to the nonexistence of complex curves lying inside M, a good definition of type should provide an algorithmic mean of deciding whether there exist complex curves sitting in an arbitrary real analytic susbset.
My purpose is to provide two new and different constructive algorithms. The first one follows by a special application of the so-called Cartan-Kähler algorithm, in the vector field version restituted by E. Vessiot in 1924. In short, considering the system of CR vector fields L tangent to a generic submanifold, this (quite general) algorithm enable ones to chase all the subsystems L' Ì L having the Frobenius property, hence which yield a foliation of M by complex submanifolds. The general solution usually depends on a certain computable number of functions, whose number of variables is also computable. This algorithm works at a Zariski-generic point, because some explicit functional determinants have to be nonvanishing. In particular, under the assumption that there are no complex curves lying inside, thanks to a stratification of the singular lower dimensional locus at each step, one is able, after a finite number of steps organized along the branches of a finite tree, to conclude, in a universally valid algorithmic manner, that complex curves lying inside do not exist. More generally, the Cartan-Vessiot-Kähler algorithm enables one also to find complex submanifolds and complex subfoliations of maximal dimension.
The second algorithm stems from a slight modification of S.M. Webster's
celebrated 1978 geometric construction for the reflection principle. Let
M be a real analytic subset of
Cn.
After stratification, restriction to intrinsic complexification and localization,
M is generic in Cn.
Consider the affine Grassmannian of all complex lines passing through all
points p Î Cn
as a new C n1,
in some suitable chart. Consider the set of all points p Î
M together with all complex lines passing passing through p
which are tangent to
M at p. The difference with S.M. Webster's
construction is that one does not take whole the complex tangent planes
TpcM, and the reason
is quite simple: if there exists a complex curve lying inside
M
passing through a point p, its tangent complex line at p
is of course contained in TpcM,
but one does not know in which direction exactly it is contained in
TpcM. This is why one has
to consider all possible directions, namely all possible complex lines
passing through p and contained in TpcM.
However, for the reflection principle, it is sufficient to gather all complex
tangent directions at once and to consider the map p |®
(p, TpcM) (S.M.
Webster's 1978 version, in fact equivalent to S. Pinchuk's 1975 analytical
computations) or more generally the maps of k-th jets of Segre varieties
(Diederich-Webster 1980). In the same appropriate chart, the set of points
(p, p), where pÎ
M and p is an arbitrary complex
line in TpcM, provides
a real submanifold
M1 of Cn1.
Every local complex curve inside M lifts to
M1.Theorem
5.1 A real analytic subset M of Cn
does not contain complex curves if and only if:
Loop algorithm:
Stratify, choose a stratum, restrict to intrinsic complexification,
localize at every point.
Construct the Grassmanian of complex tangent lines, gather all charts,
pick up a chart, construct the lifted submanifold.
After a finite number of steps:
Get a finite tree of successive Grassmannian blowing-ups.
Each final leaf of the tree is a real analytic generic submanifold NjÌ C nj,j=1, ..., Nj, equipped with a holomorphic projection map pj : Nj ® C nj such that
|
pj | ( | Nj | ) | = M. |
Structure of the Nj's: each Nj is foliated by complex manifolds of dimension mj ³ 1 [unavoidable, except if the CR dimension of the original M is equal to 1], every of which is mapped to a single point of M by pj and most importantly, each Nj is transversally maximally real, in the sense that at every point pj Î Nj, the complex tangent space T pjc Nj is completely absorbed by the ``vertical'' complex foliation.
The inexistence of a local complex curve inside M is therefore
obviously seen, since, if it existed, an open part of it would lift to
at least one Nj, yielding a local
complex submanifold
Aj of Nj
not contained a single leaf of the vertical complex foliation, which contradicts
the transversal maximal reality of
Nj.
Even if the Cartan-Vessiot-Kähler algorithm does not proceed in
a way strictly equivalent to the second algorithm, there must exist deep
links between the two algorithms, and this deserves to be well understood.
Applications of this geometric characterization could be expected (even if everything is up to know rather unclear), for instance for the study of optimal regularity of the solutions of the ¶ operator in general pseudoconvex domains of finite type in Cn, or for the study of cluster sets of families of complex analytic sets along real analytic subsets.
Je dois ajouter que j'avais avant tout une motivation scientifique :
trouver une démonstration plus simple que celle que j'avais indiquée
à S. Damour et qui couvre aussi le théorème original
dû à S.M. Baouendi, H. Jacobowitz et F. Treves ; ces derniers
ne supposaient pas la variété générique source
minimale. En utilisant la déformation normale des disques analytiques,
j'ai élaboré une démonstration courte d'un théorème
qui unifie vraiment tous les résultats connus dans cette direction.
The analyticity of local C¥-smooth CR diffeomorphims between two essentially finite generic real analytic submanifolds of Cn is established in [], as a kind reflection principle, provided that all the components of the CR diffeomorphism extend holomorphically to a fixed wedge. In [], [] and more recently in [], [], [], [] (cf. also the applications [], []), the CR diffeomorphism assumption has been weakened: instead, it is assumed that the so-called characteristic variety is zero-dimensional at the central point. However, it is always assumed that the source generic submanifold is minimal at the central point, whereas, in [], no minimality assumption was needed. This modest note is devoted to fill the gap between these two trends of thought, applying the technique of normal deformations of analytic discs introduced in [].
We consider a C¥-smooth local CR mapping between two local generic submanifolds M in Cn and M' in Cn', defined precisely as follows (background material may be found in [], []).Définition 1.2 A local C¥-smooth CR mapping consists of the following data:
| h | ( | MÇ Dn(r2) | ) | Ì M'ÇDn''(r2'). (1.5) |
By [] (and also []), after shrinking (if necessary) r1>0
and
r2>0 with
0< r2<
r1:
As in [], it will be assumed that:
| é
ë |
|
brj''(t', |
|
) | ù
û |
|
=0, for all j'=1,...,d' and all bÎNm. (1.8) |
In the version of Theorem 1.9 published in [], [], it is assumed
that M is minimal at p0,
which entails the holomorphic extendability assumption (V), thanks
to []. In [], [], a crucial proposition about envelopes of meromorphy (same
statement and same proof in the two references, modulo changes of notations),
relying on subtle geometric arguments which stem from the theory of deformations
of analytic discs developed in [], [], [] is applied. In this note, the
purpose is to clean up and to simplify these geometric arguments, by means
of the propagation of wedge extendability theorem established in [], []
(cf. [] for a preliminary version). The stronger Theorem 1.9 will
be established thanks to this change of geometric point of view. An elementary
lemma applies to recover from Theorem 1.9 the main result of [], [].Lemme
1.11 Let h: M ® M' be
a local C¥-smooth
CR mapping between two real analytic local generic submanifolds of Cn
and of
C n'. Assume that M is minimal
at p0, so that O
CR (M, p0) contains M Ç
Dn (r2)
for some
r2
>0 and so that (thanks to []) after perhaps shrinking r2>0,
the assumption (V) holds. If h is essentially finite at p0,
then there exist points q0 ÎO
CR (M, p0)Ç
Dn (r2)
arbitrarily close to p0 at which h is real
analytic.
Finally, in order to recover the main result of [], remind that
the essential finiteness of M' at p0'
together with the CR diffeomorphism assumption entails the essential finiteness
of h at p0 ([], Lemma 4.1;
a more general version is Corollary 1.3 in []; the most general version
appears as Theorem 4.3.1 (3) in [], in which it is shown that CR-transversality
of h at p0 together with
essential finiteness of M' at p0'
implies that h is essentially finite at p0).
In [], it is observed that essential finiteness of a hypersurface M
at one of its points p0 implies
its minimality (finite type in the sense of Lie-Chow-Kohn-Bloom-Graham)
at p0.Lemme 1.12
Let M' be a local generic submanifold of C n'
passing through a point p0' which is essentially
finite at p0'. Then dimR
O CR (M',
p0') ³
2 CRdim M' + 1 and the CR orbit O
CR (M', p0') itself is essentially
finite at p0'.
Assume that n=n' and that h is a CR diffeomorphism.
Then there exists a Zariski-dense open subset of points q0'
Î OCR
(M', p0') at which M'
is finitely nondegenerate. It follows that h itself is finitely
nondegenerate at q0 := h
-1 (p0), and by an
application a known result ([], [], [], []), h is real analytic
at q0.Corollaire 1.13
([]) Let h: M ® M' be a local C¥-smooth
CR mapping which is a CR diffeomorphism. If the components of h extend
holomorphically to a wedge at p0, then
h is real analytic at p0.
Further applications (in the spirit of [], []) that may be stated
are left to the interested reader. The remainder of this note is devoted
to the proofs of Theorem 1.9, of Lemma 1.11 and of Lemma 1.12.
| C ij0 = C ij0 | æ
ç ç è |
ga b (x), |
|
(x), |
|
(x) | ö
÷ ÷ ø |
| Eij := µ | æ
ç ç è |
Aij - |
|
dij A | ö
÷ ÷ ø |
+ l dij |
À partir d'une lecture directe du mémoire de 1922, nous
reconstituons les raisonnements originaux d'Élie Cartan sous une
forme complète et accessible.
En 1922, dans un mémoire souvent cité mais resté
difficile d'accès1,
Élie Cartan démontrait que le tenseur
Eij,
construit par Einstein en 1916 et apparaissant dans le membre géométrique
des équations E ij
= -T ij de la gravitation2,
était essentiellement unique (voir le Théorème
1.85 ci-dessous ou le Résumé
ci-dessus). Ce résultat fondamental d'Élie Cartan s'effectuait
par la synthèse entre trois théories :
La première, la <<méthode d'équivalence>>, fut inventée et appliquée par Élie Cartan dans les années 1902--1910, peu après qu'il eut édifié la théorie des formes différentielles, au cours de ses recherches sur les groupes de Lie de dimension infinie. Grâce au langage des formes différentielles, Élie Cartan fut à même de résoudre un problème de classification laissé en chantier par son maître Sophus Lie, à savoir la classification de tous les groupes de Lie de dimension infinie qui agissent localement sur un espace complexe de dimension deux3. C'était là la première application imposante d'une méthode que le jeune Élie Cartan, alors Maître de Conférences à la Faculté des Sciences de Lyon, ébauchait dès 1902 dans une Note aux Comptes Rendus de l'Académie des Sciences ([]).
Malheureusement, à cause de leur ampleur et de leur réelle complexité, les détails exacts de ces résultats de classification complète sont restés méconnus. Dans de nombreux autres mémoires, Élie Cartan applique la méthode d'équivalence à des problèmes géométriques variés : groupes infinis simples, déformation projective des surfaces, systèmes de Pfaff à cinq variables, transformations de contact, transformations de Bäcklund, etc. Malgré cette richesse, à l'époque moderne, seule une partie de ces travaux a été lue, comprise et assimilée en profondeur. À partir de la seconde moitié du vingtième siècle, le mouvement (post)bourbachique ayant orienté l'intérêt des jeunes générations de mathématiciens vers des thématiques émergentes, telles que la géométrie algébrique, l'étude globale des variétés, les systèmes dynamiques, etc., la connaissance de l'héritage mathématique d'Élie Cartan -- et notamment de la méthode d'équivalence -- souffre de certaines lacunes en France.
Cette situation est regrettable, car l'approche d'Élie Cartan achève et parfait une profonde synthèse, illustration de l'unité indissoluble des mathématiques, entre deux points de vue : la théorie des objets géométrico-différentiels et la théorie des groupes continus de tranformation, appelés aujourd'hui groupes de Lie. Toute l'oeuvre d'Élie Cartan s'enracine dans la théorie des groupes continus de transformation4, qui fut fondée par Sophus Lie dans les années 1873--1880.
Au début des années 1920, Élie Cartan transférait la méthode d'équivalence à la théorie des espaces de Riemann, et ce faisant, il en tirait une application spectaculaire à la relativité générale : l'unicité du tenseur d'Einstein, ainsi que la décomposition du tenseur de courbure de Riemann-Christoffel en trois composantes irréductibles. À nouveau, dans le mémoire [] ainsi que dans d'autres mémoires rédigés à la même période, les détails techniques étaient complexes et difficiles d'accès. Hermann Weyl lui-même reconnaissait n'avoir pas saisi la totalité des raisonnements qui conduisaient Élie Cartan à établir l'unicité du tenseur d'Einstein.
En nous aidant de présentations modernisées de la méthode d'équivalence ([], [], [], []), nous nous proposons de reprendre et de développer les raisonnements elliptiques d'Élie Cartan, à partir d'une lecture directe du mémoire de 1922. Pour ce faire, nous devrons faire preuve d'un effort de formulation conceptuelle et d'un effort de présentation pour rendre accessibles les démonstrations techniques. Ce faisant, nous serons conduits à réexprimer des résultats connus.
Avant de formuler précisément le théorème d'unicité du tenseur d'Einstein, présentons un bref aperçu historique du concept de courbure en géométrie riemannienne.
| dx:= dx1 · |
|
+ ··· +dxn · |
|
, (1.2) |
| ds2 = |
|
gij(x) dxi dxj, (1.3) |
Comme le lecteur l'aura remarqué, nous n'avons pas adopté la convention d'Einstein dans l'écriture de 1.3 (lire aussi le §3.1 ci-dessous). Dans la suite, nous maintiendrons toujours les signes de sommation dans l'écriture de nos formules. La raison principale est la suivante : à partir de la Section 2, un paramètre i = ± 1, indexé par i= 1, ..., n, entrera dans l'écriture de nos formes différentielles, lesquelles incorporeront aussi l'indice i, ainsi que d'autres indices j, k, ... répétés, mais il n'y aura pas (la plupart du temps) de sommation sur cet indice i. Il deviendrait inélégant et pesant d'avoir à préciser au cas par cas si l'on doit sommer sur l'indice i répété. Par exemple, dans la formule 2.5 ci-dessous, où l'indice i de i est répété, on doit sommer sur i, tandis que dans la formule 3.15 ci-dessous, où l'indice i de i est aussi répété, on ne doit pas sommer sur i.
Ce n'est que dans cette Section 1 que nous pourrions adopter la convention
d'Einstein. En effet, nous présentons des concepts classiques de
calcul tensoriel pour lesquels cette convention a amplement fait ses preuves.
Cependant, pour des raisons de cohérence globale, nous maintiendrons
partout les signes de sommation. Ainsi, le lecteur qui a adopté
ladite convention reconnaîtra simplement les formules habituelles
de géométrie riemannienne, s'il fait l'élision des
signes S. Du reste, ces signes ne tiennent pas
une place considérable dans l'écriture des formules et ils
ont la vertu de signaler directement à la lecture quels sont les
indices sur lesquels on doit sommer, sans avoir à repérer
préalablement la répétition de ces indices. Il est
vrai que sur des formules relativement simples comme 1.3 ci-dessus
ou encore 1.25 ci-dessous, le repérage des indices répétés
se fait rapidement. Par contre, dans des formules comme 7. incorporant
huit répétitions d'indices qui n'ont pas de dénomination
homogène simple (par exemple j1,
j2, j3,
j4,
j5, j6,
j7, j8),
le repérage des indices répétés demande un
long travail de lecture. Dans un tel cas de figure, sur le plan pratique,
le maintien des signes de sommation présente des avantages indéniables.
La méthode du repère mobile, introduite par Ribaucour, Frenet, Serret puis systématisée par Darboux à la fin du dix-neuvième siècle, consiste à attacher un système d'axes variables ou de vecteurs <<mobiles>> à tout objet géométrico-différentiel, afin d'en étudier les propriétés qui sont invariantes par rapport à un groupe de transformations, par exemple le groupe des déplacements euclidiens. Dans son oeuvre, Élie Cartan l'a poussée si loin qu'aujourd'hui encore, seule une partie de ses travaux a été relue, comprise et assimilée. Cette <<méthode>> en quelque sorte implicite dans les calculs de Gauss, permet d'étudier très progressivement (et sans éprouver l'impression de s'égarer dans des calculs interminables) la géométrie intrinsèque d'une surface <<gaussienne>>, équipée d'une métrique de la forme :
| ì
ï ï í ï ï î |
k = |
|
ì
ï ï í ï ï î |
E | é
ê ê ê ê ê ë |
|
· |
|
- 2 |
|
· |
|
+ | æ
ç ç è |
|
ö
÷ ÷ ø |
|
ù
ú ú ú ú ú û |
+ | + | F | é
ê ê ë |
|
· |
|
- |
|
· |
|
-2 |
|
· |
|
+ 4 |
|
· |
|
- 2 |
|
· |
|
ù
ú ú û |
+ | G | é
ê ê ê ê ê ë |
|
· |
|
- 2 |
|
· |
|
+ | æ
ç ç è |
|
ö
÷ ÷ ø |
|
ù
ú ú ú ú ú û |
- - | 2 | ( | EG-F2 | ) | é
ê ê ë |
|
-2 |
|
+ |
|
ù
ú ú û |
ü
ý þ |
. | (1.5) |
Dans ce texte court publié à titre posthume en 1868 et qui révolutionna la géométrie, Riemann pose ab initio le problème de la nature des notions topologiques, des notions géométriques et des notions métriques de base grâce auxquelles on peut concevoir mathématiquement l'espace, sans entacher cette <<Idée problématique>> d'hypothèses implicites. En particulier, il propose de généraliser aux espaces à n dimension la notion de produit scalaire infinitésimal via la définition 1.3, qui généralise la définition 1.4 que Gauss avait prise pour fondement de l'étude intrinsèque des surfaces plongées dans l'espace tridimensionnel. Se posait alors la question de généraliser la notion de courbure en dimension n³ 3 et d'obtenir un analogue de la formula egregia 1.5. Pour cela, une stratégie d'économie aurait alors été la bienvenue, puisque les calculs de Gauss étaient déjà considérables en dimension n=2.
Or Riemann savait que la courbure de Gauss s'exprime de manière particulièrement simple dans un système de coordonnées dites <<géodésiques>>. Dans un tel système, le ds2 se réduit à la forme normalisée ds2 = du2+ G(u, v) dv2. Ici, u représente le rayon géodésique issu de l'origine et v représente l'angle que fait ce rayon à l'origine avec une géodésique fixe. Ainsi, on a G(u, 0) = G(u, 2p), et il faut considérer qu'une telle métrique est une déformation de la métrique euclidienne dr2 + r2 dq2, écrite en coordonnées polaires. Avant d'obtenir la formula egregia 1.5, Gauss avait démontré en 1822 l'existence de systèmes de coordonnées géodésiques pour toute surface plongée dans l'espace et il en déduisit la même année une expression intrinsèque pour la courbure. Évidemment, nous pouvons retrouver cette expression en appliquant la formule 1.5, que Gauss n'obtint que cinq années plus tard, en 1827, ce qui donne :
| k = |
|
ì
ï ï í ï ï î |
æ
ç ç è |
|
ö
÷ ÷ ø |
|
-2 G |
|
ü
ï ï ý ï ï þ |
= - |
|
|
. (1.7) |
| G(u, v) = u - |
|
k (0) u3 + o (u3), (1.8) |
Dans des travaux manuscrits non publiés -- difficiles à dater --, en partant de 1.7, Riemann généralise donc la notion de courbure aux variétés de dimension n³ 2 munies d'un ds2 général de la forme 1.3. Il se place dans un système de coordonnées appelé depuis <<coordonnées normales de Riemann>>, qui généralise le système de coordonnées géodésiques à la dimension quelconque n ³ 2. Dans un tel système de coordonnées, on a gij(0) = dji et ¶ g ij/ ¶ xk (0) =0, pour tous i, j, k= 1, ..., n (voir [], Chapter 4B). En effectuant un développement limité des coefficients g ij (x) à l'origine, on peut écrire :
| ì
í î |
ds2 (x) = |
|
g ij(x) dxi dxj = |
|
(dxi)2 + |
|
|
|
(0) xkxl dxi dxj + o ( x2). | (1.9) |
| ì
í î |
ds2(x) = |
|
(dxi)2 - - |
|
|
Aijkl | ( | xk dxi - xi dxk | ) | ( | xl dxj - xj dxl | ) | + o ( x2). | (1.10) |
Sept années plus tard, en 1861, Riemann soumet à l'Académie des Sciences de Paris un mémoire intitulé Commentatio mathematica qua respondere tentatur quæstioni ab illustrissima Academia Parisiensi propositæ7. Dans ce mémoire qui traite de l'équation de la chaleur, Riemann démontre rigoureusement que l'annulation des coefficients Aijkl est la condition nécessaire et suffisante pour que la variété riemannienne (M, ds2) soit localement isométrique à l'espace Rn, muni de la métrique euclidienne standard. Ce résultat généralisait le théorème de Gauss sur les surfaces de courbures nulles. Cet extrait du mémoire de 1861 est traduit en anglais et commenté par M. Spivak dans le Chapitre 4B de [].
En 1869, peu de temps après la publication posthume de l'habilitationsvortrag de 1854, le disciple de Riemann Erwin Bruno Christoffel entreprend le premier travail de classification des variétés riemanniennes à isométrie près (cf. []). Supposons donnée une isométrie x |® x = x (x) entre deux variétés riemanniennes (M, ds2) et ( M, d s2), c'est-à-dire une application qui transforme une métrique ds2 = åi, j=1n gi j(x) dxi dxj en une autre métrique d s2 = åi, j=1 n gi j( x) d xi d xj. Pour isoler les dérivées secondes des composantes d'une telle isométrie, pour exprimer les composantes de courbure riemannienne et pour calculer ce qu'on appelle (depuis l'article [] de Ricci et Levi-Civita) les dérivées covariantes du tenseur de Riemann, Christoffel choisit d'introduire la notation :
| ì
í î |
|
ü
ý þ |
:= |
|
|
gpk | æ
ç ç è |
|
gpj + |
|
gpi - |
|
gij | ö
÷ ÷ ø |
, (1.11) |
| Aijkl = |
|
gpl Aijkp, (1.12) |
| Aijkl := |
|
- |
|
+ |
|
æ
ç è |
ì
í î |
|
ü
ý þ |
ì
í î |
|
ü
ý þ |
- | ì
í î |
|
ü
ý þ |
ì
í î |
|
ü
ý þ |
ö
÷ ø |
. (1.13) |
Grâce à une telle expression des composantes de la courbure, Christoffel établit alors qu'une isométrie x|® x (x) induit la loi de transformation
|
Aijkl |
|
= |
|
|
|
|
|
a, b, gd (1.14) |
Ce rappel historique achevé, afin d'être en mesure d'exprimer rigoureusement le théorème d'unicité du tenseur d'Einstein dû à Élie Cartan, effectuons maintenant une brève présentation des concepts de géométrie différentielle riemannienne qui sont à la base des équations de la gravitation d'Einstein, tels qu'ils sont exposés dans la plupart des manuels contemporains.
Classiquement, une variété riemannienne M est canoniquement équipée d'une connexion Ñ, dite de Levi-Civita. C'est l'unique connexion de torsion nulle sur M qui soit compatible avec la métrique. Rappelons pour commencer les définitions de ces termes.
Tout d'abord, une connexion affine (au sens de Koszul) est un opérateur intrinsèque de dérivation d'un champ de vecteur le long d'un autre champ de vecteur. Pour être plus précis, désignons par X(M) l'ensemble des champs de vecteurs sur M : c'est un module sur l'algèbre Cw(M) des fonctions analytiques réelles sur M, i.e. on peut additionner les champs de vecteurs et les multiplier par des fonctions f Î Cw(M), avec des règles d'associativité et de distributivité évidentes. Une connexion affineÑ est une application qui à un couple de champs de vecteurs (X, Y) Î X (M) × X (M) associe un champ de vecteurs ÑX (Y) Î X (M), le <<dérivé de Y le long de X>>. Cette opération satisfait les propriétés suivantes :
| ÑX (Y) - ÑY (X) = | [ | X, Y | ] | , (1.16) |
Appliquons maintenant le principe d'après lequel tous les objets de la géométrie différentielle qui possèdent une définition indépendante du choix de coordonnées locales doivent aussi être saisis en coordonnées locales, sous une forme explicite et concrète. Soient donc (x1, x2, ..., xn) des coordonnées locales, soient X1 := ¶ /¶ x1, X2 := ¶ /¶ x2, ...Xn := ¶ /¶ xn les n champs de vecteurs <<naturels>> associés, qui forment un repère mobile. Grâce aux règles (c1), (c2) et (c3) ci-dessus, en décomposant les champs X et Y sous la forme X = å i=1n ai(x) · ¶ /¶ xi et Y = å i=1n bi(x) · ¶ /¶ xi, on vérifie aisément que la connaissance de l'expression ÑX (Y) se ramène à la connaissance des n2 champs de vecteurs Ñ Xi (Xj), que l'on peut décomposer le long de la base des Xk sous la forme
| Ñ Xi (Xj) =: |
|
Gijk (x) · |
|
, (1.17) |
|
ijk = |
|
|
|
|
|
|
Gi1 j1k1 + |
|
|
|
. (1.18) |
La règle de transformation 1.18 n'est pas de caractère tensoriel, puisque les dérivées secondes du changement de coordonnées interviennent dans le deuxième terme du membre de droite. Néanmoins, cette règle possède un caractère précis et une structure bien définie qui leur confèrent un statut indépendant du système de coordonnées.
Toute connexion affine définit de manière unique un transport parallèle le long des courbes tracées dans M, et ce transport parallèle permet de <<connecter>> les espaces tangents entre eux d'une manière intrinsèque, indépendante du choix de coordonnées locales. Mais il faut insister sur le fait que ce lien entre les espaces tangents dépend non seulement de la connexion choisie mais aussi de la courbe le long de laquelle on déplace parallèlement un vecteur tangent. Plus précisément, pour toute courbe analytique réelle g : [0, 1] ® M et tout vecteur Y0 tangent à M au point g (0), il existe une unique famille à un paramètre tÎ [0, 1] de vecteurs Y(t) tangents à M au point g (t) tels que Y(0)= Y0 et tels que la dérivée de Y(t) le long du vecteur tangent dg (t)/ dt s'annule identiquement, i.e.
| Ñ |
|
(Y(t)) º 0. (1.19) |
| 0 = |
|
+ |
|
|
Gijk bj |
|
, k=1, ..., n. (1.20) |
Soit maintenant (M, ds2) une variété riemannienne qui est aussi équipée d'une connexion Ñ. Plus généralement, si le produit scalaire <Y1, Y2 > = åi, j=1n gij(p) a1i a2j entre vecteurs tangents Y1 = åi=1n a1i Xi et Y= åi= 1n a2i Xi en un point pÎ M est seulement non-dégénéré, mais pas forcément défini positif, on dira que (M, ds2) est une variété pseudo-riemannienne. Tel est le cas, par exemple, dans l'espace de Minkowski équipé de la métrique -(dx1)2- (dx2)2 - (dx3)2 + (dx4)2.
La connexion Ñ est dite compatible avec la métrique si, pour tout point p Î M, pour toute courbe analytique réelle g : =[ 0, 1] ® M telle que g (0) =p et pour tout couple de vecteurs Y01 et Y02 tangents à M en p, le produit scalaire entre Y01 et Y02 au point g(0) possède la même valeur numérique que le produit scalaire entre les deux vecteurs Y11 et Y12 transportés parallèlement le long de g jusqu'au point g( 1). Autrement dit, le produit scalaire est invariant par transport parallèle.
En 1917, Levi-Civita a démontré qu'étant donné une variété riemannienne, il existe une unique connexion de torsion nulle qui est compatible avec la métrique. L'énoncé s'étend sans modification aux variétés pseudo-riemanniennes. En analysant ces deux conditions, on vérifie que les coefficients fondamentaux de cette unique connexion possèdent une expression explicite en fonction des dérivées partielles d'ordre 1 de la métrique :
| Gijk = |
|
|
gpk | æ
ç ç è |
|
gpj+ |
|
gpi- |
|
gij | ö
÷ ÷ ø |
. (1.21) |
| k |
| i j |
Montrons maintenant comment les coefficients de Christoffel d'une connexion linéaire peuvent servir à différentier des objets géométriques plus généraux que les champs de vecteurs : les tenseurs.
|
j1 ··· jq i1 ··· ip = |
|
|
|
· ··· · |
|
· |
|
· ··· · |
|
L j1' ··· jq' i1' ··· ip'. (1.23) |
La première opération, appelée contraction des indices, consiste à sommer sur des indices sélectionnés à l'avance. Par exemple, voici deux contractions possibles d'un tenseur Lj1 j2 i1 i2i3 : on sélectionne i1 en haut et j2 en bas et on définit Y j1 i2 i3 : = å p=1n Lj1 ppi2i3 ; autre possibilité, on sélectionne (i1, i3) en haut et (j1, j2) en bas et on définit F i2 := å p, q= 1n L pq pi2 q. En général, soit L j1··· jq i1 ··· ip un tenseur quelconque et soit r un entier positif tel que r£ et r£ q. Dans les indices inférieurs et dans les indices supérieurs du tenseur L j1··· jq i1 ··· ip, choisissons r indices et sommons sur ces indices. Le résultat fournit une quantité à (p-r) indices supérieurs et à (q- r) indices inférieurs. En effectuant les mêmes choix d'indices dans 1.23 et en observant que å p= 1n ¶ xi/¶ xp ¶ xp/¶ xj =dji, on vérifie que le résultat obtenu est effectivement un tenseur.
La seconde opération est une différentiation <<absolue>>, i.e. indépendante du système de coordonnée. En utilisant les coefficients de Christoffel d'une connexion linéaire quelconque Ñ, il est possible de définir des dérivées directionnelles d'un tenseur, qu'on appellera dérivées covariantes. Ces dérivées doivent fournir un résultat indépendant du système de coordonnées pour qu'il puisse être question d'un <<calcul différentiel absolu>>, au sens de Ricci et de Levi-Civita. Par exemple, si Li est un tenseur une fois contravariant, sa k-ième dérivée covariante sera définie par :
| Ñk | ( | Li | ) | := |
|
Li + |
|
G kli Ll. (1.24) |
| Ñk | ( | Lji | ) | := |
|
Lji - |
|
Gkjl Lli + |
|
G kli Ljl. (1.25) |
| ì
í î |
Ñk | ( | L j1 ··· jq i1 ··· ip | ) | := |
|
Lj1··· jq i1 ··· ip - |
|
( | Gkj1l L l··· jq i1··· ip - ··· - G k jql L j1 ··· li1 ··· ip | ) | + + |
|
( | G kl i1 L j1 ··· jq l··· ip + ··· + G kl ip L j1 ··· jq i1 ··· l | ) | . | (1.26) |
| g ij : = |
|
|
|
g i1 j1. (1.28) |
Appliquons la formule 1.26 pour la k-ième dérivée covariante de g ij, ce qui donne :
| Ñk | ( | g ij | ) | = |
|
g ij - |
|
( | G kil glj + G kjl g li | ) | . (1.29) |
| Ñk | ( | g ij | ) | = Ñk | ( | g ij | ) | = 0. (1.31) |
Proof.Admettons Ñk
( g ij )= 0 et appliquons
Ñk
à la relation fondamentale dji
= å p= 1n
gip
g
pj entre les deux matrices inverses (g
ij) et (g ij),
que l'on peut réécrire matriciellement nous obtenons
Ñk
( g ij ) = - å
p, q= 1n
g qi
Ñk(
g qp ) gpj.
Le tenseur métrique deux fois covariant g ij et son inverse g ij qui est deux fois contravariant peuvent servir à élever et à baisser les indices d'un tenseur donné L j1··· jq i1··· ip. Prenons par exemple un tenseur Lj une fois covariant. On vérifie aisément que le tenseur Li:= åp g pi Lp est une fois contravariant, et l'on a les formules inverses Lj = åp g pj Lp. Prenons maintenant un tenseur une fois covariant et une fois contravariant Lji. On vérifie que åp g pi Ljp définit un tenseur deux fois covariants en termes des indices i et j. Mais comment écrire ce tenseur : L ij ou L ji ? Faut-il mettre i ou j à la première place ? Par construction, c'est l'indice supérieur i que nous avons abaissé dans Lji. Convenons provisoirement d'écrire L ij. Pour retrouver le tenseur initial Lji par une formule inverse, il faut écrire åp g pi L pj et non pas åp g pj L pi, parce que c'était le premier indice de L ij qui avait été abaissé et non pas le second. En définitive, puisque la notation Lji devient ambiguë lorsque l'on élève et abaisse les indices, il est nécessaire de préciser l'ordre d'apparition des indices colonne par colonne. Ainsi, nous écrirons Lij (ou bien Lji : il faut faire un choix définitif au départ, mais tous les choix sont équivalents) en affectant chaque indice à une colonne, afin de conserver le numéro de colonne des indices que l'on élève ou que l'on abaisse. Dans la notation L ij, deux colonnes étant déjà clairement délimitées, on pourra déduire que L ij = åp g pi Lpj s'obtient à partir de Lij par abaissement du premier indice i. Par la même occasion, le tenseur Lji := åp g pi L jp, obtenu par élévation du second indice de L ji sera clairement distingué de Lij = åp g pi Lpj. Cette distinction, invisible dans la notation Lij, est absolument nécessaire, puisque les deux tenseurs Lji et Lij (évidememment égaux dans le cas spécial où le tenseur L jp = Lpj est symétrique) peuvent être réellement différents, comme on s'en convaincrait sur un exemple.
Pour terminer, mentionnons que la version mixte du tenseur de courbure gji := åp g pj g pi = dji coïncide avec le symbole de Kronecker et que dans ce cas, il est inutile de préciser les colonnes dans la notation des indices.
| { | A | ( | f1 X1 + f2 X2, Y | ) | Z = f1 A | ( | X1, Y | ) | Z + f2 A | ( | X2, Y | ) | Z,A | ( | X, f1Y1+ f2Y2 | ) | Z =f1 A | ( | X, Y1 | ) | Z+ f2 A | ( | X, Y2 | ) | Z,A(X, Y) | [ | f1 Z1+ f2 Z2 | ] | = f1 A(X, Y)Z1+ f2 A(X, Y2) Z2. | (1.34) |
| A(Xi, Xj) Xk =: |
|
Aijkl Xl. (1.35) |
En utilisant l'expression 1.17 de la dérivée covariante en l'insérant dans la définition 1.33 (bien entendu, le terme Ñ[Xi, Xj] Xk s'annule, puisque l'on a trivialement : [¶ /¶ xi, ¶/¶ xj]= 0), on obtient :
| Aijkl = |
|
Gikl - |
|
Gjkl + |
|
( | Gikp Gjpl - Gjkp Gipl | ) | . (1.36) |
|
l = |
|
|
|
|
|
|
|
|
Ai1j1k1l1. (1.37) |
Après un calcul dont nous ne reproduisons pas les étapes intermédiaires ici, nous obtenons une expression massive qu'il faut prendre comme telle, puisque nous analysons ses caractères immédiatement après :
| ì
í î |
Aijkl = |
|
|
g qm g pl | æ
ç ç è |
|
é
ê ê ë |
|
+ |
|
- |
|
ù
ú ú û |
ö
÷ ÷ ø |
- - |
|
|
g qm g pl | æ
ç ç è |
|
é
ê ê ë |
|
+ |
|
- |
|
ù
ú ú û |
ö
÷ ÷ ø |
+ + |
|
|
gml | æ
ç ç è |
|
- |
|
- |
|
+ |
|
ö
÷ ÷ ø |
++ |
|
|
g pm gql | æ
ç ç è |
é
ê ê ë |
|
+ |
|
- |
|
ù
ú ú û |
é
ê ê ë |
|
+ |
|
- |
|
ù
ú ú û |
- | - | é
ê ê ë |
|
+ |
|
- |
|
ù
ú ú û |
é
ê ê ë |
|
+ |
|
- |
|
ù
ú ú û |
ö
÷ ÷ ø |
. | (1.38) |
| ì
í î |
Aijkl (x) = Aijkl | æ
ç ç è |
ga b (x), |
|
(x), |
|
(x) | ö
÷ ÷ ø |
= Aijkl | ( | Jx2 gab (x) | ) | , | (1.39) |
Les composantes Aijkl satisfont les relations de symétrie suivantes :
| { | 0 = Aijkl+ Akijl+ Ajkil,0 = Aijkl+ Ajikl. | (1.40) |
Introduisons maintenant les composantes <<totalement covariantes>>
du tenseur de courbure, qui sont définies par :
| Aijkl := |
|
gpl Aijkp. (1.41) |
|
ijkl = |
|
|
|
|
|
|
|
|
Ai1j1k1l1. (1.42) |
| { | 0 = Aijkl+ Ajkil+ Akijl,0 = Aijkl+Ajikl,0 = Aijkl+Aijlk,0 = Aijkl-Aklij, | (1.43) |
| Ñm Aijkl := |
|
+ |
|
( | Gpml Aijkp - Gimp Apjkl - Gjmp Aipkl - Gkmp Aijpl | ) | (1.45) |
Classiquement, au moyen d'un calcul algébrique qui est parfois
présenté de manière <<aveugle>>, on démontre
que ce tenseur satisfait les identités suivantes, dites <<de
Bianchi>> :
Grâce à la méthode du repère mobile d'Élie Cartan, il est possible de comprendre pourquoi une telle permutation circulaire apparaît et d'interpréter cette identité de manière géométrique (voir []). Afin d'offrir au passage une idée intuitive de cette raison, mentionnons que l'identité de Bianchi provient d'une application particulière du Lemme de Poincaré d'après lequel d d w =0 pour toute forme différentielle. En effet, considérons une 2-forme différentielle exacte dw:= å i< j Lij ·dxi Ù dxj, différentielle d'une 1-forme w, et prolongeons la définition de ses coefficients en posant Lij = -Lji pour i ³ j. Après une réorganisation qui fait apparaître la base de 3-formes (dxiÙ dxj Ù dxk) 1£ i < j < k£ n, la différentielle extérieure de cette 2-forme dw s'écrit sous la forme suivante :
| 0 = d d w = |
|
dxi Ù dxj Ù dxk· | æ
ç ç è |
|
+ |
|
+ |
|
ö
÷ ÷ ø |
. (1.47) |
| 0 = |
|
+ |
|
+ |
|
, (1.48) |
| Aij:= |
|
Aikj | k = |
|
|
g kl A i kjl. (1.50) |
|
ij = |
|
|
|
|
A i1 j1. (1.51) |
En appliquant le principe d'élévation des indices que nous avons déjà utilisé en 1.41, définissons maintenant le tenseur de Ricci mixte, qui est une fois covariant et une fois contravariant :
| Ai | j := |
|
g pj Aip. (1.52) |
| A := |
|
g ij A ij. (1.53) |
| ì
í î |
A = |
|
g ij A ij = |
|
|
g ij Aipj | p = |
|
A ip | ip = |
|
A ijij. | (1.54) |
|
Ñj (Aij) = |
|
Ñi (A). (1.56) |
Autrement dit, le tenseur mixte d'Einstein
défini par
| Eij := Aij - |
|
dij A (1.57) |
Proof.Définissons les composantes deux fois covariantes et deux fois contravariantes du tenseur de courbure :
| ì
í î |
A ij | kl := |
|
gpk Aijp | l= |
|
g pk g ql A ijpq | (1.58) |
Pour établir 1., partons de l'identité de Bianchi
1. dans laquelle on remplace
k par p, multiplions par g
pk et sommons sur l'indice p, ce qui donne :
| 0 = |
|
( | g pk·Ñm | ( | Aijpl | ) | + g pk·Ñj | ( | Amipl | ) | + g pk ·Ñi | ( | Ajmpl | ) | ) | . (1.60) |
| 0 = Ñm | ( | A ijkl | ) | + Ñj | ( | A mikl | ) | + Ñi | ( | A jmkl | ) | . (1.61) |
| 0 = Ñm | æ
ç ç è |
|
Aijij | ö
÷ ÷ ø |
+ |
|
Ñj | æ
ç ç è |
|
A miij | ö
÷ ÷ ø |
+ |
|
Ñi | æ
ç ç è |
|
Ajm ij | ö
÷ ÷ ø |
. (1.62) |
| 0 = Ñm(A) - |
|
Ñj | ( | Amj | ) | - |
|
Ñi | ( | Ami | ) | . (1.63) |
|
Aij dxi dxj = |
|
|
ij d xi d xj (1.65) |
| ì
í î |
|
|
kl d xk d xl = |
|
|
|
Apq |
|
|
dxi dxj = |
|
Aij dxi dxj. | (1.66) |
| A ij | ( | J x2 gab | ) | = |
|
|
|
|
A i1 j1 | ( | Jx2 ga1 b1 | ) | , (1.68) |
| ì
í î |
|
= |
|
æ
ç ç è |
|
|
g a1 b1 + |
|
|
g a1 b1 | ö
÷ ÷ ø |
+ + |
|
|
|
|
|
. | (1.69) |
| J x2 |
|
= P | ( | J x3 x , Jx2 G | ) | . (1.70) |
|
C ij0 dxi dxj = |
|
C ij0 | æ
ç ç è |
ga b (x), |
|
(x), |
|
(x) | ö
÷ ÷ ø |
dxidxj (1.72) |
| ì
í î |
|
C ij0 | æ
ç ç è |
ga b (x), |
|
( x), |
|
( x) | ö
÷ ÷ ø |
d xi d xj = = |
|
C ij0 | æ
ç ç è |
ga b (x), |
|
(x), |
|
(x) | ö
÷ ÷ ø |
d xi d xj, | (1.73) |
| C ij0 | ( | J x2 gab | ) | = |
|
|
|
|
C i1 j10 | ( | Jx2 ga1 b1 | ) | , (1.74) |
| C ij0 | ( | P | ( | J x3 x, Jx2 G | ) | ) | = |
|
|
|
|
C i1 j10 | ( | Jx2 G | ) | , (1.75) |
Avant de formuler le théorème d'unicité d'Élie Cartan, évoquons rapidement les origines physiques des équations d'Einstein.
Quels objets géométriques doit-on placer au fondement d'une physique du continu ? Existe-t-il des objets géométriques qui s'imposent a priori pour penser l'univers physique continu ?
Sans approfondir le problème métaphysique des rapports entre la pensée mathématique pure et la pensée physique, contentons-nous d'évoquer la contribution de Riemann à cette question qui agite encore la science contemporaine.
Dans son habilitationsvortrag, Riemann s'interrogeait a priori
sur la notion d'espace. Il s'agissait là d'un bouleversement philosophique
majeur dans l'histoire des mathématiques. L'espace cessait d'être
une notion transmise par l'expérience, intuitive et caractérisée
de manière unique. En effet, l'espace changeait radicalement de
statut pour devenir question
a priori sur l'espace : en tant
que donnée intuitive, l'espace disparaissait ; il réapparaissait
en tant que question pour la science. Et les conceptions qui pouvaient
naître de cette question a priori se démultipliaient
a priori. En effet, le destin négatif de l'axiome des parallèles
d'Euclide, l'émergence des géométries non-euclidiennes,
à travers les travaux de Bolyai et de Lobatchevsky (anticipés
par Gauss), la constitution de la géométrie projective dans
l'école française et l'émergence des travaux de Gauss
sur les transformations conformes appliquées à la cartographie,
toutes ces innovations géométriques poussèrent Riemann
à s'interroger totalement a priori sur les hypothèses
qui peuvent servir de fondement à la conceptualisation de la notion
d'espace, dans les mathématiques et dans la physique. Il s'agissait
en particulier de s'interroger sur les données primitives de la
géométrie, sur leur degré de généralité,
sur leur progressivité, sur leur dépendance relative, sur
leur nécessité relative8,
etc.
1ex0.35cm
Les rapports mutuels des données
primitives [de la Géométrie] restent enveloppés de
mystère ; on n'aperçoit pas bien si elles sont nécessairement
liées entre elles, ni jusqu'à quel point elles le sont, ni
même a priori si elles peuvent l'être ([], p.
280).
Ainsi Riemann anticipait-il l'explosion et la ramification nécessaires des hypothèses géométriques possibles. Effectivement, la seconde moitié du dix-neuvième siècle et le début du vingtième devaient voir naître la géométrie projective, la géométrie conforme, la géométrie lorentzienne, les espaces non holonomes, les espaces généralisés au sens d'Élie Cartan, etc.
Conséquence inévitable de cette diversité : la
théorie physique se voyait obligée a priori
d'effectuer un choix
a posteriori parmi toutes les géométries
possibles. Les mathématiques, avec leur hubris hypothético-déductive,
et leur profusion incontrôlée de résultats abstraits,
encombraient, embarrassaient, déconcertaient déjà
la physique, qui se voyait contrainte de reconnaître sous cet afflux
quelle géométrie correspondait à la réalité,
dans un faisceau de théories géométriques architecturées.
1ex0.35cm
[...] les propriétés,
par lesquelles l'espace [physique] se distingue de toute autre grandeur
imaginable de trois dimensions, ne peuvent être empruntés
qu'à l'expérience. De là surgit le problème
de rechercher les faits les plus simples au moyen desquels puissent s'établir
les rapports métriques de l'espace, problème qui, par la
nature même de l'objet n'est pas complètement déterminé
; car on peut indiquer plusieurs systèmes de faits simples, suffisants
pour la détermination des rapports métriques de l'espace.
[...] Ces faits, comme tous les faits possibles, ne sont pas nécessaires
; ils n'ont qu'une certitude empirique, ce sont des hypothèses ([],
p. 281). [...] Il faut donc, ou que la réalité sur laquelle
est fondé l'espace forme une variété discrète,
ou que le fondement des rapports métriques soit cherché en
dehors de lui, dans les forces de liaison qui agissent en lui ([]).
Ces prédictions allaient être confirmées par Einstein.
En relativité restreinte, Einstein postulait que les lois physiques sont invariantes par rapport à toute transformation de Lorentz : leur forme est exactement la même dans tout référentiel lorentzien. Motivé par les expériences négatives de Michelson et Morley sur la détection du vent d'éther, Einstein postulait aussi la constance de la vitesse de la lumière dans tout référentiel. Pour insister sur le caractère a priori et <<métaphysique>> des raisonnements d'Einstein, on pourrait aussi considérer que la vitesse de la lumière est une loi physique, dont la forme est indépendante du référentiel lorentzien, et par conséquent, la vitesse de la lumière est constante : le second postulat serait une conséquence du premier.
En recherchant une généralisation de la relativité restreinte aux systèmes de coordonnées non lorentziens, Einstein fut conduit à abandonner le principe d'invariance, trop restrictif, et à le remplacer par un principe de covariance. Ce principe, qu'Einstein emprunta aux travaux mathématiques de Ricci et de Levi-Civita, exprime toujours une exigence purement a priori, sans origine physique :Principe de covariance 1.79 Les lois d'une physique géométrisée doivent pouvoir se transformer selon des règles précises lorsque l'on passe d'un système de coordonnées sur l'espace-temps à un autre.
Seconde exigence a priori, qui doit évidemment être
satisfaite :Principe d'équivalence 1.80 Deux
systèmes physiques qui se déduisent l'un de l'autre par un
changement de coordonnées sur l'espace-temps doivent être
considérés comme rigoureusement équivalents.
Comme son contemporain Nordström, Einstein recherchait une expression relativiste des lois de la gravitation newtonienne, gouvernée par l'équation de Poisson :
| 0 = |
|
Ñj Eij. (1.83) |
1ex0.35cm [...] pour le champ de gravitation en l'absence de matière, il est naturel de chercher à annuler le tenseur symétrique B µ n, déduit du tenseur Bµ s tr. [...] avec le choix du système de coordonnées que nous avons fait, ces équations s'écrivent dans le cas du champ libre de matière :
| ì
í î |
|
+ G µba G nab= 0 -g = 1. | (47) |
Il faut remarquer que le choix de ces équations
comporte un minimum d'arbitraire. Car, en dehors de Bµn,
il n'existe pas de tenseur de rang 2 formé des g
µn et de leurs dérivées
qui ne comporte aucune dérivée d'ordre supérieur à
deux et qui soit linéaire en fonction de ces dernières ([],
p. 209 de la traduction française).
Notons que les considérations sont légèrement différentes : la normalisation -g= 1 du déterminant de la métrique introduit une simplification des équations de la gravitation dans le vide qui élimine la moitié des termes du tenseur de Ricci Aij classique. En vérité, Einstein n'introduira le tenseur Aji - 1/ 2 dji A que dans un mémoire ultérieur. En tout état de cause, sa dernière affirmation revient à dire que le tenseur de Ricci Aij est essentiellement le seul tenseur deux fois covariant qui dépend linéairement des dérivées partielles d'ordre deux des coefficients métriques. Cette affirmation signifie sans doute que le seul tenseur que l'on peut obtenir par contraction des indices à partir du tenseur de courbure A ijkl est le tenseur de Ricci, ce qui était bien connu.
Élie Cartan poussa plus loin la question d'unicité et
démontra un théorème beaucoup plus fort que cette
observation élémentaire.
|
C ij0 dxi dxj = |
|
C ij0 | æ
ç ç è |
ga b (x), |
|
(x), |
|
(x) | ö
÷ ÷ ø |
dxi dxj, (1.86) |
|
C ij0 dxi dxj = |
|
[ | n A ij + µ A g ij + l g ij | ] | dxi dxj, (1.87) |
Grâce au calcul effectué dans le Lemme 1.55, il en
découle la conséquence suivante.Corollaire 1.88
Le tenseur une fois covariant et une fois contravariant défini par
:
| Eij := µ | æ
ç ç è |
Aij - |
|
dij A | ö
÷ ÷ ø |
+ l dij, (1.89) |
De ces quatre préoccupations découlent trois principes
majeurs qui imposeront un style particulier à la rédaction
de ce mémoire :
Ces orientations s'expliquent par notre projet initial : rendre accessibles les idées d'Élie Cartan, les retraduire, les reconstruire, en s'aidant de sources modernes (par exemple [], []), mais en dépassant le niveau de la théorie générale. Quatre mois nous auront été nécessaires pour déchiffrer les soixante-trois pages du mémoire original [] d'Élie Cartan. Parfois sans indiquer ses sources, Élie Cartan applique des théorèmes profonds qui requièrent une culture préalable. Certains passages laissent réellement perplexe quant aux arguments qu'il utilise. Le lecteur opiniâtre et curieux finit par admettre que la seule stratégie qui se présente à lui est de reconstituer ab initio tous les raisonnements suggérés de manière elliptique, et de compléter tous les calculs passés sous silence par Élie Cartan.
La méthode d'équivalence d'Élie Cartan est souvent conduite de manière non paramétrique, c'est-à-dire sans mener les calculs explicites jusqu'au bout. Les formes différentielles qui apparaissent peuvent en effet être introduites sans que l'on connaisse leur expression complète, en général très massive. Le << Lemme de Cartan >> --- un argument élémentaire d'algèbre linéaire --- permet en effet d'introduire pas à pas de nouvelles formes différentielles sans avoir à les développer. Il semblerait qu'Élie Cartan ait assez rapidement inventé ce court-circuit qui apparaît fréquemment dans nombre de ses mémoires.
En appliquant la méthode d'équivalence aux hypersurfaces analytiques rélles Levi non-dégénérées de Cn+1 (n³ 1), S.-S. Chern en reste aux calculs non paramétriques. Pour les hypersurfaces de C2, les calculs explicites des formes différentielles ont été essentiellement conduits par É. Cartan, qui confirmait les travaux de S. Lie et d'A. Tresse. Pour n=2, et pour le système différentiel associé, M. Hachtroudi a conduit les calculs jusqu'au bout, en bénéficiant des interprétations géométriques que lui apprenait É. Cartan pendant le déroulement de sa thèse, ce qui lui a permis d'éviter de nombreux calculs intermédiaires que la méthode directe (réemployée par S.-S. Chern) occasionne. Pour n³ 3, M. Hachtroudi ne semble pas conduire tous les calculs explicitement. Malgré la difficulté que j'ai à déchiffrer son travail (pourtant beaucoup plus accessible que ceux d'É. Cartan), je devine qu'il applique des arguments indirects et astucieux pour obtenir (au moins) les Théorèmes 1.7 et 1.23 de [C] ci-dessus.
Avant de découvrir la thèse de M. Hachtroudi (dont s'est inspiré S.-S. Chern), j'ai conduit la méthode d'équivalence pour le système différentiel associé à une hypersurface analytique réelle Levi non-dégénérée de C n+1 (n³ 2) via un calcul paramétrique et explicite, jusqu'au niveau des tenseurs fondamentaux Sa bs r. On sait en effet que les sept autres tenseurs de la {e}-structure finale sont fonctionnellement dépendants des Sa bs r, ce qui permet d'obtenir facilement la caractérisation différentielle explicite du système maximalement symétrique YXi Xj = 0, i, j= 1, ..., n. Cependant, je pense que le calcul paramétrique complet mérite d'être conduit jusqu'au bout, ne serait-ce qu'en vertu d'une exigence de complétude et parce que personne n'est jamais parvenu à le faire. S.M. Webster m'a écrit qu'un étudiant de Fornaess aurait essayé sans succès de programmer ce calcul sur machine ; S. Neut et M. Petitot, professionnels du calcul formel au LIFL, sont parvenus à implémenter la méthode d'équivalence dans ses grandes lignes, mais appliquée à de tels systèmes différentiels, elle n'aboutit que pour n = 1 (temps de calcul : 10 secondes) et pour n=2 (temps de calcul sur un Sun : entre 1 heure et 3 heures, en fonction de la machine). G. Schmalz m'a dit que ce calcul complet serait un réel achèvement.
Lorsque je serai libéré des articles en retard, je me réserverai deux mois pour appliquer mes techniques personnelles de calcul manuel et achever ce travail. Grâce à mon travail [A] sur la méthode d'équivalence, je me suis armé d'astuces de calcul supplémentaires, de sorte que je suis certain d'aboutir.
Plus précisément2, en 1827, Gauss a démontré qu'étant donné une surface bidimensionnelle paramétrisée par deux coordonnées (u, v) et équipée d'une métrique infinitésimale
| k = |
|
ì
í î |
E | é
ê ê ë |
|
· |
|
- 2 |
|
· |
|
+ | + | æ
ç ç è |
|
ö
÷ ÷ ø |
|
ù
ú ú ú ú ú û |
+ | + | F | é
ê ê ë |
|
· |
|
- |
|
· |
|
-2 |
|
· |
|
+ | + | 4 |
|
· |
|
- 2 |
|
· |
|
ù
ú ú û |
+ | + | G | é
ê ê ê ê ê ë |
|
· |
|
- 2 |
|
· |
|
+ | æ
ç ç è |
|
ö
÷ ÷ ø |
|
ù
ú ú ú ú ú û |
- - | 2 | ( | EG-F2 | ) | é
ê ê ë |
|
-2 |
|
+ |
|
ù
ú ú û |
ü
ý þ |
. (1.2) |
Dans ce texte philosophico-mathématique, nous nous proposons de reconstituer les spéculations méthodiques et les calculs formels qui ont conduit Gauss, après de nombreuses tentatives infructueuses, à découvrir et à élaborer cette << formula egregia >>. Son caractère presque ésotérique et la complexité quasi-incompressible des calculs formels qui sont nécessaires pour l'obtenir en ont fait un objet que l'on est parfois tenté de reléguer à un rang secondaire dans les manuels contemporains de géométrie différentielle. Dans ce texte, loin d'écarter les difficultés, nous accepterons cette complexité interne et pour l'appréhender, nous dissèquerons la démonstration originale de Gauss en la comparant aux simplifications partielles et relatives que la postérité a apportées.
Pour la calculer, on introduit d'abord une sphère fixe S
de rayon 1 (dans un système prédéfini d'unités,
e.g. de rayon 1 mètre, s'il s'agit de l'unité de longueur
qui est standard en physique) centrée en un point de l'espace, et
appelée par Gauss sphère auxiliaire.
Soit S une surface quelconque, par exemple celle qui est dessinée
sur la Figure 1 ci-dessous, et soit p
l'un de ses points.
On délimite une petite région autour du point p sur la surface S --- par exemple la région appelée AS que l'on a dessinée en grisé sur la Figure 1. En tout point q de cette région AS, on considère le vecteur orthogonal à la surface4 de longueur 1, et on le déplace parallèlement jusqu'à ce que son origine coïncide avec le centre de la sphère auxiliaire. Les extrémités de ces vecteurs décrivent alors une région que l'on appelle AS sur la sphère auxiliaire S et que l'on dessine en grisé sur la Figure 1. Cette région AS dépend de la région AS ; lorsque la région AS se rétrécit autour du point p, la région correspondante AS diminue aussi (autour du point de la sphère auxiliaire qui se situe à l'extrémité du vecteur orthogonal à la surface en p).
Pour fixer rigoureusement la terminologie, nous appellerons aire d'une surface ou d'une portion limitée de surface le nombre qui mesure son extension, calculée dans un système prédéfini d'unités, e.g. en << mètres-carré >> (m2) s'il s'agit d'une mesure physique standard.
D'après la définition première due à Gauss, la courbure k (p) d'une surface S en l'un de ses points p est égale à la limite --- quand la région AS se rétrécit autour de p, ce que l'on notera << AS ®p >> --- d'un quotient dans lequel l'aire de la région AS apparaît au dénominateur, et dans lequel l'aire de la région AS apparaît au numérateur (cf. Figure 1 ci-dessous) :
| k( p) = |
|
|
. (1.4) |
Sur la Figure 1, la région AS est plus grande que la région AS, y compris lorsque la région AS rétrécit autour du point p. Il en découle que le quotient ci-dessus et sa limite sont supérieurs à 1 : la surface est plutôt << assez courbée >> au point p. Comme on pourra le constater en exerçant son intuition, plus la surface est << courbée >> ou << pointue >> au voisinage du point p, plus l'aire AS est grande, par rapport à l'aire AS. La plupart des surfaces --- par exemple, celle de la France --- ont une courbure non nulle, positive ou négative, qui varie beaucoup d'un point à l'autre --- notamment en montagne (on ne pense jamais assez souvent à la surface terrestre comme réservoir très riche d'exemples transcendant le caractère parfois exagérément sobre de l'intuition mathématique). Au contraire, si la surface S est un plan, tous les vecteurs qui lui sont orthogonaux sont parallèles entre eux ; la région AS est alors réduite à un point, donc son aire est nulle et le numérateur de la formule 1.4 est toujours nul ; par conséquent : la courbure d'un plan dans l'espace est nulle en tout point p --- fort heureusement !
Mais la perspicacité géniale de Gauss aura dévoilé la nature << intrinsèque >> cachée de cette notion de courbure : en effet, grâce à la formula egregia 1.2, la courbure de la surface S --- dont les points arbitraires sont repérés par les deux coordonnées (u, v) --- peut être saisie de manière interne et bidimensionnelle, sans sphère auxiliaire, sans vecteurs normaux à la surface, sans troisième dimension : tel est le paradoxe remarquable. Il fallait donc toute la persévérance de celui qu'on a appelé le << princeps mathematicorum >> pour parachever la découverte de la courbure des surfaces par l'élaboration d'une formule aussi complexe que 1.2, grâce à laquelle le concept de courbure est envisageable sans aucun recours à une spatialité externe.
Le mystère est le suivant : comment Gauss a-t-il su, par un enchaînement intuitif complexe, entrevoir l'existence de la formula egregia et comment a-t-il pu achever le tour de force calculatoire qui l'y a conduit ?
Afin d'encourager les lecteurs philosophes qui s'intéressent de près ou de loin aux mathématiques à nous suivre sur ce chemin, nous avons organisé nos analyses de manière à rendre intuitivement accessibles tous les concepts mathématiques que nous utiliserons. Excepté une formation mathématique de niveau secondaire et une pratique minimale du calcul, nous croyons que nulle autre connaissance spécifique n'est requise pour aborder la lecture de ce texte. Mentionnons que nous avons choisi de recourir à un style << littéraire >> synthétique pour rédiger des paragraphes qui résumeront l'essentiel des commentaires les plus techniques. Ces paragraphes peuvent être mis entre parenthèses par le lecteur non mathématicien, ce qui offrira une lecture plus rapide. À l'opposé, le lecteur mathématicien qui connaît déjà la théorie des surfaces gaussiennes pourra se laisser glisser directement dans les méandres de l'analyse technique, après avoir survolé les Sections 2 et 3 --- destinées seulement à résumer les bases de la théorie, sous forme diagrammatique et sans démonstration.
Dans ce texte, plusieurs types de discours seront associés, assemblés et coordonnés. L'exposé didactique, volontairement développé, structuré très progressivement et agrémenté d'illustrations géométriques épurées donnera un côté << vulgarisation scientifique >> à nos analyses techniques. Toujours, la précision et la rigueur intuitive l'emporteront sur le discours mathématique standard, souvent peu accessible à cause d'un excès d'abstraction et d'idéalisation. Toutefois, le caractère descriptif << agréable >> de certains passages ne devra pas faire oublier qu'il existe des résultats mathématiques extrêmement précis et << impeccables >> qui constituent le véritable soubassement des résultats cités.
Dans ces analyses, le discours philosophique viendra s'enchasser --- presque implicitement --- à la manière d'un << réveil >> des métaphysique internes et d'une reformulation des causalités conceptuelles, trop souvent masquées et sous-entendues dans le discours mathématique habituel. Ainsi privilégierons-nous en premier lieu : la clarté intuitive, l'accessibilité des concepts et la lisibilité des mouvements dialectiques.
En somme, nous avons choisi d'élaborer des réflexions philosophico-mathématiques spécialisées afin de reformuler en langue naturelle quelques-unes des innombrables dialectiques implicites dans lesquelles circule le mathématicien en action. Des trésors de spéculation aux formes insoupçonnées parsèment l'oeuvre publiée et la correspondance de Gauss ; nous nous proposons de nous attacher à la pensée de Gauss en mouvement en étudiant un exemple précis : la genèse de la formula egregia 1.2.