Sechs Vorträge über ausgewählte Gegenstände aus der
reinen Mathematik und mathematischen Physik
Mathematische Vorlesungen an der Universität Göttingen: IV
SECHS VORTRÄGE
ÜBER AUSGEWÄHLTE GEGENSTÄNDE
AUS DER REINEN MATHEMATIK
UND DER MATHEMATISCHEN PHYSIK
auf Einladung der Wolfskehl-Kommission der Königlichen Gesellschaft der Wissenschaften
gehalten zu Göttingen vom 22.–28. April 1909
von
HENRI POINCARÉ
Mitglied der Französischen Akademie
Professor an der Faculté des Sciences der Universität Paris
Mit 6 in den Text gedruckten Figuren
Leipzig und Berlin
Druck und Verlag von B. G. Teubner
1910
Préface
L’Université de Göttingen a bien voulu m’inviter à traiter devant un savant auditoire diverses questions d’Analyse pure, de Physique mathématique, d’Astronomie théorique et de Philosophie mathématique; les conférences que j’ai faites à cette occasion ont été recueillies par quelques étudiants qui ont eu la bonté de les rédiger en corrigeant les nombreuses offenses que j’avais faites à la grammaire allemande. Je leur en exprime ici toute ma reconnaissance.
Il convient également que je m’excuse auprès du public de la brièveté avec laquelle ces sujets sont traités. Je ne disposais pour exposer chacun d’eux que d’un temps très court, et je n’ai pu la plupart du temps que donner une idée générale des resultats, ainsi que des principes qui m’ont guidé dans les démonstrations, sans entrer dans les détails mêmes de ces démonstrations.
Inhaltsverzeichnis
Erster Vortrag. Über die Fredholmschen Gleichungen.
Dritter Vortrag. Anwendung der Integralgleichungen auf Hertzsche Wellen.
Vierter Vortrag. Über die Reduktion der Abelschen Integrale und die Theorie der Fuchsschen Funktionen.
Fünfter Vortrag. Über transfinite Zahlen.
Sechster Vortrag. La mécanique nouvelle.
Erster Vortrag
Über die Fredholmschen Gleichungen
Die Integralgleichung
(1) |
wird bekanntlich aufgelöst durch die Integralgleichung derselben Art
(1a) |
wobei
gesetzt ist. und sind, wie aus der Fredholmschen Theorie bekannt ist, zwei ganze transzendente Funktionen in bezug auf . Um ihre Entwicklung explizite hinschreiben zu können, bezeichne man, wie Fredholm, mit diejenige -reihige Determinante, deren allgemeines Element ist. Setzt man dann
so hat man
Diese Gleichung formen wir um, indem wir die durch „Iteration“ aus entstehenden Kerne heranziehen. Setzen wir zunächst
so ist klar, daß die Form hat
wie sofort aus der Entwicklung der Determinante hervorgeht. Sei nun
wobei die Anzahl der Integrationsvariabeln bedeutet, so können wir offenbar auch setzen
wenn unter
der “-fach iterierte Kern” verstanden wird.
Wir haben den obigen Relationen zufolge jetzt
Beachten wir nun, daß gewisse unter den in einem Produkt enthaltenen einander gleich werden können, daß ferner gewisse der Produkte selbst einander gleich sein werden, nämlich solche, die durch eine Permutation der auseinander entstehen, so ergibt eine kombinatorische Betrachtung für einen Ausdruck von der Form
und also
d. h.
(2) |
also
(2a) | ||||
(2b) |
Den Zähler der Funktion kann man auf analoge Weise durch die Gleichung
(3) |
definieren. Diese Gleichungen, welche sich übrigens schon bei Fredholm finden, sind nützlich als Ausgangspunkt für viele Betrachtungen, wie sich nun an einigen Beispielen zeigen wird.
Die Fredholmsche Methode ist unmittelbar gültig nur für solche Kerne , die endlich bleiben. Wird der Kern an gewissen Stellen unendlich, so kann dennoch der Fall eintreten, daß ein iterierter Kern, etwa , endlich bleibt. Dann läßt sich die Integralgleichung mit dem iterierten Kerne nach Fredholm behandeln, und Fredholm zeigt, daß die ursprüngliche Integralgleichung (1) sich auf diese zurückführen läßt. Die Auflösung wird wieder durch eine Formel der Gestalt (1a) gegeben, nur ist jetzt
zu setzen, wobei
und
ist. Dabei sind und wieder ganze transzendente Funktionen von ; jedoch zeigt es sich, daß sie einen gemeinsamen Teiler besitzen; wir wollen zusehen, wie sich dies aus unseren Formeln (2) bis (3) ergibt und wie wir eine Bruchdarstellung der meromorphen Funktion erhalten, bei der Nenner und Zähler ganze Funktionen ohne gemeinsamen Teiler sind.
Aus unserer Annahme über die iterierten Kerne folgt, daß die Koeffizienten , endlich sind. Bilden wir nun in Anlehnung an Gleichung (2a) die Reihe
so wird dieselbe konvergieren. Jetzt setzen wir
und behaupten, in dieser Formel die gewünschte Darstellung zu haben.
Um dies zu beweisen, haben wir zu zeigen, daß und ganze Funktionen sind.
Zu diesem Zwecke bilden wir . Man berechnet leicht
Hieraus schließt man zunächst, daß eine meromorphe Funktion von ist; denn sie besitzt höchstens Pole in den Nullstellen von , d. h. in den Stellen wo eine -te Einheitswurzel und ein Eigenwert des Kernes ist. Man kann nun zeigen, daß in diesen möglichen Unendlichkeitsstellen das Cauchysche Residuum von gleich 1 oder 0 ist, je nachdem oder genommen wird. Die hierzu gehörige Rechnung wollen wir jetzt nicht durchführen; man benutzt dabei den Umstand, daß das für genommene Residuum von gleich ist, wo , , die zu gehörigen Eigenfunktionen, den Gleichungen
genügen. Hieraus folgt, daß eine ganze transzendente Funktion ist, die nur an den Stellen verschwindet.
Betrachtet man ebenso den Zähler von , so sieht man zunächst, daß er eine meromorphe Funktion von wird, die höchstens an den Stellen unendlich werden kann. Die Betrachtung der Residuen zeigt jedoch, daß dies nicht geschieht, und somit, daß der Zähler ebenfalls eine ganze transzendente Funktion ist. Damit ist die Reduktion des Fredholmschen Bruches geleistet.
Die Reihenentwicklung für Zähler und Nenner des Fredholmschen Bruches in dieser reduzierten Gestalt erhalten wir, indem wir auf die Bildungsweise von zurückgehen; setzen wir den Nenner
so haben wir
wobei zu setzen ist
In analoger Weise wird der Zähler gebildet. Man muß also die Determinanten in der gewöhnlichen Weise entwickeln, aber diejenigen Glieder dieser Entwicklung wegwerfen, welche einen Faktor von der Form mit weniger als Veränderlichen enthalten.
Unsere Formeln (2), (2a), (3) sind auch in dem Falle von Nutzen,
daß außer dem Kern auch alle iterierten Kerne
unendlich werden und die Fredholmsche Methode also nun
sicher versagt.
Seien etwa die Zahlen unendlich, endlich. Man kann
dann jedenfalls die Reihe bilden, fragen, ob sie
konvergiert, und untersuchen, ob wieder eine
ganze Funktion darstellt. Unter der Voraussetzung, daß
ein symmetrischer Kern ist, d. h.
ist mir dieser Nachweis gelungen. Ich benutze dabei die Relationen
die für gelten müssen, da das Geschlecht der Funktion einem Hadamardschen Satze zufolge kleiner als 2 ist.
Den Beweis mitzuteilen fehlt jetzt die Zeit.
Für den Zähler des Fredholmschen Bruches habe ich die Betrachtung nicht durchgeführt.
Noch einige Worte über die Integralgleichung 1. Art! Auf gewisse derartige Integralgleichungen kann man, wenn man sie zuvor auf Integralgleichungen der 2. Art zurückführt, die Fredholmsche Methode direkt anwenden. Es liege z. B. die Gleichung
(1) |
vor, in der die gegebene, aber die gesuchte Funktion ist, während der Bestandteil des Kerns eine gegebene Funktion ist, die gewissen, weiter unten angegebenen beschränkenden Voraussetzungen unterworfen ist. Für die gesuchte Funktion machen wir den Ansatz
aus dem nach dem Fourierschen Integraltheorem, falls die Bedingungen für dessen Gültigkeit erfüllt, umgekehrt
folgt. Danach verwandelt sich (1) in
oder
wenn
(2) |
gesetzt wird, und damit sind wir bereits bei einer Integralgleichung 2. Art angelangt. Der Kern (2) gestattet die Anwendung der Fredholmschen Methode z. B. dann, wenn und gleichmäßig in für gegen konvergieren und die Ungleichung
statthat, in der eine von und unabhängige Konstante bedeutet. Von genügt es etwa, anzunehmen, daß es nur endlichviele Maxima und Minima besitzt und im Intervall absolut integrierbar ist.
Wir können dieselbe Methode auf eine Reihe
anwenden; das Problem ist hier also, wenn und die Funktionen gegeben sind, die Koeffizienten so zu berechnen, daß die hingeschriebene Entwicklung gültig ist. Handelte es sich soeben um eine Erweiterung des Fourierschen Integraltheorems, so haben wir es jetzt mit einer Verallgemeinerung der Fourierschen Reihe zu tun.
Setzen wir in der Form
an, so bekommen wir
Von der Reihe, welche hier als Kern fungiert, müssen wir voraussetzen, daß sie absolut und gleichmäßig konvergiert, d. h. wir müssen annehmen, daß
(3) |
gleichmäßig konvergiert.
Setzen wir beispielsweise
so erhalten wir eine Entwicklung der Form
Die Bedingung (3) ist erfüllt, wenn wir die absolute Konvergenz von
voraussetzen.
Endlich betrachten wir noch die Gleichung
(4) |
welche sich von (1) dadurch unterscheidet, daß das Integral nicht in unendlichen, sondern in endlichen Grenzen zu nehmen ist. In diesem Fall darf nicht willkürlich gewählt werden: es muß, falls holomorph ist, sicher eine ganze transzendente Funktion sein, wenn die Gleichung (4) eine Auflösung besitzen soll. Dagegen dürfen die Werte dieser Funktion für alle ganzen Zahlen im wesentlichen willkürlich angenommen werden. Setze ich nämlich
so verwandelt sich (4), für genommen, in
Wir gelangen so zu einem System unendlich vieler linearer Gleichungen mit unendlich vielen Unbekannten, wie sie von Hill, H. v. Koch, Hilbert u. a. untersucht worden sind. Die Lösung dieses Systems ist, falls wir für die Reihe
(5) |
die Voraussetzung absoluter und gleichmäßiger Konvergenz machen, der Fredholmschen Lösung der Integralgleichungen durchaus analog und stellt sich wie diese als meromorphe Funktion des Parameters dar. Die gleichmäßige und absolute Konvergenz von (5) ist aber, wie sich durch partielle Integration ergibt, sichergestellt, falls die Summe
oder das Integral
absolut und gleichmäßig konvergiert.
Man sieht die Ähnlichkeit und den Unterschied der beiden Fälle (1) und (4) deutlich: je nachdem die Integrationsgrenzen unendlich oder endlich sind — oder auch, je nachdem der Kern in den Integrationsgrenzen keine oder eine genügend hohe Singularität aufweist —, darf man die „gegebene“ Funktion im wesentlichen willkürlich wählen oder ihr nur eine zwar unendliche, jedoch diskrete Reihe von Funktionswerten vorschreiben. Es wäre wohl nicht ohne Interesse, den hier zur Geltung kommenden Unterschied mit Hilfe der Iteration der Kerne näher zu betrachten.
Zweiter Vortrag
Anwendung der Theorie der Integralgleichungen
auf die Flutbewegung des Meeres
Ich will heute über einige Anwendungen der Integralgleichungstheorie auf die Flutbewegung berichten, die ich im letzten Semester gelegentlich einer Vorlesung über diese Erscheinung gemacht habe.
Die Differentialgleichungen des Problems sind die folgenden:
(1) |
Wir stellen uns dabei vor, daß die Kugeloberfläche der Erde etwa durch stereographische Projektion konform auf die -Ebene bezogen sei; dann bedeute das Ähnlichkeitsverhältnis der Abbildung zwischen Ebene und Kugel. Die Lösung des Flutproblems denken wir uns durch periodische Funktionen der Zeit gegeben, und wir nehmen speziell an, daß unsere Gleichungen (1) einem einzigen periodischen Summanden von der Form entsprechen, sodaß also in unseren Gleichungen die Schwingungsperiode bestimmt; es ist bequem, statt des Kosinus komplexe Exponentialgrößen einzuführen und also etwa anzunehmen, daß alle unsere Funktionen die Form
haben; der reelle und imaginäre Teil dieser komplexen Lösungen stellt uns dann die physikalisch brauchbaren Lösungen dar.
ist definiert durch
wo das hydrostatische Potential, der Druck ist.
Ist die Tiefe des Meeres, so definieren wir
wo die Colatitude des zu gehörigen Punktes der Erde, die Winkelgeschwindigkeit der Erde bedeutet. ist die Differenz zwischen der Dicke der mittleren und der gestörten Wasserschicht, d. h. entspricht der Ebbe, der Flut. ist die Beschleunigung der Schwerkraft, das Potential der Störungskräfte, ist das Potential, welches von der Anziehung der Wassermassen von der Dicke herrührt. Ist z. B.
so wird | ||||
wo die die Kugelfunktionen sind.
Die Einheiten sind so gewählt, daß die Dichte des Wassers gleich , der Radius der Erdkugel gleich ist.
Die Größe kann man meistens vernachlässigen; tut man dies, so erhält man sofort für eine partielle Differentialgleichung 2. Ordnung. Um aus derselben zu bestimmen, muß man gewisse Grenzbedingungen vorschreiben. Wir unterscheiden da zwei Fälle:
1. Der Rand des Meeres ist eine vertikale Mauer; dann wird
wobei , die normale bzw. tangentiale Ableitung von ist.
2. Der Rand des Meeres ist nicht vertikal; dann ist dort
Die Grenzbedingung lautet hier, daß am Rande regulär und endlich bleiben soll.
Um auf diese Probleme die Methoden der Integralgleichungen anwenden zu können, erinnern wir uns zunächst der allgemeinen Überlegungen, wie sie Hilbert und Picard für Differentialgleichungen anstellen. Sei
eine partielle Differentialgleichung 2. Ordnung für , die elliptischen Typus hat, so ist eine, gewisse Grenzbedingungen erfüllende, Lösung darstellbar in der Form
wobei die zu diesen Randbedingungen gehörige Greensche Funktion des Differentialausdruckes ist; ist , , und das Integral ist über dasjenige Gebiet der -Ebene zu erstrecken, für welches die Randwertaufgabe gestellt ist. Um die Greensche Funktion zu berechnen und so die Randwertaufgabe zu lösen, setze man
wo
ein linearer Differentialausdruck ist. Nehmen wir nun an, wir kennen die Greensche Funktion von , so haben wir die Lösung von
in der Form
Schaffen wir hieraus durch partielle Integrationen die Ableitungen , heraus, so werden wir direkt auf eine Integralgleichung zweiter Art für geführt, die wir nach der Fredholmschen Methode behandeln können, wenn ihr Kern nicht zu stark singulär wird.
Bei unserem Probleme der Flutbewegung tritt nun gerade dieser Fall ein; der Kern wird so hoch unendlich, daß die Fredholmschen Methoden versagen; ich will Ihnen jedoch zeigen, in welcher Weise man diese Schwierigkeiten überwinden kann.
Betrachten wir erst den Fall der ersten Grenzbedingung
wo eine gegebene Funktion von ist. Die Differentialgleichung, die sich bei Vernachlässigung von ergibt, hat die Form
und wir stehen daher vor der Aufgabe, die Gleichung
mit unserer Randbedingung zu integrieren.
Diese Aufgabe ist äquivalent mit der, eine im Innern der Randkurve reguläre Potentialfunktion , die am Rande die Bedingung erfüllt, als Potential einer einfachen Randbelegung zu finden. Bezeichnet die Bogenlänge auf der Randkurve von einem festen Anfangspunkte bis zu einem Punkte , die bis zum Punkte , so erhält man für eine Integralgleichung; jedoch wird der Kern derselben für von der ersten Ordnung unendlich, und es ist daher in dem Integrale
der sogenannte Cauchysche Hauptwert zu nehmen, der definiert ist als das arithmetische Mittel aus den beiden Werten, die das Integral erhält, wenn ich es in der komplexen -Ebene unter Umgehung des Punktes das eine mal auf einem Wege oberhalb, das andere mal auf einem Wege unterhalb der reellen Achse führe.
Anstatt die Methoden zu benutzen, die Kellogg zur Behandlung solcher unstetiger Kerne angibt, will ich einen andern Weg einschlagen. Wir betrachten neben der Operation
die iterierte
bei der ebenfalls das Doppelintegral als Cauchyscher Hauptwert zu nehmen ist; dies soll folgendermaßen verstanden werden: wir betrachten für die Variable die Wege , , für die Wege , , die zueinander liegen mögen, wie in der Figur angedeutet ist. Dann bilden wir die 4 Integrale, die sich ergeben, wenn ich einen Weg für mit einem für kombiniere;
, | , | , | ||
, | , | , | , |
und nehmen aus diesen 4 Integralen das arithmetische Mittel. Ziehen wir noch 2 Wege , wie in der Figur, so sehen wir, daß sich in der ersten Wegkombination der Weg für ersetzen läßt durch , in der zweiten durch , in der dritten durch und in der vierten durch , sodaß wir jetzt die folgenden Wegkombinationen haben:
. |
Führen wir jetzt die Integrale aus und wenden den Residuenkalkül auf die geschlossenen Wege an, so zeigt sich, daß unsere Operation , die einer Integralgleichung 1. Art zugehört, übergeht in eine Operation, welche durch die linke Seite einer Integralgleichung 2. Art gegeben ist, deren Kern überall endlich bleibt; wenn wir zuerst die vier Kombinationen von den Wegen und mit den Wegen und nehmen, so bekommen wir ein doppeltes Integral, welches nicht unendlich werden kann, da auf diesen Wegen und . Betrachten wir jetzt die beiden Wegkombinationen , und , , oder , und , so ist leicht zu sehen, daß eine geschlossene Kurve oder um beschreibt, und daß gleichzeitig eine geschlossene Kurve um beschreibt. Wir dürfen also die Residuenmethode anwenden, und wir bekommen ein Glied, wo die unbekannte Funktion ohne Integralzeichen auftritt, wie in der linken Seite einer Integralgleichung zweiter Art. Indem wir so auf eine durchaus reguläre Integralgleichung 2. Art geführt werden, die der Fredholmschen Methode zugänglich ist, haben wir die Schwierigkeit bei unserem Problem überwunden.
Nur ein Punkt bedarf noch der Erläuterung: wenn und gleichzeitig in einen der Endpunkte des Intervalles hineinfallen, so versagen zunächst die obigen Betrachtungen, und es scheint, als wären wir für diese Stellen der Endlichkeit unseres durch Iteration gewonnenen Kernes nicht sicher. Dieses Bedenken wird jedoch bei unserm Problem dadurch beseitigt, daß der Rand des Meeres, der das Integrationsintervall darstellt, geschlossen ist, woraus sich ergibt, daß die Punkte keine Ausnahmestellung einnehmen können.
Durch diese Überlegungen ist also der Fall der vertikalen Meeresufer erledigt.
Wir betrachten den zweiten und schwierigeren Fall, daß das Ufer des Meeres keine vertikale Mauer ist. Dann ist am Rande
Da die Glieder 2. Ordnung unserer Differentialgleichung für durch den Ausdruck
gegeben sind, so ist die Randkurve jetzt eine singuläre Linie für die Differentialgleichung. Außerdem werden gemäß ihrer Definition für die durch die Gleichung
gegebene kritische geographische Breite unendlich. Um trotz dieser Singularitäten, welche das Unendlichwerden des Kerns zur Folge haben, das Problem durchzuführen, bin ich gezwungen gewesen, das reelle Integrationsgebiet durch ein komplexes zu ersetzen, indem ich in eine komplexe Veränderliche verwandle; hingegen bleibt reell.
Wir deuten als gewöhnliche rechtwinklige Koordinaten in einem dreidimensionalen Raum und zeichnen den Durchschnitt einer Ebene mit dem in der -Ebene gelegenen Meeresbecken. Entspricht der kritischen geographischen Breite, so ist es nicht schwer, diese Singularität durch Ausweichen in das komplexe Gebiet zu umgehen. Wählen wir ferner irgend zwei Punkte zwischen und und umgeben , von ausgehend und dorthin zurückkehrend, mit einer kleinen Kurve und verfahren entsprechend bei — räumlich gesprochen: umgeben wir die Randkurve mit einem ringförmigen Futteral —, so stellen wir uns jetzt das Problem, unsere Differentialgleichung so zu integrieren, daß , wenn wir seine Wertänderung längs der den Punkt umgebenden Kurve verfolgen, mit demselben Wert nach zurückkehrt, mit dem es von dort ausging. Diese “veränderte” Grenzbedingung ist mit der ursprünglichen, welche verlangte, daß am Rande (im Punkte ) endlich bleibt und sich regulär verhält, äquivalent. Zwar sind die zu der neuen und der alten Grenzbedingung gehörigen Greenschen Funktionen , nicht identisch, wohl aber die den betreffenden Randbedingungen unterworfenen Lösungen von
(1) |
Hiervon überzeugen wir uns leichter im Falle nur einer Variablen ; dann ergeben die Gleichungen
durch Anwendung des Cauchyschen Integralsatzes, daß ist.
Um jetzt das Problem (1) zu behandeln, ziehe ich die vorige Methode heran, die hier aber in zwei Stufen zur Anwendung kommt, da unsere veränderte Randbedingung für die Gleichung unzulässig ist.11 1 Diese Randbedingung ist nicht von solcher Art, daß sie eine bestimmte Lösung von auszeichnet. Wir können setzen
dabei soll nur die Glieder 1. Ordnung aber nur selbst enthalten. Indem wir
unter der Randbedingung integrieren, erhalten wir für eine am Rande endliche und reguläre Funktion, für welche
ist. Darauf integrieren wir
unter Zugrundelegung der ursprünglichen Grenzbedingung nach der gewöhnlichen Methode. Der in der hierbei zu benutzenden Integralgleichung auftretende Kern ist zwar unendlich, aber von solcher Ordnung, daß sich die Singularität durch Iteration des Kerns beseitigen läßt: die partielle Integration, welche Glieder von einer zu hohen Ordnung des Unendlichwerdens einführen würde, bleibt uns an dieser Stelle erspart.
Das damit bewältigte Integrationsproblem ist aber der Integration von
unter der veränderten Grenzbedingung äquivalent, und infolgedessen können wir jetzt die zweite Stufe ersteigen und auch die Lösung von
unter der veränderten Grenzbedingung bestimmen.
Wir haben bis jetzt das Glied als so klein vorausgesetzt, daß wir es ganz vernachlässigen durften. Heben wir diese Voraussetzung auf, so entstehen keine wesentlichen neuen Schwierigkeiten. ist ein von erzeugtes Anziehungspotential; wir haben also
wenn ein Flächenelement der Kugel, den Wert der Funktion im Schwerpunkt dieses Flächenelementes, aber die räumlich gemessene Entfernung der beiden Kugelpunkte ; bedeutet, und die Integration über die ganze Kugeloberfläche erstreckt wird. Wir können auch schreiben
Setzen wir dies in unsere Ausgangsgleichungen ein, von denen wir noch die erste mittels Aufstellung der zugehörigen Greenschen Funktion und unter Berücksichtigung der Randbedingung aus einer Differential- in eine Integralgleichung verwandeln, so erhalten wir zwei simultane Integralgleichungen für und , die mit Hilfe der soeben erörterten Methoden aufgelöst werden können.
Dritter Vortrag
Anwendung der Integralgleichungen auf Hertzsche Wellen
Ich will heute über eine Anwendung der Integralgleichungen auf Hertzsche Wellen vortragen und insbesondere die äußerst merkwürdigen Beugungserscheinungen behandeln, welche bei der drahtlosen Telegraphie eine so wichtige Rolle spielen; ist es doch eine wunderbare Tatsache, daß die Krümmung der Erdoberfläche, welche eine Fortpflanzung des Lichtes verhindert, für die Ausbreitung der Hertzschen Wellen kein Hindernis darstellt, daß dieselben vielmehr auf der Erdoberfläche von Europa bis Amerika zu laufen vermögen. Der Umstand, daß die Hertzschen Wellen eine viel größere Länge haben als die Lichtwellen, kann allein diese Erscheinung noch nicht erklären. Eine solche Erklärung ergibt sich vielmehr erst durch Betrachtung der Differentialgleichungen des Problems.
Setzen wir die Lichtgeschwindigkeit gleich , und verstehen wir mit Maxwell
unter | , | , | die Komponenten der magnetischen Kraft, | |
unter | die Komponenten des Vektorpotentiales, | |||
unter | die Komponenten der elektrischen Verschiebung, | |||
unter | das skalare Potential, | |||
unter | die Komponenten des Konduktionsstromes, | |||
unter | die Dichte der Elektrizität, |
so gelten die Gleichungen
und es folgt
Wir betrachten nun eine gedämpfte synchrone Schwingung, indem wir annehmen, daß alle unsere Funktionen proportional sind mit der Exponentialgröße
Aus den so zustande kommenden komplexen Lösungen erhalten wir die physikalischen durch Trennung in reellen und imaginären Bestandteil. Der reelle Teil von gibt die Schwingungsperiode, der imaginäre die Dämpfung.
Aus unserem Ansatz folgt
und man kann daher und als retardierte Potentiale darstellen wie folgt:
ist das Raumelement im -Raume, , die Werte von , im Punkte , die Entfernung der Punkte und .
In den meisten Problemen treten zwei verschiedene Medien auf, der freie Äther und die leitenden Körper; von den letzteren wollen wir annehmen, daß sie sich wie vollkommene Leiter verhalten, daß also in ihrem Innern das Feld verschwindet, die elektrischen Kraftlinien auf ihrer Oberfläche normal stehen, während die magnetischen in dieselbe hineinfallen; dem Umstande, daß Ladung und Strömung nur an der Oberfläche des Leiters vorhanden ist, wollen wir dadurch entsprechen, daß wir die obigen Ausdrücke für und modifizieren, indem wir an Stelle der Raumintegrale Oberflächenintegrale einführen. Wir schreiben
wo , jetzt die Flächendichte der Ladung bzw. Strömung bedeuten und das Flächenelement ist.
Wir unterscheiden gewöhnlich zwei leitende Körper, der eine soll der äußere, der andere der innere Leiter heißen; sie erzeugen das “äußere” resp. das “innere” Feld; das äußere Feld ist gegeben, das innere gesucht. So ist z. B., wenn wir das Problem des Empfanges elektrischer Wellen betrachten, der Sender der äußere, der Empfangsapparat der innere Leiter; beim Probleme der Beugung elektrischer Wellen ist der Erreger der äußere, die Erdkugel der innere Leiter; bei dem Probleme der Schwingungserzeugung haben wir kein äußeres Feld, der Erreger wird dann als innerer Leiter anzusehen sein.
Um nun zum Ansatz einer Integralgleichung zu gelangen, wollen wir unter den oben erklärten Funktionen nur die zum unbekannten inneren Felde gehörigen verstehen, sodaß z.B. die obigen Integrale nur über die Oberfläche des inneren Leiters zu erstrecken sind; beachten wir nun, daß die innere Normalkomponente des elektrischen Vektors am inneren Leiter unserer obigen Annahme zufolge verschwinden muß, so folgt, wenn , , die Richtungskosinus der Normale bedeuten, aus unseren Ausgangs-Gleichungen:
wo die Normalkomponente des äußeren Feldes, also eine bekannte Funktion ist.
Bezeichnen wir jetzt die Flächendichte statt mit mit , so wird zufolge unseres Ausdruckes für
Benutzen wir ferner unseren Ausdruck für und die entsprechenden für und , so hat man
Diesen Ausdruck kann man nun in gewissen Fällen durch partielle Integrationen auf die Form
bringen, wobei eine bekannte Funktion ist. So haben wir schließlich
und dies ist die Integralgleichung 2. Art für , auf die wir hinstrebten. Im allgemeinsten Falle bekommt man zwei Integralgleichungen mit zwei Unbekannten, welche z. B. und sein mögen, wo das oben definierte ist; wir setzen , wo die Ableitung in der Normalrichtung bezeichnet und die Normalkomponente der magnetischen Kraft ist.
Die Funktion läßt sich dann besonders einfach bilden, wenn der innere Leiter ein Rotationskörper ist und das äußere Feld Rotationssymmetrie besitzt. Ist , die Bogenlänge, gemessen vom Endpunkte der Rotationsachse auf einem Meridian bis zu den Punkten , , ist ferner der Winkel zwischen der Normale in und der Meridiantangente in , so wird als Funktion von , , definiert durch die Differentialgleichung
Das Problem des Empfanges elektrischer Wellen läßt sich auf Grund der obigen Integralgleichung 2. Art behandeln.
Wollen wir nur das Problem der Erzeugung elektrischer Wellen betrachten, so haben wir das äußere Feld gleich Null zu setzen, es wird also , und wir haben eine homogene Integralgleichung vor uns; in ihr darf jedoch nicht mehr einen willkürlichen Parameterwert bedeuten, sondern ist eine zu bestimmende Zahl, die die Rolle der Eigenwerte spielt.
Ich schreibe unsere Integralgleichung in der Form
mit dem Kerne ; ich führe einen unbestimmten Parameter ein und betrachte die allgemeine Gleichung
Das erste Glied hängt von zwei Unbestimmten und ab. Wenn man die gewöhnliche Fredholmsche Methode anwendet, so erhält man die Lösung unserer obigen Integralgleichung in Gestalt einer meromorphen Funktion von , deren Nenner eine ganze Funktion von ist. Man kann nun zeigen, daß dieser Nenner auch eine ganze Funktion von wird, sodaß also auch hier unsere ausgezeichneten Werte sich als Nullstellen einer ganzen transzendenten Funktion ergeben.
Wir wollen aber jetzt das größere Problem der Beugung ausführlicher behandeln.
Nehmen wir zu diesem Ende an, daß der innere Leiter eine Kugel, die Erdkugel, vom Radius ist und das äußere Feld (dessen normale Komponente bedeutet) von einem punktförmigen Erreger herrührt, dessen Entfernung vom Mittelpunkt der Erde nur sehr wenig größer ist als der Radius . Wir wählen die Richtung zur -Achse und bezeichnen die Abweichung der Richtung , in der einen variablen Punkt der Kugeloberfläche bedeutet, von mit . Die Bedeutung von , , ; , ist aus der Figur ersichtlich:
Der Wert der normalen Ableitung des äußeren Feldes berechnet sich im Punkte , wie leicht zu sehen, nach der Formel
Da eine sehr große Zahl ist — denn die Länge der Hertzschen Wellen ist klein gegenüber dem Radius der Erde — genügt es meistens, in dieser Formel nur das erste Glied, das in der eckigen Klammer auftritt, beizubehalten.
Im vorhergehenden haben wir die Gleichung der Hertzsehen Wellen auf die Form
gebracht und haben gezeigt, wie der Kern berechnet werden kann. Entwickeln wir jetzt und nach Kugelfunktionen oder vielmehr, da unser Problem die Symmetrie eines Rotationskörpers mit der Achse besitzt, nach Legendreschen Polynomen , so gewinnen wir aus dieser Integralgleichung die elektrische Flächendichte gleichfalls unter der Form einer nach den Funktionen fortschreitenden Reihe. Es gilt zunächst
ist von der Form
wo eine nur von , nicht aber von abhängige Zahl ist, und eine mit der Besselschen verwandte Funktion bedeutet.
Wir verstehen nämlich unter die in der Umgebung von holomorphe Lösung der Gleichung
und sei dasjenige Integral derselben Gleichung, welches sich für große positive Werte von angenähert wie verhält. Da , von einander unabhängig sind, können wir außerdem dafür sorgen, daß
ist, wenn unter , die Ableitungen von , verstanden werden.
Die Lösung unserer Integralgleichung lautet jetzt
Da aber auch der Ausdruck von im Zähler als Faktor enthält, und sich infolgedessen dieser Term heraushebt, ist
die für die Eigenschwingungen charakteristische Gleichung.
Um zu übersichtlichen Resultaten zu gelangen, benutzen wir angenäherte Formeln. Diese beruhen darauf, daß sehr groß, andererseits aber sehr klein ist. Wir stützen uns auf die folgende Näherungsformel
, sind gegebene Funktionen von , eine sehr große Zahl, bedeutet die zweite Ableitung von , und auf der rechten Seite ist als Argument ein solcher Wert einzusetzen, für den ein Maximum oder Minimum besitzt; je nachdem der eine oder der andere Fall vorliegt, ist in dem Faktor das Zeichen oder das Zeichen zu nehmen. Hat in dem Intervall, über welches zu integrieren ist, mehrere Maxima oder Minima, so ist der Ausdruck rechts durch eine Summe analog gebildeter Terme zu ersetzen.
Durch Anwendung dieser Formel bekommen wir für die Legendreschen Polynome die folgenden, für große gültigen angenäherten Ausdrücke:
Aus ihnen folgt für die , falls ,
Dabei ist
gesetzt, und für , , , , , sind die aus der Figur zu entnehmenden Werte einzusetzen, für welche
wird. Die gleiche Näherungsformel gilt auch für , falls in der eckigen Klammer durch oder ersetzt wird; die Diskussion darüber, welches der beiden Glieder beizubehalten ist, will ich hier nicht geben.
Auch um angenähert zu berechnen, müssen wir die beiden Fälle und unterscheiden. Im ersten Falle ist
im zweiten
zu setzen. Daraus ergibt sich, daß sowohl für als auch für und große
gilt. In der Summe, durch welche wir dargestellt haben, geben demnach diejenigen Glieder, für welche nahezu ist, den Ausschlag. Für diese gilt näherungsweise
Da ferner wegen der Kleinheit von der Winkel immer nahezu bleibt, variiert als Funktion von nur sehr wenig, wenn auf die dem Werte benachbarten ganzen Zahlen beschränkt wird. Wir dürfen also, wenn wir noch die Längeneinheit so gewählt denken, daß ist, schreiben
Dabei ist der Wert der elektrischen Oberflächendichte im Punkte (s. die Figur).22 2 Der Ausdruck von , kann auch auf eine einfachere Form zurückgeführt werden, nämlich und diese Formel ist nicht eine angenäherte, sondern eine strenge.
Aus
bekommen wir
sodaß in der Nähe von der linke Ausdruck von derselben Größenordnung ist wie
Führen wir diese Annäherung in unsere Formel für ein
und ersetzen
zunächst durch , so kommen wir auf die
Reihe
Schreiben wir
so können wir
als einen Mittelwert der Reihe betrachten, und ich will durch diesen Mittelwert ersetzen. Ein solches Verfahren ist gewiß berechtigt, wenn es uns nur daran liegt, die Größenordnung von festzustellen, umsomehr als in Wirklicheit von einer Antenne nicht bloß Schwingungen einer einzigen Wellenlänge, sondern ein ganzes kontinuierliches Spektrum von Schwingungen ausgeht. Wir erhalten
und da sehr groß ist, wird dieses Integral mit
im wesentlichen übereinstimmen.
Auf ähnliche Weise zeigt man, daß der Mittelwert von
gegen den von zu vernachlässigen ist. Damit gewinnen wir das Resultat, daß von der Größenordnung
und also von der Größenordnung
ist. Die Beugung ist daher um so größer, je näher die Quelle der Erdoberfläche gelegen ist und je länger die entsendeten Wellen sind. Auf diese Weise wird die zunächst staunenerregende Tatsache verständlich, daß es mit Hilfe der in der drahtlosen Telegraphie verwendeten Hertzschen Wellen gelingt, vom europäischen Kontinent z. B. bis nach Amerika zu telegraphieren.
Wenn man nicht den mittleren Wert der Reihe betrachten will, welcher von einem Integral dargestellt wird, sondern den wirklichen Wert dieser Reihe, so hat man eine Diskussion durchzuführen, welche auf einem wohlbekannten Abelschen Satz beruht, und deren Resultate etwas komplizierter, aber sonst ganz ähnlich den vorliegenden sind.
Note. Je me suis aperçu que les dernières conclusions doivent être modifiées. Les formules approchées dont j’ai fait usage ne sont plus vraies lorsque est très voisin de . Elles doivent être alors remplacées par d’autres, où figure une transcendante entière satisfaisant à l’équation différentielle
Mais les termes qui doivent être ainsi modifiés sont en petit nombre et j’avais cru d’abord que le résultat final n’en serait pas modifié. Un examen plus approfondi m’a montré qu’il n’en est rien. La somme des termes modifiés est comparable à celle des autres termes dont j’avais tenu compte et qui est donnée par la formule précédente; il en résulte une compensation presque complète de sorte que la valeur de donnée par les formules définitives est notablement plus petite que celle qui résulterait des formules précédentes.
Vierter Vortrag
Über die Reduktion der Abelschen Integrale und die Theorie der Fuchsschen Funktionen
Meine Herren! Ich habe die Absicht, Ihnen heute über die Reduktion der Abelschen Integrale im Zusammenhang mit der Theorie der automorphen und insbesondere der Fuchsschen Funktionen vorzutragen.
Ein System von Abelschen Funktionen von Variabeln und Perioden heißt reduzibel, wenn es sich auf ein System von Variabeln und Perioden zurückführen läßt. Hierbei ist es von vornherein von Wichtigkeit, zwei Fälle zu unterscheiden:
Im ersten Falle soll es möglich sein, das System Abelscher Funktionen von Variabeln durch eine algebraische Kurve vom Geschlechte zu erzeugen. Ebenso soll das System von Variabeln aus der Theorie eines algebraischen Gebildes vom Geschlechte entspringen.
Dieser unser erste Fall ist aber bekanntlich nicht der allgemeine; denn die Kurve hängt nur von Konstanten ab, während die allgemeinen Abelschen Funktionen von Variabeln Parameter enthalten. Dadurch ist der zweite der beiden Fälle gegeben, die wir unterscheiden. In diesem Falle nämlich soll mindestens eines der beiden Systeme , nicht aus der Theorie der algebraischen Gebilde entspringen.
In meinem heutigen Vortrag will ich mich durchaus auf den erstgenannten Fall beschränken. Aber auch dann muß ich noch zwei Fälle unterscheiden. Wir knüpfen nämlich unsere Betrachtungen an die beiden algebraischen Kurven und an. Im Falle der Reduzibilität besteht zwischen beiden eine algebraische Korrespondenz. Die Beschaffenheit derselben liegt der in Aussicht gestellten Fallunterscheidung zugrunde.
Der erste Fall ist der folgende. Vermöge der Korrespondenz ist jedem Punkte von ein und nur ein Punkt von zugeordnet, während umgekehrt jedem Punkte von Punkte von entsprechen. Ich nenne dann die charakteristische Zahl der Korrespondenz und sage, ist eine vielfache Kurve von .
Der eben genannte erste Fall ist aber nicht der allgemeine. Das ist vielmehr der nun folgende zweite. Hier nämlich besteht die Korrespondenz nicht zwischen einzelnen Punkten und , sondern zwischen Systemen von Punkten von mit den Koordinaten und von mit den Koordinaten . Jedem System auf soll dabei ein und nur ein System auf entsprechen, während umgekehrt einem System auf im allgemeinen mehrere Systeme auf zugeordnet sind. Ich sage dann, ist eine pseudovielfache Kurve von .
Im erstgenannten Falle sind und rationale Funktionen von und , während im zweiten nur geschlossen werden kann, daß jede rationale und symmetrische Funktion der eine rationale Funktion der ist. Es ist leicht zu sehen, daß jede Kurve , die eine vielfache von ist, auch eine pseudovielfache der Kurve ist. Umgekehrt aber habe ich mehrere Beispiele bilden können dafür, daß nicht jede pseudovielfache Kurve von auch eine vielfache von ist. Ich will jedoch hier nicht näher darauf eingehen, zumal da sich meine folgenden Darlegungen durchaus an den ersten Fall anschließen werden.
Im Falle der Reduzibilität unserer Integrale ist es möglich, ihre Periodentabelle auf eine besondere Normalform zu bringen. Die folgenden beiden Beispiele mögen eine Anschauung von der Beschaffenheit derselben geben.
1) ; . Die Periodentabelle kann auf die folgende Form gebracht werden:
2) ; . Die normierten Perioden sind hier:
Die Zahlen , bedeuten in beiden Tabellen ganze rationale Zahlen.
Ich definiere nun noch eine zweite charakteristische Zahl . Sie gibt die Ordnung der Thetafunktion von Variabeln an, in die eine Thetafunktion erster Ordnung von Variabeln im Falle der Reduzibilität transformiert werden kann. Im ersten Beispiel ist , im zweiten . Die beiden charakteristischen Zahlen und sind nun immer einander gleich. Ich habe zwei Beweise für diesen Satz gefunden, die ich jetzt in ihren Grundzügen auseinandersetzen will.
Erster Beweis. Seien und zwei Abelsche Integrale erster, zweiter oder dritter Gattung der Kurve . Ich denke mir die zugehörige Riemannsche Fläche irgendwie längs von einem Punkte ausgehenden nichtzerstückenden Rückkehrschnitten kanonisch aufgeschnitten. Dann mögen und die folgenden Perioden besitzen:
Ich muß nun eine charakteristische fundamentale Bilinearform definieren. Ich setze nämlich:
wo das Integral längs der ganzen Kontur der Zerschneidung erstreckt werden soll. Wenn , Normalperioden sind, so nimmt die folgende Form an:
Nehme ich an, es sei eines der reduziblen Integrale, dann drücken sich seine Perioden ganzzahlig und linear durch nur Perioden aus. Ich habe also dann:
wo die ganze rationale Zahlen bedeuten. Wenn nun und Integrale erster Gattung sind, dann ist bekanntlich
Wenn man in diese Gleichung die Ausdrücke der durch die einsetzt, so bekommt man eine bilineare Gleichung zwischen den und , die in der folgenden Form geschrieben werden kann:
Seien nun linear unabhängige Integrale erster Gattung von . Dann können wir setzen:
Die vorläufig noch unbestimmten Koeffizienten sollen nun so bestimmt werden, daß sie den linearen Gleichungen:
genügen. Wenn man dann noch beachtet, daß diese Gleichungen nicht linear unabhängig sind, sondern daß zwischen ihnen Relationen
bestehen, so ist leicht zu erkennen, daß auch reduzierbar ist, und daß, so wie einer Schar von reduziblen Integralen angehört, auch ein Element einer fach unendlichen linearen Schar von reduziblen Integralen ist. Doch dies nur nebenbei.
Ich bemerke nun, daß eine lineare Funktion der ist, sodaß ich schreiben kann:
wo die ganze rationale Zahlen sind. Aus den und den kann ich nun zwei Tabellen von je Kolonnen und Zeilen bilden. Aus beiden kann ich gewisse -reihige Determinanten bilden. Ich bezeichne die der mit und die aus denselben Zeilen der gebildete mit . Dann setze ich
ist nun in dem folgenden Sinne eine invariante Zahl: Sie bleibt ungeändert, wenn man irgendeines der Periodensysteme oder durch ein äquivalentes ersetzt. Dabei heißen zwei Periodensysteme äquivalent, wenn sie sich ganzzahlig und linear durcheinander ausdrücken lassen. Man kann nun einerseits beweisen, daß
andererseits aber, daß
Daraus kann man folgern, daß
Das ist der erste Beweis. Der nun folgende
Zweite Beweis ist wesentlich kürzer. Er beruht auf dem Vergleich der zu und gehörigen Bilinearformen und . Man hat nämlich einerseits
andererseits
Daraus schließt man
Ich komme nun zum Zusammenhang der Reduktionstheorie mit der Theorie der Fuchsschen Funktionen.
Bekanntlich definiert jede algebraische Kurve ein System von Fuchsschen Funktionen. Nun kann man die Tatsache, daß ein Vielfaches von ist, auch folgendermaßen ausdrücken. Es ist immer auf mannigfache Weise möglich, der Kurve eine Grenzkreisgruppe und eine ebensolche Gruppe zuzuordnen, sodaß eine Untergruppe von ist. Ist im besonderen ein -faches von , dann ist eine Untergruppe vom Index von . Man erhält daher einen Fundamentalbereich von dadurch, daß man geeignet gewählte Fundamentalbereiche von , die durch die Operationen von auseinander hervorgehen, aneinander lagert. Das Polygon von erscheint dann in Polygone eingeteilt, die einem Polygon von im Sinne der nichteuklidischen Geometrie kongruent sind.
Ich bezeichne die Seiten des Polygons mit und die homologen Seiten von mit . Die Seiten liegen entweder im Innern oder auf dem Rande von . Ich nehme nun an, die Seite gehe aus vermöge einer Operation von hervor. Wenn nun auf dem Rande von liegt, dann gibt es eine weitere Seite auf diesem Rande, die mit vermöge einer Operation von konjugiert ist. Wenn jedoch im Innern von liegt, so existiert eine derartige von verschiedene Seite nicht, sondern es fallen und zusammen und bilden die gemeinsame Seite von und . Aber wie dem auch sei, jedenfalls entspricht jeder Seite von eine Permutation der Ziffern , , , .
Eine der eben durchgeführten ganz ähnliche Betrachtung können wir auch für die Ecken von anstellen. So wie wir nämlich die Seiten in Paare zusammenfaßten, so können wir die Ecken in Zyklen einteilen, so daß die Ecken eines Zyklus auseinander durch die Operationen von hervorgehen. Jedem solchen Zyklus kann wieder eine bestimmte Vertauschung der Ziffern , , , zugeordnet werden, die sich aus den den Seiten zugeordneten gewinnen läßt. Ich nehme nun an, es habe Seiten und Eckenzyklen. und sollen die gleiche Bedeutung für haben. Die einem Eckenzyklus von entsprechende Permutation läßt sich in zyklische Permutationen zerlegen. Bei allen Eckenzyklen mögen dabei im ganzen zyklische Permutationen von gerade Ziffern vorkommen. Dann bestehen die folgenden Relationen:
Die bisher gegebenen allgemeinen Betrachtungen setzen uns nun instand, eine Reihe schöner und wichtiger Sätze über die nichteuklidische Geometrie der Kreisbogenpolygone, sowie über die Geometrie der algebraischen Kurven abzuleiten. Ich will im folgenden einige Beispiele solcher Sätze anführen, ohne mich des näheren auf Beweise einzulassen, deren Grundzüge übrigens im vorstehenden enthalten sind.
1) , , , .
Mit und sind dabei die Ordnungen der Kurven und bezeichnet. hat keinen Doppelpunkt, hat einen Doppelpunkt. Von den 28 Doppeltangenten von gehen sechs durch einen Punkt außerhalb der Kurve.
2) , , , , .
hat zwei Doppelpunkte, nur einen. Setzt man die Differentiale der reduziblen Integrale erster Gattung gleich Null, so erhält man ein Kegelschnittbüschel, dessen vier Basispunkte von den beiden Doppelpunkten von und zwei weiteren Punkten derselben Kurve gebildet werden. Sechs dieser Kegelschnitte berühren doppelt. Derjenige derselben, der in einem Basispunkte berührt, oskuliert daselbst.
3) , , .
Die Kurve ist ein Vielfaches von zwei verschiedenen Kurven und . Es existiert eine Fuchssche Gruppe , zu der man sowohl ein erstes Polygon konstruieren kann, das aus zwei Polygonen einer zu gehörigen Gruppe besteht, als auch ein zweites Polygon , das aus zwei Polygonen einer zu gehörigen Gruppe besteht. ist also sowohl in als in als Untergruppe vom Index enthalten. Die nebenstehende schematische Figur möge zur Veranschaulichung der Verhältnisse dienen. Die beiden eben erwähnten Fundamentalbereiche und von sind durch die Polygone mit den Ecken bzw. dargestellt. Jedes derselben zerfällt in zwei Sechsecke, die bzw. Fundamentalbereiche von oder sind. Um die Äquivalenz von und besser hervortreten zu lassen, sind die Symmetriezentren der erwähnten Sechsecke mit den Seitenmitten verbunden, sodaß alle Polygone sich in leicht ersichtlicher Weise aus den so entstehenden Vierecken aufbauen.
Ich gehe nun zu den Sätzen aus der Geometrie der algebraischen Kurven über, die uns dieses Beispiel lehrt. Wenn ich auf einen Punkt markiere, so entsprechen diesem zwei Punkte und auf . Jedem von diesen entspricht ein Punkt von : , . Es entsprechen also im allgemeinen jedem Punkte von zwei Punkte von . Ebenso kann man schließen, daß im allgemeinen jedem Punkte von zwei Punkte von entsprechen. Die Korrespondenz hat aber zwei Verzweigungspunkte , . Jedem von ihnen entspricht also nur ein Punkt von und also auch nur ein Punkt von : , . Ebenso hat die Korrespondenz zwei Verzweigungspunkte , . Jedem von ihnen ist nur ein Punkt von zugeordnet: , . Wir können dann den ersten Satz, den wir anführen wollen, so aussprechen:
und einerseits und und andererseits fallen zusammen.
Ich gehe zum zweiten Satz über, der sich ergibt, wenn man und als Kurven dritter Ordnung voraussetzt.
Ich kann in die Tangente an ziehen. Ich verbinde ferner und durch eine Sekante. Diese beiden Geraden schneiden sich auf . Ebenso kann ich in die Tangente an ziehen und mit der Sekante zum Schnitt bringen. Der Schnittpunkt liegt auf .
Diese wenigen Beispiele lassen zur Genüge erkennen, wie zahlreich die besonderen Fälle sind.
Fünfter Vortrag
Über transfinite Zahlen
Meine Herren! Ich will heute über den Begriff der transfiniten Kardinalzahl vor Ihnen sprechen; und zwar will ich zunächst von einem scheinbaren Widerspruch reden, den dieser Begriff enthält. Dazu schicke ich folgendes voraus: meiner Ansicht nach ist ein Gegenstand nur dann denkbar, wenn er sich mit einer endlichen Anzahl von Worten definieren läßt. Einen Gegenstand, der in diesem Sinne endlich definierbar ist, will ich zur Abkürzung einfach “definierbar” nennen. Demnach ist also ein nicht definierbarer Gegenstand auch undenkbar. Desgleichen will ich ein Gesetz “aussagbar” nennen, wenn es in einer endlichen Anzahl von Worten ausgesagt werden kann.
Herr Richard hat nun bewiesen, daß die Gesamtheit der definierbaren Gegenstände abzählbar ist, d. h. daß die Kardinalzahl dieser Gesamtheit ist. Der Beweis ist ganz einfach: sei die Anzahl der Wörter des Wörterbuches, dann kann man mit Wörtern höchstens Gegenstände definieren. Läßt man nun über alle Grenzen wachsen, so sieht man, daß man nie über eine abzählbare Gesamtheit hinauskommt. Die Mächtigkeit der Menge der denkbaren Gegenstände wäre also . Herr Schoenflies hat gegen diesen Beweis eingewandt, daß man mit einer einzigen Definition mehrere, ja sogar unendlich viele Gegenstände definieren könne. Als Beispiel führt er die Definition der konstanten Funktionen an, deren es offenbar unendlich viele gibt. Dieser Einwand ist deshalb unzulässig, weil durch solche Definitionen gar nicht die einzelnen Gegenstände, sondern ihre Gesamtheit, in unserem Beispiel also die Menge der konstanten Funktionen definiert wird, und diese ist ein einziger Gegenstand. Der Einwand von Herrn Schoenflies ist also nicht stichhaltig.
Nun hat bekanntlich Cantor bewiesen, daß das Kontinuum nicht abzählbar ist; dies widerspricht dem Beweise von Richard. Es fragt sich also, welcher von beiden Beweisen richtig ist. Ich behaupte, sie sind beide richtig, und der Widerspruch ist nur ein scheinbarer. Zur Begründung dieser Behauptung will ich einen neuen Beweis für den Cantorschen Satz geben: Wir nehmen also an, es sei eine Strecke gegeben und ein Gesetz, durch welches jedem Punkte der Strecke eine ganze Zahl zugeordnet wird. Wir wollen der Einfachheit halber die Punkte durch die ihnen zugeordneten Zahlen bezeichnen. Wir teilen nun unsere Strecke durch zwei beliebige Punkte und in drei Teile, die wir als Unterstrecken . Stufe bezeichnen; diese teilen wir wieder in je drei Teile und erhalten Unterstrecken . Stufe; dieses Verfahren denken wir uns ins Unendliche fortgesetzt, wobei die Länge der Unterstrecken unter jede Grenze sinken soll. Der Punkt gehört nun einer oder höchstens, wenn er mit oder zusammenfällt, zweien der Unterstrecken erster Stufe an, es gibt also sicher eine, der er nicht angehört. Auf dieser suchen wir den Punkt mit der niedrigsten Nummer, die nun mindestens sein muß, auf. Unter den Unterstrecken . Stufe, die zu derjenigen Strecke . Stufe gehören, auf der wir uns befinden, ist nun wieder mindestens eine, der der zuletzt betrachtete Punkt nicht angehört. Auf dieser setzen wir das Verfahren fort und erhalten so eine Folge von Strecken, die folgende Eigenschaften hat: jede von ihnen ist in allen vorhergehenden enthalten, und eine Strecke Stufe enthält keinen der Punkte bis . Aus der ersten Eigenschaft folgt, daß es mindestens einen Punkt geben muß, der ihnen allen gemeinsam ist; aus der zweiten Eigenschaft folgt aber, daß die Nummer dieses Punktes größer sein muß als jede endliche Zahl, d. h. es kann ihm keine Zahl zugeordnet werden.
Was haben wir nun zu diesem Beweise vorausgesetzt? Wir haben ein Gesetz vorausgesetzt, das jedem Punkte der Strecke eine ganze Zahl zuordnet. Dann konnten wir einen Punkt definieren, dem keine ganze Zahl zugeordnet ist. In dieser Hinsicht unterscheiden sich die verschiedenen Beweise dieses Satzes nicht. Dazu mußte aber das Gesetz zuerst feststehen. Nach Richard müßte anscheinend ein solches Gesetz existieren, aber Cantor hat das Gegenteil bewiesen. Wie kommen wir aus diesem Dilemma heraus? Fragen wir einmal nach der Bedeutung des Wortes “definierbar”. Wir nehmen die Tafel aller endlichen Sätze und streichen daraus alle diejenigen, die keinen Punkt definieren. Die Übrigbleibenden ordnen wir den ganzen Zahlen zu. Wenn wir jetzt die Durchmusterung der Tafel von neuem vornehmen, so wird es sich im allgemeinen zeigen, daß wir jetzt einige Sätze stehen lassen müssen, die wir vorher gestrichen haben. Denn die Sätze, in welchen man von dem Zuordnungsgesetz selbst sprach, hatten früher keine Bedeutung, da die Punkte den ganzen Zahlen noch nicht zugeordnet waren. Diese Sätze haben jetzt eine Bedeutung, und müssen in unserer Tafel bleiben. Würden wir jetzt ein neues Zuordnungsgesetz aufstellen, so würde sich dieselbe Schwierigkeit wiederholen und so ad infinitum. Hierin liegt aber die Lösung des scheinbaren Widerspruchs zwischen Cantor und Richard. Sei die Menge der ganzen Zahlen, die Menge der nach der ersten Durchmusterung der Tafel aller endlichen Sätze definierbaren Punkte unserer Strecke, das Gesetz der Zuordnung zwischen beiden Mengen. Durch dieses Gesetz kommt eine neue Menge von Punkten als definierbar hinzu. Zu gehört aber ein neues Gesetz , dadurch entsteht eine neue Menge usw. Richards Beweis lehrt nun, daß, wo ich auch das Verfahren abbreche, immer ein Gesetz existiert, während Cantor beweist, daß das Verfahren beliebig weit fortgesetzt werden kann. Es besteht also kein Widerspruch zwischen beiden.
Der Schein eines solchen rührt daher, daß dem Zuordnungsgesetz von Richard eine Eigenschaft fehlt, die ich mit einem von den englischen Philosophen entlehnten Ausdruck als “prädikativ” bezeichne. (Bei Russell, dem ich das Wort entlehne, ist eine Definition zweier Begriffe und nicht prädikativ, wenn in der Definition von und umgekehrt vorkommt.) Ich verstehe darunter folgendes: Jedes Zuordnungsgesetz setzt eine bestimmte Klassifikation voraus. Ich nenne nun eine Zuordnung prädikativ, wenn die zugehörige Klassifikation prädikativ ist. Eine Klassifikation aber nenne ich prädikativ, wenn sie durch Einführung neuer Elemente nicht verändert wird. Dies ist aber bei der Richardschen nicht der Fall, vielmehr ändert die Einführung des Zuordnungsgesetzes die Einteilung der Sätze in solche, die eine Bedeutung haben, und solche, die keine haben. Was hier mit dem Wort “prädikativ” gemeint ist, läßt sich am besten an einem Beispiel illustrieren: wenn ich eine Menge von Gegenständen in eine Anzahl von Schachteln einordnen soll, so kann zweierlei eintreten: entweder sind die bereits eingeordneten Gegenstände endgültig an ihrem Platze, oder ich muß jedesmal, wenn ich einen neuen Gegenstand einordne, die anderen oder wenigstens einen Teil von ihnen wieder herausnehmen. Im ersten Falle nenne ich die Klassifikation prädikativ, im zweiten nicht. Ein gutes Beispiel für eine nicht prädikative Definition hat Russell gegeben: sei die kleinste ganze Zahl, deren Definition mehr als hundert deutsche Worte erfordert. muß existieren, da man mit hundert Worten jedenfalls nur eine endliche Anzahl von Zahlen definieren kann. Die Definition, die wir eben von dieser Zahl gegeben haben, enthält aber weniger als hundert Worte. Und die Zahl ist also definiert als undefinierbar.
Zermelo hat nun gegen die Verwerfung der nicht prädikativen Definitionen den Einwand erhoben, daß damit auch ein großer Teil der Mathematik hinfällig würde, z. B. der Beweis für die Existenz einer Wurzel einer algebraischen Gleichung.
Dieser Beweis lautet bekanntlich folgendermaßen:
Gegeben ist eine Gleichung . Man beweist nun, daß ein Minimum haben muß; sei einer der Argumentwerte, für den das Minimum eintritt, also
Daraus folgt dann weiter, daß ist. Hier ist nun die Definition von nicht prädikativ, denn dieser Wert hängt ab von der Gesamtheit der Werte von , zu denen er selbst gehört.
Die Berechtigung dieses Einwandes kann ich nicht zugeben. Man kann den Beweis so umformen, daß die nicht prädikative Definition daraus verschwindet. Ich betrachte zu diesem Zwecke die Gesamtheit der Argumente von der Form , wo , , ganze Zahlen sind. Dann kann ich dieselben Schlüsse wie vorher ziehen, aber der Argumentwert, für den das Minimum von eintritt, gehört im allgemeinen nicht zu den betrachteten. Dadurch ist der Zirkel im Beweise vermieden. Man kann von jedem mathematischen Beweise verlangen, daß die darin vorkommenden Definitionen usw. prädikativ sind, sonst wäre der Beweis nicht streng.
Wie steht es nun mit dem klassischen Beweise des Bernsteinschen Theorems? Ist er einwandfrei? Das Theorem sagt bekanntlich aus, daß, wenn drei Mengen , , gegeben sind, wo in und in enthalten ist, und wenn äquivalent ist, auch äquivalent sein muß. Es handelt sich also auch hier um ein Zuordnungsgesetz. Wenn das erste Zuordnungsgesetz (zwischen und ) prädikativ ist, so zeigt der Beweis, daß es auch ein prädikatives Zuordnungsgesetz zwischen und geben muß.
Was nun die zweite transfinite Kardinalzahl betrifft, so bin ich nicht ganz überzeugt, daß sie existiert. Man gelangt zu ihr durch Betrachtung der Gesamtheit der Ordnungszahlen von der Mächtigkeit ; es ist klar, daß diese Gesamtheit von höherer Mächtigkeit sein muß. Es fragt sich aber, ob sie abgeschlossen ist, ob wir also von ihrer Mächtigkeit ohne Widerspruch sprechen dürfen. Ein aktual Unendliches gibt es jedenfalls nicht.
Was haben wir von dem berühmten Kontinuumproblem zu halten? Kann man die Punkte des Raumes wohlordnen? Was meinen wir damit? Es sind hier zwei Fälle möglich: entweder behauptet man, daß das Gesetz der Wohlordnung endlich aussagbar ist, dann ist diese Behauptung nicht bewiesen; auch Herr Zermelo erhebt wohl nicht den Anspruch, eine solche Behauptung bewiesen zu haben. Oder aber wir lassen auch die Möglichkeit zu, daß das Gesetz nicht endlich aussagbar ist. Dann kann ich mit dieser Aussage keinen Sinn mehr verbinden, das sind für mich nur leere Worte. Hier liegt die Schwierigkeit. Und das ist wohl auch die Ursache für den Streit über den fast genialen Satz Zermelos. Dieser Streit ist sehr merkwürdig: die einen verwerfen das Auswahlpostulat, halten aber den Beweis für richtig, die anderen nehmen das Auswahlpostulat an, erkennen aber den Beweis nicht an.
Doch ich könnte noch manche Stunde darüber sprechen, ohne die Frage zu lösen.
Sechster Vortrag
La mécanique nouvelle
Mesdames, messieurs!
Aujourd’hui, je suis obligé de parler français, et il faut que je m’en excuse. Il est vrai que dans mes précédentes conférences je me suis exprimé en allemand, en un très mauvais allemand: parler les langues étrangères, voyez-vous, c’est vouloir marcher lorsqu’on est boiteux; il est nécessaire d’avoir des béquilles; mes béquilles, c’étaient jusqu’ici les formules mathématiques et vous ne sauriez vous imaginer quel appui elles sont pour un orateur qui ne se sent pas très solide. Dans la conférence de ce soir, je ne veux pas user de formules, je suis sans béquilles, et c’est pourquoi je dois parler français.
En ce monde, vous le savez, il n’est rien de définitif, rien d’immuable; les empires les plus puissants, les plus solides, ne sont pas éternels: c’est là un thème que les orateurs sacrés se sont plu bien souvent à développer. Les théories scientifiques sont comme les empires, elles ne sont pas assurées du lendemain. Si l’une d’elles semblait à l’abri des injures du temps, c’était, certes, la mécanique newtonienne: elle paraissait incontestée, c’était un monument impérissable; et voilà qu’à son tour, je ne dirai pas que le monument est par terre, ce serait prématuré, mais en tout cas il est fortement ébranlé. Il est soumis aux attaques de grands démolisseurs: vous en avez un parmi vous, M. Max Abraham, un autre est le physicien hollandais M. Lorentz. Je voudrais, en quelques mots, vous parler des ruines de l’ancien édifice et du nouveau bâtiment que l’on veut élever à leur place.
Tout d’abord qu’est-ce qui caractérisait l’ancienne mécanique? C’était ce fait très simple: je considère un corps en repos, je lui communique une impulsion, c’est à dire je fais agir sur lui, pendant un temps donné une force donnée; le corps se met en mouvement, acquiert une certaine vitesse; le corps étant animé de cette vitesse, faisons agir encore la même force pendant le même temps, la vitesse sera doublée; si nous continuons encore, la vitesse sera triplée après que nous aurons une troisième fois donné une impulsion identique. Recommençons ainsi un nombre suffisant de fois, le corps finira par acquérir une vitesse très grande, qui pourra dépasser toute limite, une vitesse infinie.
Dans la nouvelle mécanique, au contraire, on suppose qu’il est impossible de communiquer à un corps partant du repos une vitesse supérieure à celle de la lumière. Que se passe-t-il? Je considère le même corps au repos; je lui donne une première impulsion, la même que précédemment, il prendra la même vitesse; renouvelons une seconde fois cette impulsion, la vitesse va encore augmenter, mais elle ne sera plus doublée; une troisième impulsion produira un effet analogue, la vitesse augmente mais de moins en moins, le corps oppose une résistance qui devient de plus en plus grande. Cette résistance, c’est l’inertie, c’est ce qu’on appelle communément la masse; tout ce passe alors dans cette nouvelle mécanique comme si la masse n’était pas constante, mais croissait avec la vitesse. Nous pouvons représenter graphiquement les phénomènes: dans l’ancienne mécanique, le corps prend après la première impulsion une vitesse representée par le segment ; après la deuxième impulsion s’accroît d’un segment qui lui est égal, à chaque nouvelle impulsion, la vitesse s’accroît de la même quantité, le segment qui la représente s’accroît d’une longueur constante; dans la nouvelle mécanique, le segment vitesse s’accroît de segments , , …qui sont de plus en plus petits et tels que nous ne pouvons pas dépasser une certaine limite, la vitesse de la lumière.
Comment a-t-on été conduit à de telles conclusions? A-t-on fait des expériences directes? Les divergences ne se produiront que pour les corps animés de grandes vitesses; c’est alors seulement que les différences signalées deviennent sensibles. Mais, qu’est-ce qu’une très grande vitesse? Est-ce celle d’une automobile qui fait 100 kilomètres à l’heure; on s’extasie dans la rue sur une telle rapidité; à notre point de vue, c’est pourtant bien peu, une vitesse d’escargot. L’astronomie nous donne mieux: Mercure, le plus rapide des corps célestes parcourt lui aussi 100 kilomètres environ, non plus à l’heure mais à la seconde: pourtant, cela ne suffit pas encore, de telles vitesses sont trop faibles pour révéler les différences que nous voudrions observer. Je ne parle pas de nos boulets de canon, ils sont plus rapides que les automobiles, mais beaucoup plus lents que Mercure; vous savez cependant qu’on a découvert une artillerie dont les projectiles sont beaucoup plus vite: je veux parler du radium qui envoie dans tous les sens de l’énergie, des projectiles; la rapidité du tir est bien plus grande, la vitesse initiale est de kilomètres par seconde, le tiers de la vitesse de la lumière; le calibre des projectiles, leur poids, sont, il est vrai, bien plus faibles et nous ne devons pas compter sur cette artillerie pour augmenter la puissance militaire de nos armées. Peut-on expérimenter sur ces projectiles? De telles expériences ont été effectivement tentées; sous l’influence d’un champ électrique, d’un champ magnétique il se produit une déviation qui permet de se rendre compte de l’inertie et de la mesurer. On a constaté ainsi que la masse dépend de la vitesse et énoncer cette loi: L’inertie d’un corps croît avec sa vitesse qui reste inférieure à celle de la lumière, kilomètres par seconde.
Je passe maintenant au deuxième principe, le principe de relativité. Je suppose un observateur qui se déplace vers la droite; tout se passe pour lui comme s’il était au repos, les objets qui l’entourent se déplaçant vers la gauche: aucun moyen ne permet de savoir si les objets se déplacent réellement, si l’observateur est immobile ou en mouvement. On l’enseigne dans tous les cours de mécanique, le passager sur le bateau croit voir le rivage du fleuve se déplacer, tandis qu’il est doucement entraîné par le mouvement du navire. Examinée de plus près, cette simple notion acquiert une importance capitale; on n’a aucun moyen de trancher la question, aucune experience ne peut mettre en defaut le principe: il n’y a pas d’espace absolu, tous les déplacements que nous pouvons observer sont des deplacements relatifs. Ces considerations bien familières aux philosophes, j’ai eu quelquefois l’occasion de les exprimer: j’en ai même recueilli une publicité dont je me serais volontiers passé, tous les journaux réactionnaires français m’ont fait démontrer que le soleil tournait autour de la terre; dans le fameux procès entre l’Inquisition et Galilée, Galilée aurait eu tous les torts.
Revenons à l’ancienne mécanique: elle admettait le principe de relativité; au lieu d’être fondées sur des expériences, ses lois étaient déduites de ce principe fondamental. Ces considerations suffisaient pour les phénomènes purement mécaniques, mais cela n’allait plus pour d’importantes parties de la physique, l’optique par exemple. On considérait comme absolue la vitesse de la lumière relativement à l’éther: cette vitesse pouvait être mesurée, on avait théoriquement le moyen de comparer le déplacement d’un mobile à un deplacement absolu, le moyen de décider si oui ou non un corps était en mouvement absolu.
Des expériences délicates, des appareils extrêmement précis, que je ne décrirai pas devant vous, ont permis d’essayer la réalisation pratique d’une pareille comparaison: le résultat a été nul. Le principe de rélativite n’admet aucune restriction dans la nouvelle mécanique; il a, si j’ose ainsi dire, une valeur absolue.
Pour comprendre le rôle que joue le principe de relativité dans la Nouvelle Mécanique, nous sommes d’abord amenés à parler du temps apparent, une invention fort ingénieuse du physicien Lorentz. Nous supposons deux observateurs l’un à Paris, l’autre à Berlin. et ont des chronomètres identiques et veulent les régler: mais ce sont des observateurs méticuleux comme il n’y en a guère; ils exigent dans leur réglage une extraordinaire exactitude: ce sera, par exemple, non une seconde, mais un milliardième de seconde. Comment pourront-ils faire? De Paris à Berlin, envoie un signal télégraphique, avec un sans-fil, si vous voulez, pour être tout à fait moderne. note le moment de la réception et ce sera pour les deux chronomètres l’origine des temps. Mais le signal emploie un certain temps pour aller de Paris à Berlin, il ne va qu’avec la vitesse de la lumière; la montre de serait donc en retard; est trop intelligent pour ne point s’en rendre compte; il va remédier a cet inconvenient. La chose semble bien simple: on croîse les signaux, reçoit et envoie, on prend la moyenne des corrections ainsi faites, on a l’heure exacte. Mais cela est-il bien certain? Nous supposons que de à le signal emploie le même temps que pour aller de à . Or et sont emportés dans le mouvement de la terre par rapport à l’éther, véhicule des ondes électriques. Quand a envoyé son signal il fuit devant lui, s’éloigne de même, le temps employé sera plus long que si les deux observateurs étaient au repos; si au contraire c’est qui envoie, qui reçoit, le temps est plus court parce que va au devant des signaux; il leur est absolument impossible de savoir si leurs chronomètres marquent ou non la même heure. Quelle que soit la méthode employée les inconvénients restent les mêmes l’observation d’un phénomène astronomique, une méthode optique quelconque se heurtent aux mêmes difficultés, ne pourra jamais connaître qu’une différence apparente de temps, qu’une espèce d’heure locale. Le principe de relativité s’applique intégralement.
Dans l’ancienne mécanique pourtant, on démontrait avec ce principe toutes les lois fondamentales. On pourrait être tenté de reprendre les raisonnements classiques et de raisonner comme il suit? Soit encore deux observateurs, et pour les nommer comme on nomme toujours deux observateurs en mathématiques; supposons les en mouvement, s’éloignant l’un de l’autre; aucun d’eux ne peut dépasser la vitesse de la lumière; par exemple sera animé de kilométres vers la droite, de vers la gauche. peut se croire au repos et la vitesse apparente de sera, pour lui, kilomètres. Si connait la mécanique nouvelle il se dira: a une vitesse qu’il ne peut atteindre, c’est donc que moi aussi je suis en mouvement. Il semble qu’il pourrait décider de sa situation absolue. Mais il faudrait qu’il puisse observer le mouvement de lui-même; pour faire cette observation et commencent par régler leurs montres, puis envoie à des télégrammes pour lui indiquer ses positions successives; en les réunissant peut se rendre compte du mouvement de et tracer la courbe de ce mouvement. Or les signaux se propagent avec la vitesse de la lumière; les montres qui marquent le temps apparent varient à chaque instant et tout se passera comme si la montre de avançait. croira aller beaucoup moins vite et la vitesse apparente qu’il aura relativement à ne dépassera pas la limite qu’elle ne doit pas atteindre. Rien ne pourra révéler à s’il est en mouvement ou en repos absolu.
Il faut encore faire une troisième hypothèse beaucoup plus surprenante, beaucoup plus difficile à admettre, qui gêne beaucoup nos habitudes actuelles. Un corps en mouvement de translation subit une déformation dans le sens même où il se déplace; une sphère, par exemple, devient comme une espèce d’ellipsoïde aplati dont le petit axe serait parallèle à la translation. Si l’on ne s’aperçoit pas tous les jours d’une transformation pareille c’est qu’elle est d’une petitesse qui la rend presque imperceptible. La terre, emportée dans sa révolution sur son orbite se déforme environ de : pour observer un pareil phénomène il faudrait des instruments de mesure d’une précision extrême, mais leur précision serait infinie qu’on n’en serait pas plus avancé car emportés eux aussi dans le mouvement ils subiront la même transformation. On ne s’apercevra de rien; le mètre que l’on pourrait employer deviendra plus court comme la longueur qu’on mesure. On ne peut savoir quelque chose qu’en comparant à la vitesse de la lumière la longueur de l’un de ces corps. Ce sont là de delicates experiences, réalisées par Michelson et dont je ne vous exposerai pas le détail; elles ont donné des résultats tout à fait remarquables; quelqu’étranges qu’il nous paraissent, il faut admettre que la troisième hypothèse est parfaitement vérifiée.
Telles sont les bases de la nouvelle mécanique, avec l’appui de ces hypothèses on trouve qu’elle est compatible avec le principe de relativité.
Mais il faut la rattacher alors à une conception nouvelle de la matière.
Pour le physicien moderne, l’atome n’est plus l’élément simple; il est devenu un véritable univers dans lequel des milliers de planètes gravitent autour de soleils minuscules. Soleils et planètes sont ici des particules électrisées soit négativement soit positivement; le physicien les appelle électrons et bâtit le monde avec elles. D’aucuns se représentent l’atome neutre comme une masse centrale positive autour de laquelle circulent un grand nombre d’électrons chargés négativement, dont la masse électrique totale est égale en grandeur à celle du noyau central.
Cette conception de la matière permet de rendre compte aisément de l’augmentation de la masse d’un corps avec sa vitesse, dont nous avons fait un des caractères de la mécanique nouvelle. Un corps quelconque n’étant qu’un assemblage d’électrons, il nous suffira de le montrer sur ces derniers. Remarquons, à cet effet, qu’un électron isolé se déplaçant à travers l’éther engendre un courant électrique, c’est-à-dire un champ électromagnétique. Ce champ correspond à une certaine quantité d’énergie localisée non dans l’électron, mais dans l’éther. Une variation en grandeur ou en direction de la vitesse de l’électron modifie le champ et se traduit par une variation de l’énergie électromagnétique de l’éther. Alors que dans la mécanique newtonienne la dépense d’énergie n’est due qu’à l’inertie du corps en mouvement, ici une partie de cette dépense est due à ce que l’on peut appeler l’inertie de l’éther relativement aux forces électromagnétiques. L’inertie de l’éther augmente avec la vitesse et sa limite devient infinie lorsque la vitesse tend vers la vitesse de la lumière. La masse apparente de l’électron augmente donc avec la vitesse; les expériences de Kaufmann montrent que la masse réelle constante de l’électron est négligeable par rapport à la masse apparente et peut être considérée comme nulle.
Dans cette nouvelle conception, la masse constante de la matière a disparu. L’éther seul, et non plus la matière, est inerte. Seul l’éther oppose une résistance au mouvement, si bien que l’on pourrait dire: il n’y a pas de matière, il n’y a que des trous dans l’éther. Pour les mouvements stationnaires ou quasi-stationnaires, la mécanique nouvelle ne diffère pas — au degré d’approximation de nos mesures près — de la mécanique newtonienne, avec cette seule différence que la masse n’est plus indépendante ni de la vitesse, ni de l’angle que fait cette vitesse avec la direction de la force accélératrice. Si par contre la vitesse a une accélération considérable, dans le cas, par ex., d’oscillations très rapides, il y a production d’ondes hertziennes représentant une perte d’énergie de l’électron entraînant l’amortissement de son mouvement. Ainsi, dans la télégraphie sans fil, les ondes émises sont dues aux oscillations des électrons dans la décharge oscillante.
Des vibrations analogues ont lieu dans une flamme et de même encore dans un solide incandescent. Pour Lorentz, il circule à l’intérieur d’un corps incandescent un nombre considérable d’électrons qui, ne pouvant pas en sortir, volent dans tous les sens et se réfléchissent sur sa surface. On pourrait les comparer à une nuée de moucherons enfermés dans un bocal et venant frapper de leurs ailes les parois de leur prison. Plus la temperature est élevée, plus le mouvement de ces électrons est rapide et plus les chocs mutuels et les réflexions sur la paroi sont nombreuses. A chaque choc et à chaque réflexion une onde électromagnétique est émise et c’est la perception de ces ondes qui nous fait paraître le corps incandescent.
Le mouvement des électrons est presque tangible, dans un tube de Crookes. Il s’y produit un véritable bombardement d’électrons partant de la cathode. Ces rayons cathodiques frappent violemment l’anticathode et s’y réfléchissent en partie donnant ainsi naissance à un ébranlement électromagnétique que plusieurs physiciens identifient avec les rayons Röntgen.
Il nous reste en terminant à examiner les relations de la mécanique nouvelle avec l’astronomie. La notion de masse constante d’un corps s’évanouissant, que deviendra la loi de Newton? Elle ne pourra subsister que pour des corps en repos. De plus il faudra tenir compte du fait que l’attraction n’est pas instantanée. On peut donc se demander avec raison si la mécanique nouvelle ne va réussir qu’à compliquer l’astronomie sans obtenir une approximation supérieure a celle que nous donne la mécanique céleste classique. Mr. Lorentz a abordé la question. Partant de la loi de Newton supposée vraie pour deux corps électrisés au repos, il calcule l’action électrodynamique des courants engendrés par ces corps en mouvement; il obtient ainsi une nouvelle loi d’attraction contenant les vitesses des deux corps comme paramètres. Avant d’examiner comment cette loi rend compte des phénomènes astronomiques, remarquons encore que l’accélération des corps célestes a comme conséquence un rayonnement électromagnétique, donc une dissipation de l’énergie se faisant ressentir en retour par un amortissement de leur vitesse. A la longue, les planètes finiront donc par tomber sur le soleil. Mais cette perspective ne peut guère nous effrayer, la catastrophe ne pouvant arriver que dans quelques millions de milliards de siècles. Revenant maintenant à la loi d’attraction, nous voyons aisément que la différence entre les deux mécaniques sera d’autant plus grande que la vitesse des planètes sera plus grande. S’il y a une différence appréciable, ce sera donc pour Mercure qu’elle sera la plus grande, Mercure ayant de toutes les planètes la plus grande vitesse. Or il arrive justement que Mercure présente une anomalie non encore expliquée: le mouvement de son périhélie est plus rapide que le mouvement calculé par la theorie classique. L’accélération est de 38" trop grande. Leverrier attribua cette anomalie à une planète non encore découverte et un astronome amateur crut observer son passage au soleil. Depuis lors plus personne ne l’a vue et il est malheureusement certain que cette planète aperçue n’était qu’un oiseau. Or la mécanique nouvelle rend bien compte du sens de l’erreur relative à Mercure, mais elle laisse cependant encore une marge de 32" entre elle et l’observation. Elle ne suffit donc pas à ramener la concordance dans la théorie de Mercure. Si ce résultat n’est guère décisif en faveur de la mécanique nouvelle, il est encore moins défavorable à son acceptation puisque le sens dans lequel elle corrige l’écart de la théorie classique est le bon. La théorie des autres planètes n’est pas sensiblement modifié dans la nouvelle théorie et les résultats coïncident à l’approximation des mesures près à ceux de la théorie classique.
Pour conclure, il serait prématuré, je crois, malgré la grande valeur des arguments et des faits érigés contre elle, de regarder la mécanique classique comme définitivement condamnée. Quoiqu’il en soit d’ailleurs, elle restera la mécanique des vitesses très petites par rapport à celle de la lumière, la mécanique donc de notre vie pratique et de notre technique terrestre. Si cependant, dans quelques années sa rivale triomphe, je me permettrai de vous signaler un écueil pédagogique que n’éviteront pas nombre de maîtres, en France, tout au moins. Ces maîtres n’auront rien de plus pressé, en enseignant la mécanique élémentaire à leurs élèves, que de leur apprendre que cette mécanique là a fait son temps, qu’une mécanique nouvelle où les notions de masse et de temps ont une toute autre valeur la remplace; ils regarderont de haut cette mécanique périmée que les programmes les forcent à enseigner et feront sentir à leurs élèves le mépris qu’ils lui portent. Je crois bien cependant que cette mécanique classique dédaignée sera aussi nécessaire que maintenant et que celui qui ne la connaîtra pas à fond ne pourra comprendre la mécanique nouvelle.
Time-stamp: " 7.08.2023 16:09"