Sechs Vorträge über ausgewählte Gegenstände aus der
reinen Mathematik und mathematischen Physik

Henri Poincaré
1910



Mathematische Vorlesungen an der Universität Göttingen: IV

SECHS VORTRÄGE

ÜBER AUSGEWÄHLTE GEGENSTÄNDE

AUS DER REINEN MATHEMATIK

UND DER MATHEMATISCHEN PHYSIK


auf Einladung der Wolfskehl-Kommission der Königlichen Gesellschaft der Wissenschaften

gehalten zu Göttingen vom 22.–28. April 1909

von

HENRI POINCARÉ

Mitglied der Französischen Akademie

Professor an der Faculté des Sciences der Universität Paris


Mit 6 in den Text gedruckten Figuren

Leipzig und Berlin

Druck und Verlag von B. G. Teubner


1910

Préface

L’Université de Göttingen a bien voulu m’inviter à traiter devant un savant auditoire diverses questions d’Analyse pure, de Physique mathématique, d’Astronomie théorique et de Philosophie mathématique; les conférences que j’ai faites à cette occasion ont été recueillies par quelques étudiants qui ont eu la bonté de les rédiger en corrigeant les nombreuses offenses que j’avais faites à la grammaire allemande. Je leur en exprime ici toute ma reconnaissance.

Il convient également que je m’excuse auprès du public de la brièveté avec laquelle ces sujets sont traités. Je ne disposais pour exposer chacun d’eux que d’un temps très court, et je n’ai pu la plupart du temps que donner une idée générale des resultats, ainsi que des principes qui m’ont guidé dans les démonstrations, sans entrer dans les détails mêmes de ces démonstrations.

Inhaltsverzeichnis

Fünfter Vortrag. Über transfinite Zahlen.

Sechster Vortrag. La mécanique nouvelle.

Kapitel 1 Über die Fredholmschen Gleichungen

Die Integralgleichung

φ(x)=λabf(x,y)φ(y)𝑑y+ψ(x)\varphi(x)=\lambda\int\limits_{a}^{b}f(x,y)\varphi(y)dy+\psi(x) (1)

wird bekanntlich aufgelöst durch die Integralgleichung derselben Art

φ(x)=ψ(x)+λabψ(y)G(x,y)𝑑y,\varphi(x)=\psi(x)+\lambda\int\limits_{a}^{b}\psi(y)G(x,y)dy, (1a)

wobei

G(x,y)=N(x,y;λ|f)D(λ|f)G(x,y)=\frac{N(x,y;\lambda\,|\,f)}{D(\lambda\,|\,f)}

gesetzt ist. NN und DD sind, wie aus der Fredholmschen Theorie bekannt ist, zwei ganze transzendente Funktionen in bezug auf λ\lambda. Um ihre Entwicklung explizite hinschreiben zu können, bezeichne man, wie Fredholm, mit f(x1,x2,xny1,y2,yn)f\left(\begin{smallmatrix}x_{1},&x_{2},&\ldots&x_{n}\\ y_{1},&y_{2},&\ldots&y_{n}\end{smallmatrix}\right) diejenige nn-reihige Determinante, deren allgemeines Element f(xi,yk)f(x_{i},y_{k}) ist. Setzt man dann

an=abababf(x1,x2,xnx1,x2,xn)𝑑x1𝑑xn,a_{n}=\int\limits_{a}^{b}\int\limits_{a}^{b}\ldots\int\limits_{a}^{b}f(\begin{% smallmatrix}x_{1},&x_{2},&\ldots&x_{n}\\ x_{1},&x_{2},&\ldots&x_{n}\end{smallmatrix})dx_{1}\ldots dx_{n},

so hat man

D(λ)=0(-λ)nn!an.D(\lambda)=\sum_{0}^{\infty}\frac{(-\lambda)^{n}}{n!}a_{n}.

Diese Gleichung formen wir um, indem wir die durch „Iteration” aus f(x,y)f(x,y) entstehenden Kerne heranziehen. Setzen wir zunächst

f(xα,xβ)f(xβ,xγ)f(xλ,xμ)f(xμ,xα)=f(xα,xβ,xλ,xμ),f(x_{\alpha},x_{\beta})f(x_{\beta},x_{\gamma})\cdots f(x_{\lambda},x_{\mu})f(x% _{\mu},x_{\alpha})=f(x_{\alpha},x_{\beta},\cdots x_{\lambda},x_{\mu}),

so ist klar, daß f(x1,x2,xnx1,x2,xn)f\left(\begin{smallmatrix}x_{1},&x_{2},&\ldots&x_{n}\\ x_{1},&x_{2},&\ldots&x_{n}\end{smallmatrix}\right) die Form hat

±f(xα,xμ),\sum\pm\prod f(x_{\alpha},\ldots x_{\mu}),

wie sofort aus der Entwicklung der Determinante hervorgeht. Sei nun

bk=ababf(xα,xμ)𝑑xα𝑑xμ,b_{k}=\int_{a}^{b}\cdots\int_{a}^{b}f(x_{\alpha},\cdots x_{\mu})dx_{\alpha}% \cdots dx_{\mu},

wobei kk die Anzahl der Integrationsvariabeln xα,xμx_{\alpha},\ldots x_{\mu} bedeutet, so können wir offenbar auch setzen

bk=abfk(x,x)𝑑x,b_{k}=\int\limits_{a}^{b}f_{k}(x,x)dx,

wenn unter

fk(x,y)=ababf(x,xα)f(xα,xβ)f(xλ,y)𝑑xα𝑑xλf_{k}(x,y)=\int\limits_{a}^{b}\dotsi\int\limits_{a}^{b}f(x,x_{\alpha})f(x_{% \alpha},x_{\beta})\cdots f(x_{\lambda},y)dx_{\alpha}\cdots dx_{\lambda}

der “kk-fach iterierte Kern” verstanden wird.

Wir haben den obigen Relationen zufolge jetzt

an=±bk.a_{n}=\sum\pm\prod b_{k}.

Beachten wir nun, daß gewisse unter den in einem Produkt bk\prod b_{k} enthaltenen bkb_{k} einander gleich werden können, daß ferner gewisse der Produkte bk\prod b_{k} selbst einander gleich sein werden, nämlich solche, die durch eine Permutation der xix_{i} auseinander entstehen, so ergibt eine kombinatorische Betrachtung für ana_{n} einen Ausdruck von der Form

an=aα+bβ+cγ+=nn!aαbβcγa!b!c![(-1)α+1bα]a[(-1)β+1bβ]b[(-1)γ+1bγ]ca_{n}=\sum_{a\alpha+b\beta+c\gamma+\ldots=n}\frac{n!}{a^{\alpha}b^{\beta}c^{% \gamma}\cdots a!b!c!\cdots}[(-1)^{\alpha+1}b_{\alpha}]^{a}[(-1)^{\beta+1}b_{% \beta}]^{b}[(-1)^{\gamma+1}b_{\gamma}]^{c}\cdots

und also

D(λ)=a,b,c,1a!b!c!(-λαbαα)a(-λβbββ)b(-λγbγγ)cD(\lambda)=\sum_{a,b,c,\ldots}\frac{1}{a!b!c!\cdots}\left(-\frac{\lambda^{% \alpha}b_{\alpha}}{\alpha}\right)^{a}\left(-\frac{\lambda^{\beta}b_{\beta}}{% \beta}\right)^{b}\left(-\frac{\lambda^{\gamma}b_{\gamma}}{\gamma}\right)^{c}\cdots

d. h.

D(λ)=1e-λαbαα,D(\lambda)=\prod_{1}^{\infty}e^{-\frac{\lambda^{\alpha}b_{\alpha}}{\alpha}}, (2)

also

logD(λ)\displaystyle\log D(\lambda) =-λαbαα,\displaystyle=-\sum\frac{\lambda^{\alpha}b_{\alpha}}{\alpha}, (2a)
D(λ)D(λ)\displaystyle\frac{D^{\prime}(\lambda)}{D(\lambda)} =-λα-1bα.\displaystyle=-\sum\lambda^{\alpha-1}b_{\alpha}. (2b)

Den Zähler N(x,y;λ)N(x,y;\lambda) der Funktion G(x,y;λ)G(x,y;\lambda) kann man auf analoge Weise durch die Gleichung

N(x,y;λ)=D(λ)λhfh+1(x,y)N(x,y;\lambda)=D(\lambda)\cdot\sum\lambda^{h}f_{h+1}(x,y) (3)

definieren. Diese Gleichungen, welche sich übrigens schon bei Fredholm finden, sind nützlich als Ausgangspunkt für viele Betrachtungen, wie sich nun an einigen Beispielen zeigen wird.

Die Fredholmsche Methode ist unmittelbar gültig nur für solche Kerne f(x,y)f(x,y), die endlich bleiben. Wird der Kern an gewissen Stellen unendlich, so kann dennoch der Fall eintreten, daß ein iterierter Kern, etwa fn(x,y)f_{n}(x,y), endlich bleibt. Dann läßt sich die Integralgleichung mit dem iterierten Kerne nach Fredholm behandeln, und Fredholm zeigt, daß die ursprüngliche Integralgleichung (1) sich auf diese zurückführen läßt. Die Auflösung wird wieder durch eine Formel der Gestalt (1a) gegeben, nur ist jetzt

G=N1(x,y;λ)Dn(λ)G=\frac{N_{1}(x,y;\lambda)}{D_{n}(\lambda)}

zu setzen, wobei

Dn(λ)=D(λn|fn)D_{n}(\lambda)=D(\lambda^{n}\,|\,f_{n})

und

N1(x,y;λ)=Dn(λ)λhfh+1(x,y)N_{1}(x,y;\lambda)=D_{n}(\lambda)\cdot\sum\lambda^{h}f_{h+1}(x,y)

ist. Dabei sind N1N_{1} und DnD_{n} wieder ganze transzendente Funktionen von λ\lambda; jedoch zeigt es sich, daß sie einen gemeinsamen Teiler besitzen; wir wollen zusehen, wie sich dies aus unseren Formeln (2) bis (3) ergibt und wie wir eine Bruchdarstellung der meromorphen Funktion GG erhalten, bei der Nenner und Zähler ganze Funktionen ohne gemeinsamen Teiler sind.

Aus unserer Annahme über die iterierten Kerne folgt, daß die Koeffizienten bnb_{n}, bn+1,b_{n+1},\ldots endlich sind. Bilden wir nun in Anlehnung an Gleichung (2a) die Reihe

K(λ)=-λnbnn-λn+1bn+1n+1-,K(\lambda)=-\lambda^{n}\frac{b_{n}}{n}-\lambda^{n+1}\frac{b_{n+1}}{n+1}-\cdots,

so wird dieselbe konvergieren. Jetzt setzen wir

G(x,y;λ)=eKλhfh+1eKG(x,y;\lambda)=\frac{e^{K}\sum\lambda^{h}f_{h+1}}{e^{K}}

und behaupten, in dieser Formel die gewünschte Darstellung zu haben.

Um dies zu beweisen, haben wir zu zeigen, daß eKe^{K} und eKλh+1fh+1e^{K}\cdot\sum\lambda^{h+1}f_{h+1} ganze Funktionen sind.

Zu diesem Zwecke bilden wir dKdλ\frac{dK}{d\lambda}. Man berechnet leicht

-dK(λ)dλ=λn-1abN1(x,x)Dn(λ)𝑑x+k=1k=n-1λn+k-1abN1(x,y)Dnfk(x,y)𝑑x𝑑y.-\frac{dK(\lambda)}{d\lambda}=\lambda^{n-1}\int\limits_{a}^{b}\frac{N_{1}(x,x)% }{D_{n}(\lambda)}dx+\sum\limits_{k=1}^{k=n-1}\lambda^{n+k-1}\iint\limits_{a}^{% b}\frac{N_{1}(x,y)}{D_{n}}f_{k}(x,y)\,dx\,dy.

Hieraus schließt man zunächst, daß dKdλ\frac{dK}{d\lambda} eine meromorphe Funktion von λ\lambda ist; denn sie besitzt höchstens Pole in den Nullstellen von Dn(λ)D_{n}(\lambda), d. h. in den Stellen λ=αλi\lambda=\alpha\cdot\lambda_{i} wo α\alpha eine nn-te Einheitswurzel und λi\lambda_{i} ein Eigenwert des Kernes fnf_{n} ist. Man kann nun zeigen, daß in diesen möglichen Unendlichkeitsstellen das Cauchysche Residuum von dKdλ\frac{dK}{d\lambda} gleich 1 oder 0 ist, je nachdem α=1\alpha=1 oder α1\alpha\neq 1 genommen wird. Die hierzu gehörige Rechnung wollen wir jetzt nicht durchführen; man benutzt dabei den Umstand, daß das für λ=λk\lambda=\lambda_{k} genommene Residuum von N1(x,y)Dn\frac{N_{1}(x,y)}{D_{n}} gleich φk(x)ψk(y)\varphi_{k}(x)\psi_{k}(y) ist, wo φk\varphi_{k}, ψk\psi_{k}, die zu λ=λk\lambda=\lambda_{k} gehörigen Eigenfunktionen, den Gleichungen

abφk(x)fp(y,x)𝑑x\displaystyle\int\limits_{a}^{b}\varphi_{k}(x)f_{p}(y,x)dx =λk-pφk(y)\displaystyle=\lambda_{k}^{-p}\varphi_{k}(y)
abψk(z)fp(z,y)𝑑z\displaystyle\int\limits_{a}^{b}\psi_{k}(z)f_{p}(z,y)dz =λk-pψk(y)\displaystyle=\lambda_{k}^{-p}\psi_{k}(y)

genügen. Hieraus folgt, daß eK(λ)e^{K(\lambda)} eine ganze transzendente Funktion ist, die nur an den Stellen λ=λi\lambda=\lambda_{i} verschwindet.

Betrachtet man ebenso den Zähler von GG, so sieht man zunächst, daß er eine meromorphe Funktion von λ\lambda wird, die höchstens an den Stellen λ=αλi\lambda=\alpha\lambda_{i} unendlich werden kann. Die Betrachtung der Residuen zeigt jedoch, daß dies nicht geschieht, und somit, daß der Zähler eKλhfk+1e^{K}\sum\lambda^{h}f_{k+1} ebenfalls eine ganze transzendente Funktion ist. Damit ist die Reduktion des Fredholmschen Bruches geleistet.

Die Reihenentwicklung für Zähler und Nenner des Fredholmschen Bruches in dieser reduzierten Gestalt erhalten wir, indem wir auf die Bildungsweise von K(λ)K(\lambda) zurückgehen; setzen wir den Nenner

eK(λ)=(-λ)nann!,e^{K(\lambda)}=\sum(-\lambda)^{n}\frac{a^{\prime}_{n}}{n!},

so haben wir

an=aα+bβ+cγ+=n±bαabβbbγc,a^{\prime}_{n}=\sum_{a\alpha+b\beta+c\gamma+\cdots=n}\pm b_{\alpha}^{a}\,b_{% \beta}^{b}\,b_{\gamma}^{c}\,\cdots,

wobei zu setzen ist

bα=0 für α<n und bα=abfα(x,x)𝑑x für αn.\begin{array}[t]{ll}b_{\alpha}=0&\text{ für }\alpha<n\text{ und }\\ b_{\alpha}=\int\limits_{a}^{b}f_{\alpha}(x,x)dx&\text{ für }\alpha\geq n.\end{array}

In analoger Weise wird der Zähler gebildet. Man muß also die Determinanten in der gewöhnlichen Weise entwickeln, aber diejenigen Glieder dieser Entwicklung wegwerfen, welche einen Faktor von der Form f(x1,x2,xk)f(x_{1},x_{2},\ldots x_{k}) mit weniger als nn Veränderlichen enthalten.

Unsere Formeln (2), (2a), (3) sind auch in dem Falle von Nutzen, daß außer dem Kern f(x,y)f(x,y) auch alle iterierten Kerne unendlich werden und die Fredholmsche Methode also nun sicher versagt.
Seien etwa die Zahlen b1,b2,bn-1b_{1},b_{2},\ldots b_{n-1} unendlich, bn,bn+1,b_{n},b_{n+1},\ldots endlich. Man kann dann jedenfalls die Reihe K(λ)K(\lambda) bilden, fragen, ob sie konvergiert, und untersuchen, ob eK(λ)e^{K(\lambda)} wieder eine ganze Funktion darstellt. Unter der Voraussetzung, daß f(x,y)f(x,y) ein symmetrischer Kern ist, d. h.

f(x,y)=f(x,y),f(x,y)=f(x,y),

ist mir dieser Nachweis gelungen. Ich benutze dabei die Relationen

bn=λi-n,b_{n}=\sum\lambda_{i}^{-n},

die für n>2n>2 gelten müssen, da das Geschlecht der Funktion D(λ)D(\lambda) einem Hadamardschen Satze zufolge kleiner als 2 ist.

Den Beweis mitzuteilen fehlt jetzt die Zeit.

Für den Zähler des Fredholmschen Bruches habe ich die Betrachtung nicht durchgeführt.

Noch einige Worte über die Integralgleichung 1. Art! Auf gewisse derartige Integralgleichungen kann man, wenn man sie zuvor auf Integralgleichungen der 2. Art zurückführt, die Fredholmsche Methode direkt anwenden. Es liege z. B. die Gleichung

-+φ(y)[eixy+λf(x,y)]dy=ψ(x)  (-<x<+)\int\limits_{-\infty}^{+\infty}\varphi(y)[e^{ixy}+\lambda f(x,y)]dy=\psi(x)% \qquad(-\infty<x<+\infty) (1)

vor, in der ψ(x)\psi(x) die gegebene, φ(x)\varphi(x) aber die gesuchte Funktion ist, während der Bestandteil f(x,y)f(x,y) des Kerns eine gegebene Funktion ist, die gewissen, weiter unten angegebenen beschränkenden Voraussetzungen unterworfen ist. Für die gesuchte Funktion φ(y)\varphi(y) machen wir den Ansatz

φ(y)=-+Φ(z)e-izy𝑑z,\varphi(y)=\int\limits_{-\infty}^{+\infty}\Phi(z)e^{-izy}dz,

aus dem nach dem Fourierschen Integraltheorem, falls Φ(x)\Phi(x) die Bedingungen für dessen Gültigkeit erfüllt, umgekehrt

2πΦ(x)=-+φ(y)eixy𝑑y2\pi\Phi(x)=\int\limits_{-\infty}^{+\infty}\varphi(y)e^{ixy}dy

folgt. Danach verwandelt sich (1) in

2πΦ(x)+λ-+-+Φ(z)f(x,y)e-izy𝑑z𝑑y=ψ(x)2\pi\Phi(x)+\lambda\int\limits_{-\infty}^{+\infty}\int\limits_{-\infty}^{+% \infty}\Phi(z)f(x,y)e^{-izy}dz\,dy=\psi(x)

oder

2πΦ(x)+λ-+Φ(z)K(x,z)𝑑z=ψ(x),2\pi\Phi(x)+\lambda\int\limits_{-\infty}^{+\infty}\Phi(z)K(x,z)dz=\psi(x),

wenn

K(x,z)=-+f(x,y)e-izy𝑑yK(x,z)=\int\limits_{-\infty}^{+\infty}f(x,y)e^{-izy}dy (2)

gesetzt wird, und damit sind wir bereits bei einer Integralgleichung 2. Art angelangt. Der Kern (2) gestattet die Anwendung der Fredholmschen Methode z. B. dann, wenn f(x,y)f(x,y) und f(x,y)y\frac{\partial f(x,y)}{\partial y} gleichmäßig in xx für y=±y=\pm\infty gegen 0 konvergieren und die Ungleichung

2fy2<M1+y2\frac{\partial^{2}f}{\partial y^{2}}<\frac{M}{1+y^{2}}

statthat, in der MM eine von xx und yy unabhängige Konstante bedeutet. Von ψ(x)\psi(x) genügt es etwa, anzunehmen, daß es nur endlichviele Maxima und Minima besitzt und im Intervall -+-\infty\cdots+\infty absolut integrierbar ist.

Wir können dieselbe Methode auf eine Reihe

ψ(x)=(m)Am[eimx+λθm(x)]\psi(x)=\sum_{(m)}A_{m}\left[e^{imx}+\lambda\theta_{m}(x)\right]

anwenden; das Problem ist hier also, wenn ψ(x)\psi(x) und die Funktionen θm(x)\theta_{m}(x) gegeben sind, die Koeffizienten AmA_{m} so zu berechnen, daß die hingeschriebene Entwicklung gültig ist. Handelte es sich soeben um eine Erweiterung des Fourierschen Integraltheorems, so haben wir es jetzt mit einer Verallgemeinerung der Fourierschen Reihe zu tun.

Setzen wir φ(z)\varphi(z) in der Form

φ(z)=(m)Ameimz;2πAm=02πφ(z)e-imz𝑑z\varphi(z)=\sum_{(m)}A_{m}e^{imz};\quad 2\pi A_{m}=\int\limits_{0}^{2\pi}% \varphi(z)e^{-imz}dz

an, so bekommen wir

ψ(x)=φ(x)+λ2π02πφ(z)(m)e-imzθm(x)dz.\psi(x)=\varphi(x)+\frac{\lambda}{2\pi}\int\limits_{0}^{2\pi}\varphi(z)\cdot% \sum_{(m)}e^{-imz}\theta_{m}(x)\cdot dz.

Von der Reihe, welche hier als Kern fungiert, müssen wir voraussetzen, daß sie absolut und gleichmäßig konvergiert, d. h. wir müssen annehmen, daß

(m)|θm(x)|\sum_{(m)}\left\lvert\theta_{m}(x)\right\rvert (3)

gleichmäßig konvergiert.

Setzen wir beispielsweise

λ=1,θm(x)=eiμmx-eimx,\lambda=1,\quad\theta_{m}(x)=e^{i\mu_{m}x}-e^{imx},

so erhalten wir eine Entwicklung der Form

ψ(x)=(m)Ameiμmx.\psi(x)=\sum_{(m)}A_{m}e^{i\mu_{m}x}.

Die Bedingung (3) ist erfüllt, wenn wir die absolute Konvergenz von

(m)(μm-m)\sum_{(m)}(\mu_{m}-m)

voraussetzen.

Endlich betrachten wir noch die Gleichung

02πφ(y)[eixy+λf(x,y)]dy=ψ(x),(-<x<+)\int\limits_{0}^{2\pi}\varphi(y)[e^{ixy}+\lambda f(x,y)]dy=\psi(x),\quad(-% \infty<x<+\infty) (4)

welche sich von (1) dadurch unterscheidet, daß das Integral nicht in unendlichen, sondern in endlichen Grenzen zu nehmen ist. In diesem Fall darf ψ(x)\psi(x) nicht willkürlich gewählt werden: es muß, falls f(x,y)f(x,y) holomorph ist, sicher eine ganze transzendente Funktion sein, wenn die Gleichung (4) eine Auflösung besitzen soll. Dagegen dürfen die Werte ψ(m)\psi(m) dieser Funktion ψ\psi für alle ganzen Zahlen mm im wesentlichen willkürlich angenommen werden. Setze ich nämlich

φ(z)=(m)Ame-imz,wo2πAm=02πφ(y)eimy𝑑y ist,\varphi(z)=\sum_{(m)}A_{m}e^{-imz},\quad\text{wo}\quad 2\pi A_{m}=\int_{0}^{2% \pi}\varphi(y)e^{imy}dy\quad\text{ ist,}

so verwandelt sich (4), für x=mx=m genommen, in

2πAm+λ(p)Ap02πe-ipyf(m,y)𝑑y=ψ(m).2\pi A_{m}+\lambda\sum_{(p)}A_{p}\int\limits_{0}^{2\pi}e^{-ipy}f(m,y)dy=\psi(m).

Wir gelangen so zu einem System unendlich vieler linearer Gleichungen mit unendlich vielen Unbekannten, wie sie von Hill, H. v. Koch, Hilbert u. a. untersucht worden sind. Die Lösung dieses Systems ist, falls wir für die Reihe

(p,m)02πe-ipyf(m,y)𝑑y\sum_{(p,m)}\int\limits_{0}^{2\pi}e^{-ipy}f(m,y)dy (5)

die Voraussetzung absoluter und gleichmäßiger Konvergenz machen, der Fredholmschen Lösung der Integralgleichungen durchaus analog und stellt sich wie diese als meromorphe Funktion des Parameters λ\lambda dar. Die gleichmäßige und absolute Konvergenz von (5) ist aber, wie sich durch partielle Integration ergibt, sichergestellt, falls die Summe

(m)f′′(m,z)\sum_{(m)}f^{\prime\prime}(m,z)

oder das Integral

-+f′′(x,z)𝑑x\int\limits_{-\infty}^{+\infty}f^{\prime\prime}(x,z)dx

absolut und gleichmäßig konvergiert.

Man sieht die Ähnlichkeit und den Unterschied der beiden Fälle (1) und (4) deutlich: je nachdem die Integrationsgrenzen unendlich oder endlich sind — oder auch, je nachdem der Kern in den Integrationsgrenzen keine oder eine genügend hohe Singularität aufweist —, darf man die „gegebene” Funktion im wesentlichen willkürlich wählen oder ihr nur eine zwar unendliche, jedoch diskrete Reihe von Funktionswerten vorschreiben. Es wäre wohl nicht ohne Interesse, den hier zur Geltung kommenden Unterschied mit Hilfe der Iteration der Kerne näher zu betrachten.

Kapitel 2 Anwendung der Theorie der Integralgleichungen auf die Flutbewegung des Meeres

Ich will heute über einige Anwendungen der Integralgleichungstheorie auf die Flutbewegung berichten, die ich im letzten Semester gelegentlich einer Vorlesung über diese Erscheinung gemacht habe.

Die Differentialgleichungen des Problems sind die folgenden:

a) k2x(h1φx)+k2(φxh2y-φyh2x)=ζ,b) gζ=-λ2φ+Π+W.}\left.\begin{array}[]{l l}\mbox{a) }&k^{2}\sum\frac{\partial}{\partial x}\left% (h_{1}\frac{\partial\varphi}{\partial x}\right)+k^{2}\left(\frac{\partial% \varphi}{\partial x}\frac{\partial h_{2}}{\partial y}-\frac{\partial\varphi}{% \partial y}\frac{\partial h_{2}}{\partial x}\right)=\zeta,\\ \mbox{b) }&g\cdot\zeta=-\lambda^{2}\varphi+\mathit{\Pi}+W.\end{array}\right\} (1)

Wir stellen uns dabei vor, daß die Kugeloberfläche der Erde etwa durch stereographische Projektion konform auf die (x,y)(x,y)-Ebene bezogen sei; dann bedeute k(x,y)k(x,y) das Ähnlichkeitsverhältnis der Abbildung zwischen Ebene und Kugel. Die Lösung des Flutproblems denken wir uns durch periodische Funktionen der Zeit tt gegeben, und wir nehmen speziell an, daß unsere Gleichungen (1) einem einzigen periodischen Summanden von der Form Acos(λt+α)A\cos(\lambda t+\alpha) entsprechen, sodaß also λ\lambda in unseren Gleichungen die Schwingungsperiode bestimmt; es ist bequem, statt des Kosinus komplexe Exponentialgrößen einzuführen und also etwa anzunehmen, daß alle unsere Funktionen die Form

eiλtf(x,y)e^{i\lambda t}\cdot f(x,y)

haben; der reelle und imaginäre Teil dieser komplexen Lösungen stellt uns dann die physikalisch brauchbaren Lösungen dar.

φ(x,y)\varphi(x,y) ist definiert durch

-λ2φ=V-p,-\lambda^{2}\varphi=V-p,

wo VV das hydrostatische Potential, pp der Druck ist.

Ist hh die Tiefe des Meeres, so definieren wir

h1\displaystyle h_{1} =-hλ2-λ2+4ω2cos2ϑ,\displaystyle=-\frac{h\lambda^{2}}{-\lambda^{2}+4\omega^{2}\cos^{2}\vartheta},
h2\displaystyle h_{2} =-2ωicosϑλh1,(i=-1)\displaystyle=-\frac{2\omega\text{i}\cos\vartheta}{\lambda}h_{1},\qquad(\text{% i}=\sqrt{-1})

wo ϑ\vartheta die Colatitude des zu (x,y)(x,y) gehörigen Punktes der Erde, ω\omega die Winkelgeschwindigkeit der Erde bedeutet. ζ(x,y)\zeta(x,y) ist die Differenz zwischen der Dicke der mittleren und der gestörten Wasserschicht, d. h. ζ>0\zeta>0 entspricht der Ebbe, ζ<0\zeta<0 der Flut. gg ist die Beschleunigung der Schwerkraft, WW das Potential der Störungskräfte, Π\mathit{\Pi} ist das Potential, welches von der Anziehung der Wassermassen von der Dicke ζ\zeta herrührt. Ist z. B.

ζ\displaystyle\zeta =AnXn,\displaystyle=\sum A_{n}X_{n},
so wird
Π\displaystyle\mathit{\Pi} =4πAn2n+1Xn,\displaystyle=\sum\frac{4\pi A_{n}}{2n+1}X_{n},

wo die XnX_{n} die Kugelfunktionen sind.

Die Einheiten sind so gewählt, daß die Dichte des Wassers gleich 11, der Radius der Erdkugel gleich 11 ist.

Die Größe Π\mathit{\Pi} kann man meistens vernachlässigen; tut man dies, so erhält man sofort für φ\varphi eine partielle Differentialgleichung 2. Ordnung. Um aus derselben φ\varphi zu bestimmen, muß man gewisse Grenzbedingungen vorschreiben. Wir unterscheiden da zwei Fälle:

1. Der Rand des Meeres ist eine vertikale Mauer; dann wird

φn+2ωiλcosϑφs=0,\frac{\partial\varphi}{\partial n}+\frac{2\omega\text{i}}{\lambda}\cos% \vartheta\cdot\frac{\partial\varphi}{\partial s}=0,

wobei φn\frac{\partial\varphi}{\partial n}, φs\frac{\partial\varphi}{\partial s} die normale bzw. tangentiale Ableitung von φ\varphi ist.

2. Der Rand des Meeres ist nicht vertikal; dann ist dort

h=0,alsoh1=h2=0.h=0,\quad\text{also}\quad h_{1}=h_{2}=0.

Die Grenzbedingung lautet hier, daß φ\varphi am Rande regulär und endlich bleiben soll.

Um auf diese Probleme die Methoden der Integralgleichungen anwenden zu können, erinnern wir uns zunächst der allgemeinen Überlegungen, wie sie Hilbert und Picard für Differentialgleichungen anstellen. Sei

D(u)=f(x,y)D(u)=f(x,y)

eine partielle Differentialgleichung 2. Ordnung für uu, die elliptischen Typus hat, so ist eine, gewisse Grenzbedingungen erfüllende, Lösung uu darstellbar in der Form

u=fG𝑑σ,u=\int f^{\prime}G\>d\sigma^{\prime},

wobei G(x,y;x,y)G(x,y;x^{\prime},y^{\prime}) die zu diesen Randbedingungen gehörige Greensche Funktion des Differentialausdruckes D(u)D(u) ist; ff^{\prime} ist f(x,y)f(x^{\prime},y^{\prime}), dσ=dxdyd\sigma^{\prime}=dx^{\prime}\cdot dy^{\prime}, und das Integral ist über dasjenige Gebiet der (x,y)(x^{\prime},y^{\prime})-Ebene zu erstrecken, für welches die Randwertaufgabe gestellt ist. Um die Greensche Funktion zu berechnen und so die Randwertaufgabe zu lösen, setze man

D(u)=D0(u)+D1(u),D(u)=D_{0}(u)+D_{1}(u),

wo

D1(u)=aux+buy+cuD_{1}(u)=a\frac{\partial u}{\partial x}+b\frac{\partial u}{\partial y}+cu

ein linearer Differentialausdruck ist. Nehmen wir nun an, wir kennen die Greensche Funktion G0G_{0} von D0(u)D_{0}(u), so haben wir die Lösung von

D(φ)=fD(\varphi)=f

in der Form

φ=G0(f-aφx-bφy-cφ)𝑑σ.\varphi=\int G_{0}\left(f^{\prime}-a^{\prime}\frac{\partial\varphi^{\prime}}{% \partial x^{\prime}}-b^{\prime}\frac{\partial\varphi^{\prime}}{\partial y^{% \prime}}-c^{\prime}\varphi^{\prime}\right)d\sigma^{\prime}.

Schaffen wir hieraus durch partielle Integrationen die Ableitungen φx\frac{\partial\varphi^{\prime}}{\partial x^{\prime}}, φy\frac{\partial\varphi^{\prime}}{\partial y^{\prime}} heraus, so werden wir direkt auf eine Integralgleichung zweiter Art für φ\varphi geführt, die wir nach der Fredholmschen Methode behandeln können, wenn ihr Kern nicht zu stark singulär wird.

Bei unserem Probleme der Flutbewegung tritt nun gerade dieser Fall ein; der Kern wird so hoch unendlich, daß die Fredholmschen Methoden versagen; ich will Ihnen jedoch zeigen, in welcher Weise man diese Schwierigkeiten überwinden kann.

Betrachten wir erst den Fall der ersten Grenzbedingung

φn+Cφs=0,\frac{\partial\varphi}{\partial n}+C\frac{\partial\varphi}{\partial s}=0,

wo CC eine gegebene Funktion von x,yx,y ist. Die Differentialgleichung, die sich bei Vernachlässigung von Π\mathit{\Pi} ergibt, hat die Form

AΔφ+D1=f,A\Delta\varphi+D_{1}=f,

und wir stehen daher vor der Aufgabe, die Gleichung

Δφ=F\Delta\varphi=F

mit unserer Randbedingung zu integrieren.

Diese Aufgabe ist äquivalent mit der, eine im Innern der Randkurve reguläre Potentialfunktion VV, die am Rande die Bedingung Vn+CVs=0\frac{\partial V}{\partial n}+C\frac{\partial V}{\partial s}=0 erfüllt, als Potential einer einfachen Randbelegung zu finden. Bezeichnet ss die Bogenlänge auf der Randkurve von einem festen Anfangspunkte bis zu einem Punkte PP, ss^{\prime} die bis zum Punkte PP^{\prime}, so erhält man für VV eine Integralgleichung; jedoch wird der Kern K(s,s)K(s,s^{\prime}) derselben für s=ss=s^{\prime} von der ersten Ordnung unendlich, und es ist daher in dem Integrale

ABK(x,y)f(y)𝑑y\int_{A}^{B}K(x,y)f(y)dy

der sogenannte Cauchysche Hauptwert zu nehmen, der definiert ist als das arithmetische Mittel aus den beiden Werten, die das Integral erhält, wenn ich es in der komplexen yy-Ebene unter Umgehung des Punktes y=xy=x das eine mal auf einem Wege AMBAMB oberhalb, das andere mal auf einem Wege AMBAM^{\prime}B unterhalb der reellen Achse führe.

Anstatt die Methoden zu benutzen, die Kellogg zur Behandlung solcher unstetiger Kerne angibt, will ich einen andern Weg einschlagen. Wir betrachten neben der Operation

S(f(x))=K(x,y)f(y)𝑑yS\big{(}f(x)\big{)}=\int K(x,y)f(y)dy

die iterierte

S2(f(x))=K(x,z)K(z,y)f(y)𝑑z𝑑y,S^{2}\big{(}f(x)\big{)}=\iint K(x,z)K(z,y)f(y)dz\,dy,

bei der ebenfalls das Doppelintegral als Cauchyscher Hauptwert zu nehmen ist; dies soll folgendermaßen verstanden werden: wir betrachten für die Variable zz die Wege AMBAMB, AMBAM^{\prime}B, für yy die Wege APBAPB, APBAP^{\prime}B, die zueinander liegen mögen, wie in der Figur angedeutet ist. Dann bilden wir die 4 Integrale, die sich ergeben, wenn ich einen Weg für zz mit einem für yy kombiniere;

z:z: AMBAMB, AMBAM^{\prime}B, AMBAMB, AMBAM^{\prime}B
y:y: APBAPB, APBAPB, APBAP^{\prime}B, APBAP^{\prime}B,

und nehmen aus diesen 4 Integralen das arithmetische Mittel. Ziehen wir noch 2 Wege AQBAQB, AQBAQ^{\prime}B wie in der Figur, so sehen wir, daß sich in der ersten Wegkombination der Weg AMBAMB für zz ersetzen läßt durch AQB+AMBQAAQB+AMBQA, in der zweiten AMBAM^{\prime}B durch AQBAQ^{\prime}B, in der dritten AMBAMB durch AQBAQB und in der vierten AMBAM^{\prime}B durch AQB+AMBQAAQ^{\prime}B+AM^{\prime}BQ^{\prime}A, sodaß wir jetzt die folgenden Wegkombinationen haben:

zz yy
AQB+AMBQAAQB+AMBQA APBAPB
AQBAQ^{\prime}B APBAPB
AQBAQB APBAP^{\prime}B
AQB+AMBQAAQ^{\prime}B+AM^{\prime}BQ^{\prime}A APBAP^{\prime}B.

Führen wir jetzt die Integrale aus und wenden den Residuenkalkül auf die geschlossenen Wege an, so zeigt sich, daß unsere Operation S2(f(x))S^{2}\big{(}f(x)\big{)}, die einer Integralgleichung 1. Art zugehört, übergeht in eine Operation, welche durch die linke Seite einer Integralgleichung 2. Art gegeben ist, deren Kern überall endlich bleibt; wenn wir zuerst die vier Kombinationen von den Wegen AQBAQB und AQBAQ^{\prime}B mit den Wegen APBAPB und APBAP^{\prime}B nehmen, so bekommen wir ein doppeltes Integral, welches nicht unendlich werden kann, da auf diesen Wegen xyx\neq y und yzy\neq z. Betrachten wir jetzt die beiden Wegkombinationen AMBQAAMBQA, APBAPB und AMBQAAM^{\prime}BQ^{\prime}A, APBAP^{\prime}B, oder AMBQAAMBQA, APBAPB und AQBMA,BPAAQ^{\prime}BM^{\prime}A,BP^{\prime}A, so ist leicht zu sehen, daß zz eine geschlossene Kurve AMBQAAMBQA oder AQBMAAQ^{\prime}BM^{\prime}A um yy beschreibt, und daß gleichzeitig yy eine geschlossene Kurve APBPAAPBP^{\prime}A um xx beschreibt. Wir dürfen also die Residuenmethode anwenden, und wir bekommen ein Glied, wo die unbekannte Funktion ohne Integralzeichen auftritt, wie in der linken Seite einer Integralgleichung zweiter Art. Indem wir so auf eine durchaus reguläre Integralgleichung 2. Art geführt werden, die der Fredholmschen Methode zugänglich ist, haben wir die Schwierigkeit bei unserem Problem überwunden.

Nur ein Punkt bedarf noch der Erläuterung: wenn xx und yy gleichzeitig in einen der Endpunkte A,BA,B des Intervalles hineinfallen, so versagen zunächst die obigen Betrachtungen, und es scheint, als wären wir für diese Stellen der Endlichkeit unseres durch Iteration gewonnenen Kernes nicht sicher. Dieses Bedenken wird jedoch bei unserm Problem dadurch beseitigt, daß der Rand des Meeres, der das Integrationsintervall darstellt, geschlossen ist, woraus sich ergibt, daß die Punkte A,BA,B keine Ausnahmestellung einnehmen können.

Durch diese Überlegungen ist also der Fall der vertikalen Meeresufer erledigt.

Wir betrachten den zweiten und schwierigeren Fall, daß das Ufer des Meeres keine vertikale Mauer ist. Dann ist am Rande

h=h1=h2=0.h=h_{1}=h_{2}=0.

Da die Glieder 2. Ordnung unserer Differentialgleichung für φ\varphi durch den Ausdruck

h1Δφh_{1}\Delta\varphi

gegeben sind, so ist die Randkurve jetzt eine singuläre Linie für die Differentialgleichung. Außerdem werden h1,h2h_{1},h_{2} gemäß ihrer Definition für die durch die Gleichung

4ω2cos2ϑ=λ24\omega^{2}\cos^{2}\vartheta=\lambda^{2}

gegebene kritische geographische Breite ϑ\vartheta unendlich. Um trotz dieser Singularitäten, welche das Unendlichwerden des Kerns KK zur Folge haben, das Problem durchzuführen, bin ich gezwungen gewesen, das reelle Integrationsgebiet durch ein komplexes zu ersetzen, indem ich yy in eine komplexe Veränderliche y+izy+iz verwandle; xx hingegen bleibt reell.

Wir deuten xyzxyz als gewöhnliche rechtwinklige Koordinaten in einem dreidimensionalen Raum und zeichnen den Durchschnitt ABAB einer Ebene x=konst.x=\text{konst.} mit dem in der (x,y)(x,y)-Ebene gelegenen Meeresbecken. Entspricht CC der kritischen geographischen Breite, so ist es nicht schwer, diese Singularität durch Ausweichen in das komplexe Gebiet zu umgehen. Wählen wir ferner irgend zwei Punkte D,ED,E zwischen AA und BB und umgeben AA, von DD ausgehend und dorthin zurückkehrend, mit einer kleinen Kurve und verfahren entsprechend bei BB — räumlich gesprochen: umgeben wir die Randkurve mit einem ringförmigen Futteral —, so stellen wir uns jetzt das Problem, unsere Differentialgleichung so zu integrieren, daß φ\varphi, wenn wir seine Wertänderung längs der den Punkt AA umgebenden Kurve verfolgen, mit demselben Wert nach DD zurückkehrt, mit dem es von dort ausging. Diese “veränderte” Grenzbedingung ist mit der ursprünglichen, welche verlangte, daß φ\varphi am Rande (im Punkte AA) endlich bleibt und sich regulär verhält, äquivalent. Zwar sind die zu der neuen und der alten Grenzbedingung gehörigen Greenschen Funktionen GG, G1G_{1} nicht identisch, wohl aber die den betreffenden Randbedingungen unterworfenen Lösungen von

D(u)=f.D(u)=f. (1)

Hiervon überzeugen wir uns leichter im Falle nur einer Variablen yy; dann ergeben die Gleichungen

u=G(y,y)f(y)𝑑y,u1=G1(y,y)f(y)𝑑yu=\int G(y,y^{\prime})f(y^{\prime})dy^{\prime},\quad u_{1}=\int G_{1}(y,y^{% \prime})f(y^{\prime})dy^{\prime}

durch Anwendung des Cauchyschen Integralsatzes, daß u-u1=0u-u_{1}=0 ist.

Um jetzt das Problem (1) zu behandeln, ziehe ich die vorige Methode heran, die hier aber in zwei Stufen zur Anwendung kommt, da unsere veränderte Randbedingung für die Gleichung Δu=f\Delta u=f unzulässig ist.11 1 Diese Randbedingung ist nicht von solcher Art, daß sie eine bestimmte Lösung von Δ(u)=f\Delta(u)=f auszeichnet. Wir können setzen

D(u)=Δ(h1u)+D1(u)+D2(u);D(u)=\Delta(h_{1}u)+D_{1}(u)+D_{2}(u);

dabei soll D1(u)D_{1}(u) nur die Glieder 1. Ordnung ux,uy,D2(u)\frac{\partial u}{\partial x},\frac{\partial u}{\partial y},D_{2}(u) aber nur uu selbst enthalten. Indem wir

Δ(v)=f\Delta(v)=f

unter der Randbedingung v=0v=0 integrieren, erhalten wir für u=vh1u=\frac{v}{h_{1}} eine am Rande endliche und reguläre Funktion, für welche

Δ(h1u)D0(u)=f\Delta(h_{1}u)\equiv D_{0}(u)=f

ist. Darauf integrieren wir

D0(u)+D2(u)=fD_{0}(u)+D_{2}(u)=f

unter Zugrundelegung der ursprünglichen Grenzbedingung nach der gewöhnlichen Methode. Der in der hierbei zu benutzenden Integralgleichung auftretende Kern ist zwar unendlich, aber von solcher Ordnung, daß sich die Singularität durch Iteration des Kerns beseitigen läßt: die partielle Integration, welche Glieder von einer zu hohen Ordnung des Unendlichwerdens einführen würde, bleibt uns an dieser Stelle erspart.

Das damit bewältigte Integrationsproblem ist aber der Integration von

D0(u)+D2(u)=fD_{0}(u)+D_{2}(u)=f

unter der veränderten Grenzbedingung äquivalent, und infolgedessen können wir jetzt die zweite Stufe ersteigen und auch die Lösung von

D(u)(D0(u)+D2(u))+D1(u)=fD(u)\equiv\big{(}D_{0}(u)+D_{2}(u)\big{)}+D_{1}(u)=f

unter der veränderten Grenzbedingung bestimmen.


Wir haben bis jetzt das Glied Π\mathit{\Pi} als so klein vorausgesetzt, daß wir es ganz vernachlässigen durften. Heben wir diese Voraussetzung auf, so entstehen keine wesentlichen neuen Schwierigkeiten. Π\mathit{\Pi} ist ein von ζ\zeta erzeugtes Anziehungspotential; wir haben also

Π=ζdσr,\mathit{\Pi}=\int\frac{\zeta^{\prime}d\sigma^{\prime}}{r},

wenn dσd\sigma^{\prime} ein Flächenelement der Kugel, ζ\zeta^{\prime} den Wert der Funktion ζ\zeta im Schwerpunkt (x,y)(x^{\prime},y^{\prime}) dieses Flächenelementes, rr aber die räumlich gemessene Entfernung der beiden Kugelpunkte (x,y)(x,y); (x,y)(x^{\prime},y^{\prime}) bedeutet, und die Integration über die ganze Kugeloberfläche erstreckt wird. Wir können auch schreiben

Π=ζdxdyk2r.\mathit{\Pi}=\int\frac{\zeta^{\prime}dx^{\prime}dy^{\prime}}{k^{2}r}.

Setzen wir dies in unsere Ausgangsgleichungen ein, von denen wir noch die erste mittels Aufstellung der zugehörigen Greenschen Funktion und unter Berücksichtigung der Randbedingung aus einer Differential- in eine Integralgleichung verwandeln, so erhalten wir zwei simultane Integralgleichungen für ζ\zeta und φ\varphi, die mit Hilfe der soeben erörterten Methoden aufgelöst werden können.

Kapitel 3 Anwendung der Integralgleichungen auf Hertzsche Wellen

Ich will heute über eine Anwendung der Integralgleichungen auf Hertzsche Wellen vortragen und insbesondere die äußerst merkwürdigen Beugungserscheinungen behandeln, welche bei der drahtlosen Telegraphie eine so wichtige Rolle spielen; ist es doch eine wunderbare Tatsache, daß die Krümmung der Erdoberfläche, welche eine Fortpflanzung des Lichtes verhindert, für die Ausbreitung der Hertzschen Wellen kein Hindernis darstellt, daß dieselben vielmehr auf der Erdoberfläche von Europa bis Amerika zu laufen vermögen. Der Umstand, daß die Hertzschen Wellen eine viel größere Länge haben als die Lichtwellen, kann allein diese Erscheinung noch nicht erklären. Eine solche Erklärung ergibt sich vielmehr erst durch Betrachtung der Differentialgleichungen des Problems.

Setzen wir die Lichtgeschwindigkeit gleich 11, und verstehen wir mit Maxwell

unter α\alpha, β\beta, γ\gamma die Komponenten der magnetischen Kraft,
unter F,F, G,G, HH die Komponenten des Vektorpotentiales,
unter f,f, g,g, hh die Komponenten der elektrischen Verschiebung,
unter ψ\psi das skalare Potential,
unter u,u, v,v, ww die Komponenten des Konduktionsstromes,
unter ϱ\varrho die Dichte der Elektrizität,

so gelten die Gleichungen

α=Hy-Gx\alpha=\frac{\partial H}{\partial y}-\frac{\partial G}{\partial x}
4πf=-Ft-ψx,4\pi f=-\frac{\partial F}{\partial t}-\frac{\partial\psi}{\partial x},
4π(μ+ft)=γy-βz,4\pi\left(\mu+\frac{\partial f}{\partial t}\right)=\frac{\partial\gamma}{% \partial y}-\frac{\partial\beta}{\partial z},
fx=fx+gy+hz=ϱ,\sum\frac{\partial f}{\partial x}=\frac{\partial f}{\partial x}+\frac{\partial g% }{\partial y}+\frac{\partial h}{\partial z}=\varrho,
Fx+ψt=0,\sum\frac{\partial F}{\partial x}+\frac{\partial\psi}{\partial t}=0,

und es folgt

4πμ\displaystyle 4\pi\cdot\mu =2Ft2-ΔF,\displaystyle=\frac{\partial^{2}{F}}{\partial{t^{2}}}-\Delta F,
4πϱ\displaystyle 4\pi\cdot\varrho =2ψt2-Δψ.\displaystyle=\frac{\partial^{2}{\psi}}{\partial{t^{2}}}-\Delta\psi.

Wir betrachten nun eine gedämpfte synchrone Schwingung, indem wir annehmen, daß alle unsere Funktionen proportional sind mit der Exponentialgröße

eiωt.e^{i\omega t}.

Aus den so zustande kommenden komplexen Lösungen erhalten wir die physikalischen durch Trennung in reellen und imaginären Bestandteil. Der reelle Teil von ω\omega gibt die Schwingungsperiode, der imaginäre die Dämpfung.

Aus unserem Ansatz folgt

Ft\displaystyle\frac{\partial F}{\partial t} =iωF,\displaystyle=i\omega\cdot F,
ψt\displaystyle\frac{\partial\psi}{\partial t} =iωψ,\displaystyle=i\omega\cdot\psi,

und man kann daher FF und ψ\psi als retardierte Potentiale darstellen wie folgt:

F\displaystyle F =μe-iωrr𝑑τ,\displaystyle=\int\mu^{\prime}\frac{e^{-i\omega r}}{r}d\tau^{\prime},
ψ\displaystyle\psi =ϱe-iωrr𝑑τ;\displaystyle=\int\varrho^{\prime}\frac{e^{-i\omega r}}{r}d\tau^{\prime};

dτd\tau^{\prime} ist das Raumelement im (x,y,z)(x^{\prime},y^{\prime},z^{\prime})-Raume, μ\mu^{\prime}, ϱ\varrho^{\prime} die Werte von μ\mu, ϱ\varrho im Punkte (x,y,z)(x^{\prime},y^{\prime},z^{\prime}), rr die Entfernung der Punkte (x,y,z)(x^{\prime},y^{\prime},z^{\prime}) und (x,y,z)(x,y,z).

In den meisten Problemen treten zwei verschiedene Medien auf, der freie Äther und die leitenden Körper; von den letzteren wollen wir annehmen, daß sie sich wie vollkommene Leiter verhalten, daß also in ihrem Innern das Feld verschwindet, die elektrischen Kraftlinien auf ihrer Oberfläche normal stehen, während die magnetischen in dieselbe hineinfallen; dem Umstande, daß Ladung und Strömung nur an der Oberfläche des Leiters vorhanden ist, wollen wir dadurch entsprechen, daß wir die obigen Ausdrücke für FF und ψ\psi modifizieren, indem wir an Stelle der Raumintegrale Oberflächenintegrale einführen. Wir schreiben

ψ\displaystyle\psi =ϱ′′e-iωrr𝑑σ,\displaystyle=\int\varrho^{\prime\prime}\frac{e^{-i\omega r}}{r}d\sigma^{% \prime},
F\displaystyle F =μ′′e-iωrr𝑑σ,\displaystyle=\int\mu^{\prime\prime}\frac{e^{-i\omega r}}{r}d\sigma^{\prime},

wo ϱ′′\varrho^{\prime\prime}, μ′′\mu^{\prime\prime} jetzt die Flächendichte der Ladung bzw. Strömung bedeuten und dσd\sigma^{\prime} das Flächenelement ist.

Wir unterscheiden gewöhnlich zwei leitende Körper, der eine soll der äußere, der andere der innere Leiter heißen; sie erzeugen das “äußere” resp. das “innere” Feld; das äußere Feld ist gegeben, das innere gesucht. So ist z. B., wenn wir das Problem des Empfanges elektrischer Wellen betrachten, der Sender der äußere, der Empfangsapparat der innere Leiter; beim Probleme der Beugung elektrischer Wellen ist der Erreger der äußere, die Erdkugel der innere Leiter; bei dem Probleme der Schwingungserzeugung haben wir kein äußeres Feld, der Erreger wird dann als innerer Leiter anzusehen sein.

Um nun zum Ansatz einer Integralgleichung zu gelangen, wollen wir unter den oben erklärten Funktionen nur die zum unbekannten inneren Felde gehörigen verstehen, sodaß z.B. die obigen Integrale nur über die Oberfläche des inneren Leiters zu erstrecken sind; beachten wir nun, daß die innere Normalkomponente des elektrischen Vektors am inneren Leiter unserer obigen Annahme zufolge verschwinden muß, so folgt, wenn ll, mm, nn die Richtungskosinus der Normale bedeuten, aus unseren Ausgangs-Gleichungen:

4πf=ψn+iω(lF+mG+nH)=N,4\pi f=\frac{\partial\psi}{\partial n}+\text{i}\omega\left(lF+mG+nH\right)=N,

wo NN die Normalkomponente des äußeren Feldes, also eine bekannte Funktion ist.

Bezeichnen wir jetzt die Flächendichte statt mit ϱ′′\varrho^{\prime\prime} mit μ\mu^{\prime}, so wird zufolge unseres Ausdruckes für ψ\psi

ψn=2πμ+μn(e-iωrr)𝑑σ.\frac{\partial\psi}{\partial n}=2\pi\mu+\int\mu^{\prime}\frac{\partial}{% \partial n}\left(\frac{e^{-\text{i}\omega r}}{r}\right)d\sigma^{\prime}.

Benutzen wir ferner unseren Ausdruck für FF und die entsprechenden für GG und HH, so hat man

iωlF=e-iωrriωlμ′′dσ.\text{i}\omega\sum lF=\int\frac{e^{-\text{i}\omega r}}{r}\text{i}\omega\sum l% \mu^{\prime\prime}\>d\sigma^{\prime}.

Diesen Ausdruck kann man nun in gewissen Fällen durch partielle Integrationen auf die Form

-iωLμ𝑑σ-\text{i}\omega\int L\mu^{\prime}\>d\sigma^{\prime}

bringen, wobei LL eine bekannte Funktion ist. So haben wir schließlich

2πμ+μ{n(e-iωrr)-iωL}𝑑σ=N,2\pi\mu+\int\mu^{\prime}\left\{\frac{\partial}{\partial n}\left(\frac{e^{-% \text{i}\omega r}}{r}\right)-\text{i}\omega L\right\}d\sigma^{\prime}=N,

und dies ist die Integralgleichung 2. Art für μ\mu, auf die wir hinstrebten. Im allgemeinsten Falle bekommt man zwei Integralgleichungen mit zwei Unbekannten, welche z. B. μ\mu und ν\nu sein mögen, wo μ\mu das oben definierte ist; wir setzen ν=dNdn\nu=\frac{dN}{dn}, wo ddn\frac{d}{dn} die Ableitung in der Normalrichtung bezeichnet und NN die Normalkomponente der magnetischen Kraft ist.

Die Funktion LL läßt sich dann besonders einfach bilden, wenn der innere Leiter ein Rotationskörper ist und das äußere Feld Rotationssymmetrie besitzt. Ist ss, ss^{\prime} die Bogenlänge, gemessen vom Endpunkte der Rotationsachse auf einem Meridian bis zu den Punkten PP, PP^{\prime}, ist ferner ϑ\vartheta der Winkel zwischen der Normale in PP und der Meridiantangente in PP^{\prime}, so wird LL als Funktion von ϑ\vartheta, ss, ss^{\prime} definiert durch die Differentialgleichung

Ls=e-iωrrcosϑ.\frac{\partial L}{\partial s^{\prime}}=\frac{e^{-\text{i}\omega r}}{r}\cos\vartheta.

Das Problem des Empfanges elektrischer Wellen läßt sich auf Grund der obigen Integralgleichung 2. Art behandeln.

Wollen wir nur das Problem der Erzeugung elektrischer Wellen betrachten, so haben wir das äußere Feld gleich Null zu setzen, es wird also N=0N=0, und wir haben eine homogene Integralgleichung vor uns; in ihr darf jedoch ω\omega nicht mehr einen willkürlichen Parameterwert bedeuten, sondern ist eine zu bestimmende Zahl, die die Rolle der Eigenwerte spielt.

Ich schreibe unsere Integralgleichung in der Form

2πμ+Kμ𝑑σ=N2\pi\mu+\int K\mu^{\prime}\>d\sigma^{\prime}=N

mit dem Kerne KK; ich führe einen unbestimmten Parameter λ\lambda ein und betrachte die allgemeine Gleichung

2πμ+λKμ𝑑σ=N.2\pi\mu+\lambda\int K\mu^{\prime}\>d\sigma^{\prime}=N.

Das erste Glied hängt von zwei Unbestimmten λ\lambda und ω\omega ab. Wenn man die gewöhnliche Fredholmsche Methode anwendet, so erhält man die Lösung unserer obigen Integralgleichung in Gestalt einer meromorphen Funktion von λ\lambda, deren Nenner eine ganze Funktion von λ\lambda ist. Man kann nun zeigen, daß dieser Nenner auch eine ganze Funktion von ω\omega wird, sodaß also auch hier unsere ausgezeichneten Werte ω\omega sich als Nullstellen einer ganzen transzendenten Funktion ergeben.

Wir wollen aber jetzt das größere Problem der Beugung ausführlicher behandeln.

Nehmen wir zu diesem Ende an, daß der innere Leiter eine Kugel, die Erdkugel, vom Radius ϱ\varrho ist und das äußere Feld (dessen normale Komponente NN bedeutet) von einem punktförmigen Erreger SS herrührt, dessen Entfernung DD vom Mittelpunkt OO der Erde nur sehr wenig größer ist als der Radius ϱ\varrho. Wir wählen die Richtung OSOS zur zz-Achse und bezeichnen die Abweichung der Richtung OMOM, in der MM einen variablen Punkt der Kugeloberfläche bedeutet, von OSOS mit φ\varphi. Die Bedeutung von ϑ\vartheta, ξ\xi, φ\varphi^{\prime}; rr, rr^{\prime} ist aus der Figur ersichtlich:

OM=OM=OM1\displaystyle OM=OM^{\prime}=OM_{1} =ϱ,\displaystyle=\varrho,
OS\displaystyle OS =D,\displaystyle=D,
SM\displaystyle SM =r,\displaystyle=r,
SM\displaystyle SM^{\prime} =r.\displaystyle=r^{\prime}.

Der Wert der normalen Ableitung NN des äußeren Feldes berechnet sich im Punkte MM, wie leicht zu sehen, nach der Formel

4πN=eiω(t-r)[iωrsinϑsinξ+(1r2+1iωr3)(sinϑsinξ+2cosϑcosξ)].4\pi N=e^{i\omega\left(t-r\right)}\left[\frac{i\omega}{r}\sin\vartheta\sin\xi+% \left(\frac{1}{r^{2}}+\frac{1}{i\omega r^{3}}\right)\cdot\left(\sin\vartheta% \sin\xi+2\cos\vartheta\cos\xi\right)\right].

Da ω\omega eine sehr große Zahl ist — denn die Länge der Hertzschen Wellen ist klein gegenüber dem Radius der Erde — genügt es meistens, in dieser Formel nur das erste Glied, das in der eckigen Klammer auftritt, beizubehalten.

Im vorhergehenden haben wir die Gleichung der Hertzsehen Wellen auf die Form

2πμ=μK𝑑σ+N2\pi\mu=\int\mu^{\prime}Kd\sigma^{\prime}+N

gebracht und haben gezeigt, wie der Kern KK berechnet werden kann. Entwickeln wir jetzt NN und KK nach Kugelfunktionen oder vielmehr, da unser Problem die Symmetrie eines Rotationskörpers mit der Achse OSOS besitzt, nach Legendreschen Polynomen PnP_{n}, so gewinnen wir aus dieser Integralgleichung die elektrische Flächendichte μ\mu gleichfalls unter der Form einer nach den Funktionen PnP_{n} fortschreitenden Reihe. Es gilt zunächst

N=KnPn;0πPnNsinφdφ=2Kn2n+1.N=\sum K_{n}P_{n};\qquad\qquad\int\limits_{0}^{\pi}P_{n}N\sin\varphi\>d\varphi% =\frac{2K_{n}}{2n+1}.

KnK_{n} ist von der Form

AnJn(ωϱ)ϱ2,\frac{A_{n}J_{n}\left(\omega\varrho\right)}{\varrho^{2}},

wo AnA_{n} eine nur von nn, nicht aber von ϱ\varrho abhängige Zahl ist, und JnJ_{n} eine mit der Besselschen verwandte Funktion bedeutet.

Wir verstehen nämlich unter Jn(x)J_{n}(x) die in der Umgebung von x=0x=0 holomorphe Lösung der Gleichung

d2ydx2+y(1-n(n+1)x2)=0,\frac{d^{2}y}{dx^{2}}+y\left(1-\frac{n\left(n+1\right)}{x^{2}}\right)=0,

und In(x)I_{n}(x) sei dasjenige Integral derselben Gleichung, welches sich für große positive Werte von xx angenähert wie e-ixe^{-ix} verhält. Da JnJ_{n}, InI_{n} von einander unabhängig sind, können wir außerdem dafür sorgen, daß

InJn-JnIn=1{I_{n}}^{\prime}{J_{n}}-{J_{n}}^{\prime}{I_{n}}=1

ist, wenn unter Jn{J_{n}}^{\prime}, In{I_{n}}^{\prime} die Ableitungen von JnJ_{n}, InI_{n} verstanden werden.

Die Lösung unserer Integralgleichung lautet jetzt

μ=AKnPn(cosφ)In(ωϱ)Jn(ωϱ).\mu=A\sum\frac{K_{n}P_{n}\left(\cos\varphi\right)}{{I_{n}}^{\prime}\left(% \omega\varrho\right)J_{n}\left(\omega\varrho\right)}.

Da aber auch der Ausdruck von KnK_{n} im Zähler Jn(ωϱ)J_{n}\left(\omega\varrho\right) als Faktor enthält, und sich infolgedessen dieser Term Jn(ωϱ)J_{n}\left(\omega\varrho\right) heraushebt, ist

In(ωϱ)=0{I_{n}}^{\prime}\left(\omega\varrho\right)=0

die für die Eigenschwingungen charakteristische Gleichung.

Um zu übersichtlichen Resultaten zu gelangen, benutzen wir angenäherte Formeln. Diese beruhen darauf, daß ω\omega sehr groß, andererseits aber Dϱ-1\frac{D}{\varrho}-1 sehr klein ist. Wir stützen uns auf die folgende Näherungsformel

ηeiωθ𝑑x=ηeiθ2πωθ′′e±iπ4,\int\eta e^{i\omega\theta}dx=\eta e^{i\theta}\sqrt{\frac{2\pi}{\omega\theta^{% \prime\prime}}}e^{\pm\frac{i\pi}{4}},

θ\theta, η\eta sind gegebene Funktionen von xx, ω\omega eine sehr große Zahl, θ′′\theta^{\prime\prime} bedeutet die zweite Ableitung von θ\theta, und auf der rechten Seite ist als Argument ein solcher Wert einzusetzen, für den θ\theta ein Maximum oder Minimum besitzt; je nachdem der eine oder der andere Fall vorliegt, ist in dem Faktor e±iπ4e^{\pm\frac{i\pi}{4}} das Zeichen ++ oder das Zeichen -- zu nehmen. Hat θ\theta in dem Intervall, über welches zu integrieren ist, mehrere Maxima oder Minima, so ist der Ausdruck rechts durch eine Summe analog gebildeter Terme zu ersetzen.

Durch Anwendung dieser Formel bekommen wir für die Legendreschen Polynome Pn(cosφ)P_{n}\left(\cos\varphi\right) die folgenden, für große nn gültigen angenäherten Ausdrücke:

Pn=22πnsinφcos(nφ+φ2-π4).P_{n}=2\sqrt{\frac{2\pi}{n\sin\varphi}}\cdot\cos\left(n\varphi+\frac{\varphi}{% 2}-\frac{\pi}{4}\right).

Aus ihnen folgt für die KnK_{n}, falls n<ωϱn<\omega\varrho,

Kn=2n+18rn[eiα+eiα]iωsinϑsinξDϱcosϑcosξsinϑωϱ.K_{n}=\frac{2n+1}{8r\sqrt{n}}\left[e^{i\alpha}+e^{i\alpha^{\prime}}\right]% \frac{i\omega\sin\vartheta\sin\xi}{\sqrt{D\varrho\cos\vartheta\cos\xi}}\sqrt{% \frac{\sin\vartheta}{\omega\varrho}}.

Dabei ist

α\displaystyle\alpha =nφ-ωr+φ2-π2,\displaystyle=n\varphi-\omega r+\frac{\varphi}{2}-\frac{\pi}{2},
α\displaystyle\alpha^{\prime} =nφ-ωr+φ2,\displaystyle=n\varphi^{\prime}-\omega r^{\prime}+\frac{\varphi^{\prime}}{2},

gesetzt, und für ξ\xi, ϑ\vartheta, φ\varphi, φ\varphi^{\prime}, rr, rr^{\prime} sind die aus der Figur zu entnehmenden Werte einzusetzen, für welche

sinξ=nωϱ\displaystyle\sin\xi=\frac{n}{\omega\varrho} (ξ<π2)\displaystyle\left(\xi<\frac{\pi}{2}\right)

wird. Die gleiche Näherungsformel gilt auch für n>ωϱn>\omega\varrho, falls in der eckigen Klammer eiα+eiαe^{i\alpha}+e^{i\alpha^{\prime}} durch eiαe^{i\alpha} oder eiαe^{i\alpha^{\prime}} ersetzt wird; die Diskussion darüber, welches der beiden Glieder beizubehalten ist, will ich hier nicht geben.

Auch um InJn{I_{n}}^{\prime}J_{n} angenähert zu berechnen, müssen wir die beiden Fälle n<ωϱn<\omega\varrho und n>ωϱn>\omega\varrho unterscheiden. Im ersten Falle ist

InJn=eiα-α2cosα-α2,{I_{n}}^{\prime}J_{n}=e^{i\frac{\alpha-\alpha^{\prime}}{2}}\cdot\cos\tfrac{% \alpha-\alpha^{\prime}}{2},

im zweiten

InJn=12{I_{n}}^{\prime}J_{n}=\tfrac{1}{2}

zu setzen. Daraus ergibt sich, daß sowohl für n<ωϱn<\omega\varrho als auch für n>ωϱn>\omega\varrho und große nn

KnInJn=n2reiαiωsinξ(sinϑ)32ϱDcosϑcosξ\frac{K_{n}}{I_{n}^{\prime}J_{n}}=\frac{\sqrt{n}}{2r}\>e^{\text{i}\alpha}\>% \frac{\text{i}\sqrt{\omega}\sin\xi{\left(\sin\vartheta\right)^{\tfrac{3}{2}}}}% {\varrho\sqrt{D\cos\vartheta\cos\xi}}

gilt. In der Summe, durch welche wir μ\mu dargestellt haben, geben demnach diejenigen Glieder, für welche nahezu n=μn=\mu ist, den Ausschlag. Für diese gilt näherungsweise

ξ=π2  und  r=2ϱD.\xi=\frac{\pi}{2}\qquad\text{und}\qquad r=\sqrt{2\varrho D}.

Da ferner wegen der Kleinheit von Dϱ-1\frac{D}{\varrho}-1 der Winkel φ\varphi immer nahezu =0=0 bleibt, variiert α\alpha als Funktion von nn nur sehr wenig, wenn nn auf die dem Werte n=ωn=\omega benachbarten ganzen Zahlen beschränkt wird. Wir dürfen also, wenn wir noch die Längeneinheit so gewählt denken, daß ϱ=1\varrho=1 ist, schreiben

μ=Cωsinξ(sinϑ)32cosϑcosξ1sinψ(cosnψ+ψ2-π4).\mu=C\sum{\frac{\sqrt{\omega}\sin\xi{\left(\sin\vartheta\right)}^{\frac{3}{2}}% }{\sqrt{\cos\vartheta\cos\xi}}}\cdot\frac{1}{\sqrt{\sin\psi}}\left(\cos n\psi+% \frac{\psi}{2}-\frac{\pi}{4}\right).

Dabei ist μ\mu der Wert der elektrischen Oberflächendichte im Punkte M1M_{1} (s. die Figur).11 1 Der Ausdruck von μ\mu, kann auch auf eine einfachere Form zurückgeführt werden, nämlich μ=-i4πω2ϱ2D2n(n+1)(2n+1)In(ωD)In(ωϱ)Pn(cosφ)\mu=\frac{-i}{4\pi\omega^{2}\varrho^{2}D^{2}}\sum{n\left(n+1\right)\left(2n+1% \right)\frac{I_{n}\left(\omega D\right)}{{I_{n}}^{\prime}\left(\omega\varrho% \right)}P_{n}\left(\cos\varphi\right)} und diese Formel ist nicht eine angenäherte, sondern eine strenge.

Aus

sinξ=nω,sinϑ=nωD;cosξ=1-n2ω2,cosϑ=1-n2D2ω2\sin\xi=\frac{n}{\omega},\ \sin\vartheta=\frac{n}{\omega D};\ \cos\xi=\sqrt{1-% \frac{n^{2}}{\omega^{2}}},\ \cos\vartheta=\sqrt{1-\frac{n^{2}}{D^{2}\omega^{2}}}

bekommen wir

sinξ(sinϑ)32cosϑcosξ=nω(nωD)32D(1+nω)(1+nDω)4ωω-n4ω(D-1)411+ω-nω(D-1)4,\frac{\sin\xi{\left(\sin\vartheta\right)}^{\frac{3}{2}}}{\sqrt{\cos\vartheta% \cos\xi}}=\frac{\frac{n}{\omega}\cdot{\left(\frac{n}{\omega D}\right)}^{\frac{% 3}{2}}\sqrt{D}}{\sqrt[4]{\left(1+\frac{n}{\omega}\right)\left(1+\frac{n}{D% \omega}\right)}}\cdot\frac{\sqrt{\omega}}{\sqrt[4]{\omega-n}\cdot\sqrt[4]{% \omega\left(D-1\right)}}\cdot\frac{1}{\sqrt[4]{1+\frac{\omega-n}{\omega\left(D% -1\right)}}},

sodaß in der Nähe von n=ωn=\omega der linke Ausdruck von derselben Größenordnung ist wie

ω4D-141n-ω4.\frac{\sqrt[4]{\omega}}{\sqrt[4]{D-1}}\cdot\frac{1}{\sqrt[4]{n-\omega}}.

Führen wir diese Annäherung in unsere Formel für μ\mu ein und ersetzen
cos(nψ+ψ2-π4)\cos{\left(n\psi+\frac{\psi}{2}-\frac{\pi}{4}\right)} zunächst durch ei(nψ+ψ2-π4)e^{i\left(n\psi+\frac{\psi}{2}-\frac{\pi}{4}\right)}, so kommen wir auf die Reihe

ω34ei(ψ2-π4)sinψD-14(n)einψn-ω4.\frac{\omega^{\tfrac{3}{4}}e^{i\left(\frac{\psi}{2}-\frac{\pi}{4}\right)}}{% \sqrt{\sin\psi}\cdot\sqrt[4]{D-1}}\cdot\sum_{\left(n\right)}{\frac{e^{in\psi}}% {\sqrt[4]{n-\omega}}}.

Schreiben wir

S=(n)einψn-ω,S=\sum_{\left(n\right)}{\frac{e^{in\psi}}{\sqrt{n-\omega}}},

so können wir

νν+1Se-iωψ𝑑ω\displaystyle\int\limits_{\nu}^{\nu+1}{Se^{-i\omega\psi}d\omega} (νganzzahlig)\displaystyle(\nu\ \text{ganzzahlig})

als einen Mittelwert der Reihe SS betrachten, und ich will SS durch diesen Mittelwert ersetzen. Ein solches Verfahren ist gewiß berechtigt, wenn es uns nur daran liegt, die Größenordnung von SS festzustellen, umsomehr als in Wirklicheit von einer Antenne nicht bloß Schwingungen einer einzigen Wellenlänge, sondern ein ganzes kontinuierliches Spektrum von Schwingungen ausgeht. Wir erhalten

νν+1Se-iωψ𝑑ω\displaystyle\int\limits_{\nu}^{\nu+1}{Se^{-i\omega\psi}d\omega} =(n)νν+1ei(n-ω)ψn-ω4𝑑ω\displaystyle=\sum_{\left(n\right)}{\int\limits_{\nu}^{\nu+1}{\frac{e^{i\left(% n-\omega\right)\psi}}{\sqrt[4]{n-\omega}}d\omega}}
=--ωeiqψq4𝑑q,\displaystyle=-\int\limits_{-\omega}^{\infty}{\frac{e^{iq\psi}}{\sqrt[4]{q}}}dq,

und da ω\omega sehr groß ist, wird dieses Integral mit -+eiqψq4𝑑q\displaystyle\int\limits_{-\infty}^{+\infty}\displaystyle\frac{e^{iq\psi}}{% \sqrt[4]{q}}dq im wesentlichen übereinstimmen.

Auf ähnliche Weise zeigt man, daß der Mittelwert von

e-inψn-ω4\sum{\frac{e^{-in\psi}}{\sqrt[4]{n-\omega}}}

gegen den von SS zu vernachlässigen ist. Damit gewinnen wir das Resultat, daß μ\mu von der Größenordnung

ω34D-14\frac{\sqrt[4]{\omega^{3}}}{\sqrt[4]{D-1}}

und also μN\frac{\mu}{N} von der Größenordnung

1ω(D-1)4\frac{1}{\sqrt[4]{\omega\left(D-1\right)}}

ist. Die Beugung ist daher um so größer, je näher die Quelle SS der Erdoberfläche gelegen ist und je länger die entsendeten Wellen sind. Auf diese Weise wird die zunächst staunenerregende Tatsache verständlich, daß es mit Hilfe der in der drahtlosen Telegraphie verwendeten Hertzschen Wellen gelingt, vom europäischen Kontinent z. B. bis nach Amerika zu telegraphieren.

Wenn man nicht den mittleren Wert der Reihe betrachten will, welcher von einem Integral dargestellt wird, sondern den wirklichen Wert dieser Reihe, so hat man eine Diskussion durchzuführen, welche auf einem wohlbekannten Abelschen Satz beruht, und deren Resultate etwas komplizierter, aber sonst ganz ähnlich den vorliegenden sind.

Note. Je me suis aperçu que les dernières conclusions doivent être modifiées. Les formules approchées dont j’ai fait usage ne sont plus vraies lorsque nn est très voisin de ωϱ\omega\varrho. Elles doivent être alors remplacées par d’autres, où figure une transcendante entière satisfaisant à l’équation différentielle

y′′=xy.y^{\prime\prime}=xy.

Mais les termes qui doivent être ainsi modifiés sont en petit nombre et j’avais cru d’abord que le résultat final n’en serait pas modifié. Un examen plus approfondi m’a montré qu’il n’en est rien. La somme des termes modifiés est comparable à celle des autres termes dont j’avais tenu compte et qui est donnée par la formule précédente; il en résulte une compensation presque complète de sorte que la valeur de μ\mu donnée par les formules définitives est notablement plus petite que celle qui résulterait des formules précédentes.

Time-stamp: "28.08.2019 00:36"

Kapitel 4 Über die Reduktion der Abelschen Integrale und die Theorie der Fuchsschen Funktionen

Meine Herren! Ich habe die Absicht, Ihnen heute über die Reduktion der Abelschen Integrale im Zusammenhang mit der Theorie der automorphen und insbesondere der Fuchsschen Funktionen vorzutragen.

Ein System von Abelschen Funktionen von pp Variabeln und 2p2p Perioden heißt reduzibel, wenn es sich auf ein System von qq Variabeln und 2q2q Perioden (q<p)(q<p) zurückführen läßt. Hierbei ist es von vornherein von Wichtigkeit, zwei Fälle zu unterscheiden:

Im ersten Falle soll es möglich sein, das System SS Abelscher Funktionen von pp Variabeln durch eine algebraische Kurve CC vom Geschlechte pp zu erzeugen. Ebenso soll das System SS^{\prime} von qq Variabeln aus der Theorie eines algebraischen Gebildes vom Geschlechte qq entspringen.

Dieser unser erste Fall ist aber bekanntlich nicht der allgemeine; denn die Kurve CC hängt nur von 3p-33p-3 Konstanten ab, während die allgemeinen Abelschen Funktionen von pp Variabeln p(p+1)2\frac{p\left(p+1\right)}{2} Parameter enthalten. Dadurch ist der zweite der beiden Fälle gegeben, die wir unterscheiden. In diesem Falle nämlich soll mindestens eines der beiden Systeme SS, SS^{\prime} nicht aus der Theorie der algebraischen Gebilde entspringen.

In meinem heutigen Vortrag will ich mich durchaus auf den erstgenannten Fall beschränken. Aber auch dann muß ich noch zwei Fälle unterscheiden. Wir knüpfen nämlich unsere Betrachtungen an die beiden algebraischen Kurven CC und CC^{\prime} an. Im Falle der Reduzibilität besteht zwischen beiden eine algebraische Korrespondenz. Die Beschaffenheit derselben liegt der in Aussicht gestellten Fallunterscheidung zugrunde.

Der erste Fall ist der folgende. Vermöge der Korrespondenz ist jedem Punkte MM von CC ein und nur ein Punkt MM^{\prime} von CC^{\prime} zugeordnet, während umgekehrt jedem Punkte von CC^{\prime} nn Punkte von CC entsprechen. Ich nenne dann nn die charakteristische Zahl der Korrespondenz und sage, CC ist eine vielfache Kurve von CC^{\prime}.

Der eben genannte erste Fall ist aber nicht der allgemeine. Das ist vielmehr der nun folgende zweite. Hier nämlich besteht die Korrespondenz nicht zwischen einzelnen Punkten MM und MM^{\prime}, sondern zwischen Systemen von Punkten M1,,MνM_{1},\mathellipsis,M_{\nu} von CC mit den Koordinaten x1,y1;;xν,yνx_{1},y_{1};\mathellipsis;x_{\nu},y_{\nu} und M1,,Mν{M_{1}}^{\prime},\mathellipsis,{M_{\nu}}^{\prime} von CC^{\prime} mit den Koordinaten x1,y1;;xνyν{x_{1}}^{\prime},{y_{1}}^{\prime};\allowbreak\dotsc;\allowbreak{x_{\nu}}^{% \prime}{y_{\nu}}^{\prime}. Jedem System auf CC soll dabei ein und nur ein System auf CC^{\prime} entsprechen, während umgekehrt einem System auf CC^{\prime} im allgemeinen mehrere Systeme auf CC zugeordnet sind. Ich sage dann, CC ist eine pseudovielfache Kurve von CC^{\prime}.

Im erstgenannten Falle sind xx^{\prime} und yy^{\prime} rationale Funktionen von xx und yy, während im zweiten nur geschlossen werden kann, daß jede rationale und symmetrische Funktion der (x1y1,,xνyν)({x_{1}}^{\prime}{y_{1}}^{\prime},\dotsc,{x_{\nu}}^{\prime}{y_{\nu}}^{\prime}) eine rationale Funktion der (x1y1,,xνyν)({x_{1}}{y_{1}},\allowbreak\dotsc,\allowbreak{x_{\nu}}{y_{\nu}}) ist. Es ist leicht zu sehen, daß jede Kurve CC, die eine vielfache von CC^{\prime} ist, auch eine pseudovielfache der Kurve CC^{\prime} ist. Umgekehrt aber habe ich mehrere Beispiele bilden können dafür, daß nicht jede pseudovielfache Kurve von CC^{\prime} auch eine vielfache von CC^{\prime} ist. Ich will jedoch hier nicht näher darauf eingehen, zumal da sich meine folgenden Darlegungen durchaus an den ersten Fall anschließen werden.

Im Falle der Reduzibilität unserer Integrale ist es möglich, ihre Periodentabelle auf eine besondere Normalform zu bringen. Die folgenden beiden Beispiele mögen eine Anschauung von der Beschaffenheit derselben geben.

1) q=1q=1; p=3p=3. Die Periodentabelle kann auf die folgende Form gebracht werden:

2iπ00h2iπα002iπ02iπαab002iπ0bc.\begin{array}[]{cccccc}2\text{i}\pi&0&0&h&\frac{2\text{i}\pi}{\alpha}&0\\ 0&2\text{i}\pi&0&\frac{2\text{i}\pi}{\alpha}&a&b\\ 0&0&2\text{i}\pi&0&b&c.\end{array}

2) q=2q=2; p=4p=4. Die normierten Perioden sind hier:

2iπ000ab02iπα02iπ00bc2iπαβ0002iπ002iπαβab0002iπ2iπα0bc.\begin{array}[]{cccccccc}2\text{i}\pi&0&0&0&a&b&0&\frac{2\text{i}\pi}{\alpha}% \\ 0&2\text{i}\pi&0&0&b&c&\frac{2\text{i}\pi}{\alpha\beta}&0\\ 0&0&2\text{i}\pi&0&0&\frac{2\text{i}\pi}{\alpha\beta}&a^{\prime}&b^{\prime}\\ 0&0&0&2\text{i}\pi&\frac{2\text{i}\pi}{\alpha}&0&b^{\prime}&c^{\prime}.\end{array}

Die Zahlen α\alpha, β\beta bedeuten in beiden Tabellen ganze rationale Zahlen.

Ich definiere nun noch eine zweite charakteristische Zahl κ\kappa. Sie gibt die Ordnung der Thetafunktion von qq Variabeln an, in die eine Thetafunktion erster Ordnung von pp Variabeln im Falle der Reduzibilität transformiert werden kann. Im ersten Beispiel ist κ=α\kappa=\alpha, im zweiten κ=αβ\kappa=\alpha\beta. Die beiden charakteristischen Zahlen nn und κ\kappa sind nun immer einander gleich. Ich habe zwei Beweise für diesen Satz gefunden, die ich jetzt in ihren Grundzügen auseinandersetzen will.

Erster Beweis. Seien MM und MM^{\prime} zwei Abelsche Integrale erster, zweiter oder dritter Gattung der Kurve CC. Ich denke mir die zugehörige Riemannsche Fläche irgendwie längs 2p2p von einem Punkte ausgehenden nichtzerstückenden Rückkehrschnitten kanonisch aufgeschnitten. Dann mögen MM und MM^{\prime} die folgenden Perioden besitzen:

M\displaystyle M :x1,x2,,x2p,\displaystyle:x_{1},x_{2},\mathellipsis,x_{2p},
M\displaystyle M^{\prime} :y1,y2,,y2p.\displaystyle:y_{1},y_{2},\mathellipsis,y_{2p}.

Ich muß nun eine charakteristische fundamentale Bilinearform definieren. Ich setze nämlich:

F(x,y)=M𝑑MF(x,y)=\int{MdM^{\prime}}

wo das Integral längs der ganzen Kontur der Zerschneidung erstreckt werden soll. Wenn xx, yy Normalperioden sind, so nimmt F(x,y)F(x,y) die folgende Form an:

F(x,y)=κ=1p(x2κ-1y2κ-x2κy2κ-1).F(x,y)=\sum\limits_{\kappa=1}^{p}\left(x_{2\kappa-1}y_{2\kappa}-x_{2\kappa}y_{% 2\kappa-1}\right).

Nehme ich an, es sei MM eines der reduziblen Integrale, dann drücken sich seine 2p2p Perioden ganzzahlig und linear durch nur 2q2q Perioden ω1,,ω2q\omega_{1},\mathellipsis,\omega_{2q} aus. Ich habe also dann:

xκ=j=12qmκjωj\displaystyle x_{\kappa}=\sum\limits_{j=1}^{2q}m_{\kappa j}\omega_{j} (κ=1,2,,2p),\displaystyle(\kappa=1,2,\mathellipsis,2p),

wo die mκm_{\kappa} ganze rationale Zahlen bedeuten. Wenn nun MM und MM^{\prime} Integrale erster Gattung sind, dann ist bekanntlich

F(x,y)=0F(x,y)=0

Wenn man in diese Gleichung die Ausdrücke der xx durch die ω\omega einsetzt, so bekommt man eine bilineare Gleichung zwischen den yy und ω\omega, die in der folgenden Form geschrieben werden kann:

j=12qHjωj=0\sum\limits_{j=1}^{2q}H_{j}\omega_{j}=0

Seien nun u1,,upu_{1},\mathellipsis,u_{p} pp linear unabhängige Integrale erster Gattung von CC. Dann können wir setzen:

U=μ1u1+μ2u2++μpupU=μ1u1+μ2u2++μpup\begin{array}[]{llllllll}U&=\mu_{1}u_{1}&+&\mu_{2}u_{2}&+&\mathellipsis&+\mu_{% p}u_{p}\\ U^{\prime}&={\mu_{1}}^{\prime}u_{1}&+&{\mu_{2}}^{\prime}u_{2}&+&\mathellipsis&% +{\mu_{p}}^{\prime}u_{p}\\ \end{array}

Die vorläufig noch unbestimmten Koeffizienten μ\mu^{\prime} sollen nun so bestimmt werden, daß sie den 2q2q linearen Gleichungen:

Hj=0\displaystyle H_{j}=0 (j=1,2,,2q)\displaystyle(j=1,2,\mathellipsis,2q)

genügen. Wenn man dann noch beachtet, daß diese 2q2q Gleichungen nicht linear unabhängig sind, sondern daß zwischen ihnen qq Relationen

Hjωj=0\sum H_{j}\omega_{j}=0

bestehen, so ist leicht zu erkennen, daß auch M1M_{1} reduzierbar ist, und daß, so wie MM einer Schar von qq reduziblen Integralen angehört, auch MM^{\prime} ein Element einer (p-q)(p-q)fach unendlichen linearen Schar von reduziblen Integralen ist. Doch dies nur nebenbei.

Ich bemerke nun, daß HjH_{j} eine lineare Funktion der yκy_{\kappa} ist, sodaß ich schreiben kann:

Hj=i=12phijyi\displaystyle H_{j}=\sum\limits_{i=1}^{2p}h_{ij}y_{i} (j=1,2,,2q),\displaystyle(j=1,2,\mathellipsis,2q),

wo die hijh_{ij} ganze rationale Zahlen sind. Aus den miκm_{i\kappa} und den hiκh_{i\kappa} kann ich nun zwei Tabellen von je 2q2q Kolonnen und 2p2p Zeilen bilden. Aus beiden kann ich gewisse qq-reihige Determinanten bilden. Ich bezeichne die der mm mit DD und die aus denselben Zeilen der hh gebildete mit DD^{\prime}. Dann setze ich

J=DD.J=\sum{DD^{\prime}}.

JJ ist nun in dem folgenden Sinne eine invariante Zahl: Sie bleibt ungeändert, wenn man irgendeines der Periodensysteme xx oder ω\omega durch ein äquivalentes ersetzt. Dabei heißen zwei Periodensysteme äquivalent, wenn sie sich ganzzahlig und linear durcheinander ausdrücken lassen. Man kann nun einerseits beweisen, daß

J=κ2,J=\kappa^{2},

andererseits aber, daß

J=n2.J=n^{2}.

Daraus kann man folgern, daß

κ=n.\kappa=n.

Das ist der erste Beweis. Der nun folgende

Zweite Beweis ist wesentlich kürzer. Er beruht auf dem Vergleich der zu SS und SS^{\prime} gehörigen Bilinearformen F(x,y)F(x,y) und Φ(ω,ω)\Phi(\omega,\omega^{\prime}). Man hat nämlich einerseits

F(x,y)=nΦ(ω,ω),F(x,y)=n\Phi(\omega,\omega^{\prime}),

andererseits

F(x,y)=κΦ(ω,ω).F(x,y)=\kappa\Phi(\omega,\omega^{\prime}).

Daraus schließt man

κ=n.\kappa=n.

Ich komme nun zum Zusammenhang der Reduktionstheorie mit der Theorie der Fuchsschen Funktionen.

Bekanntlich definiert jede algebraische Kurve CC ein System von Fuchsschen Funktionen. Nun kann man die Tatsache, daß CC ein Vielfaches von CC^{\prime} ist, auch folgendermaßen ausdrücken. Es ist immer auf mannigfache Weise möglich, der Kurve CC^{\prime} eine Grenzkreisgruppe GG^{\prime} und CC eine ebensolche Gruppe GG zuzuordnen, sodaß GG eine Untergruppe von GG^{\prime} ist. Ist im besonderen CC ein nn-faches von CC^{\prime}, dann ist GG eine Untergruppe vom Index nn von GG^{\prime}. Man erhält daher einen Fundamentalbereich von GG dadurch, daß man nn geeignet gewählte Fundamentalbereiche von GG^{\prime}, die durch die Operationen von GG^{\prime} auseinander hervorgehen, aneinander lagert. Das Polygon PP von GG erscheint dann in nn Polygone P(β)P^{\prime}(\beta) eingeteilt, die einem Polygon PP^{\prime} von GG^{\prime} im Sinne der nichteuklidischen Geometrie kongruent sind.

Ich bezeichne die Seiten des Polygons PP^{\prime} mit γ(α)\gamma(\alpha) und die homologen Seiten von P(β)P^{\prime}(\beta) mit γ(α,β)\gamma(\alpha,\beta). Die Seiten γ(α,β)\gamma(\alpha,\beta) liegen entweder im Innern oder auf dem Rande von PP. Ich nehme nun an, die Seite γ(α)\gamma(\alpha^{\prime}) gehe aus γ(α)\gamma(\alpha) vermöge einer Operation von GG^{\prime} hervor. Wenn nun γ(α,β)\gamma(\alpha,\beta) auf dem Rande von PP liegt, dann gibt es eine weitere Seite γ(α,β)\gamma(\alpha^{\prime},\beta^{\prime}) auf diesem Rande, die mit γ(α,β)\gamma(\alpha,\beta) vermöge einer Operation von GG konjugiert ist. Wenn jedoch γ(α,β)\gamma(\alpha,\beta) im Innern von PP liegt, so existiert eine derartige von γ(α,β)\gamma(\alpha,\beta) verschiedene Seite nicht, sondern es fallen γ(α,β)\gamma(\alpha,\beta) und γ(α,β)\gamma(\alpha^{\prime},\beta^{\prime}) zusammen und bilden die gemeinsame Seite von P(β)P^{\prime}(\beta) und P(β)P^{\prime}(\beta^{\prime}). Aber wie dem auch sei, jedenfalls entspricht jeder Seite γ(α)\gamma(\alpha) von PP^{\prime} eine Permutation der nn Ziffern 11, 22, \dotsc, nn.

Eine der eben durchgeführten ganz ähnliche Betrachtung können wir auch für die Ecken von PP^{\prime} anstellen. So wie wir nämlich die Seiten in Paare zusammenfaßten, so können wir die Ecken in Zyklen einteilen, so daß die Ecken eines Zyklus auseinander durch die Operationen von GG^{\prime} hervorgehen. Jedem solchen Zyklus kann wieder eine bestimmte Vertauschung der nn Ziffern 11, 22, \dotsc, nn zugeordnet werden, die sich aus den den Seiten zugeordneten gewinnen läßt. Ich nehme nun an, es habe PP 2N2N Seiten und QQ Eckenzyklen. 2N2N^{\prime} und QQ^{\prime} sollen die gleiche Bedeutung für PP^{\prime} haben. Die einem Eckenzyklus von PP^{\prime} entsprechende Permutation läßt sich in zyklische Permutationen zerlegen. Bei allen Eckenzyklen mögen dabei im ganzen λi\lambda_{i} zyklische Permutationen von gerade ii Ziffern vorkommen. Dann bestehen die folgenden Relationen:

2p\displaystyle 2p =N-Q+1,\displaystyle=N-Q+1,
2q\displaystyle 2q =N-Q+1,\displaystyle=N^{\prime}-Q^{\prime}+1,
Q+2p-2\displaystyle Q+2p-2 =n(Q+2q-2),\displaystyle=n(Q^{\prime}+2q-2),
n(Q-Q)\displaystyle n(Q^{\prime}-Q) =2(p-1)-2n(q-1),\displaystyle=2(p-1)-2n(q-1),
λi\displaystyle\sum{\lambda_{i}} =Q,\displaystyle=Q,
iλi\displaystyle\sum{i\lambda_{i}} =nQ.\displaystyle=nQ^{\prime}.

Die bisher gegebenen allgemeinen Betrachtungen setzen uns nun instand, eine Reihe schöner und wichtiger Sätze über die nichteuklidische Geometrie der Kreisbogenpolygone, sowie über die Geometrie der algebraischen Kurven abzuleiten. Ich will im folgenden einige Beispiele solcher Sätze anführen, ohne mich des näheren auf Beweise einzulassen, deren Grundzüge übrigens im vorstehenden enthalten sind.

1) p=3p=3, q=2q=2, n=2n=2, m=m=4m=m^{\prime}=4.

Mit mm und mm^{\prime} sind dabei die Ordnungen der Kurven CC und CC^{\prime} bezeichnet. CC hat keinen Doppelpunkt, CC^{\prime} hat einen Doppelpunkt. Von den 28 Doppeltangenten von CC gehen sechs durch einen Punkt außerhalb der Kurve.

2) p=4p=4, q=2q=2, n=2n=2, m=4m=4, m=5m^{\prime}=5.

CC hat zwei Doppelpunkte, CC^{\prime} nur einen. Setzt man die Differentiale der reduziblen Integrale erster Gattung gleich Null, so erhält man ein Kegelschnittbüschel, dessen vier Basispunkte von den beiden Doppelpunkten von CC und zwei weiteren Punkten derselben Kurve gebildet werden. Sechs dieser Kegelschnitte berühren CC doppelt. Derjenige derselben, der CC in einem Basispunkte berührt, oskuliert daselbst.

3) p=2p=2, q=1q=1, n=2n=2.

Die Kurve CC ist ein Vielfaches von zwei verschiedenen Kurven CC^{\prime} und C′′C^{\prime\prime}. Es existiert eine Fuchssche Gruppe GG, zu der man sowohl ein erstes Polygon P1P_{1} konstruieren kann, das aus zwei Polygonen einer zu CC^{\prime} gehörigen Gruppe GG^{\prime} besteht, als auch ein zweites Polygon P2P_{2}, das aus zwei Polygonen einer zu C′′C^{\prime\prime} gehörigen Gruppe G′′G^{\prime\prime} besteht. GG ist also sowohl in GG^{\prime} als in G′′G^{\prime\prime} als Untergruppe vom Index 22 enthalten. Die nebenstehende schematische Figur möge zur Veranschaulichung der Verhältnisse dienen. Die beiden eben erwähnten Fundamentalbereiche P1P_{1} und P2P_{2} von GG sind durch die Polygone mit den Ecken AA bzw. CC dargestellt. Jedes derselben zerfällt in zwei Sechsecke, die bzw. Fundamentalbereiche von GG^{\prime} oder G′′G^{\prime\prime} sind. Um die Äquivalenz von P1P_{1} und P2P_{2} besser hervortreten zu lassen, sind die Symmetriezentren der erwähnten Sechsecke mit den Seitenmitten verbunden, sodaß alle Polygone sich in leicht ersichtlicher Weise aus den so entstehenden Vierecken aufbauen.

Ich gehe nun zu den Sätzen aus der Geometrie der algebraischen Kurven über, die uns dieses Beispiel lehrt. Wenn ich auf CC^{\prime} einen Punkt MM^{\prime} markiere, so entsprechen diesem zwei Punkte MaM_{a} und MbM_{b} auf CC. Jedem von diesen entspricht ein Punkt von C′′C^{\prime\prime}: Ma′′M_{a}^{\prime\prime}, Mb′′M_{b}^{\prime\prime}. Es entsprechen also im allgemeinen jedem Punkte von CC^{\prime} zwei Punkte von C′′C^{\prime\prime}. Ebenso kann man schließen, daß im allgemeinen jedem Punkte von C′′C^{\prime\prime} zwei Punkte von CC^{\prime} entsprechen. Die Korrespondenz (C,C)(C^{\prime},C) hat aber zwei Verzweigungspunkte M1{M_{1}}^{\prime}, M2{M_{2}}^{\prime}. Jedem von ihnen entspricht also nur ein Punkt von CC und also auch nur ein Punkt von C′′C^{\prime\prime}: M1′′M_{1}^{\prime\prime}, M2′′M_{2}^{\prime\prime}. Ebenso hat die Korrespondenz (C′′,C)(C^{\prime\prime},C) zwei Verzweigungspunkte N1′′N_{1}^{\prime\prime}, N2′′N_{2}^{\prime\prime}. Jedem von ihnen ist nur ein Punkt von CC^{\prime} zugeordnet: N1{N_{1}}^{\prime}, N2{N_{2}}^{\prime}. Wir können dann den ersten Satz, den wir anführen wollen, so aussprechen:

N1{N_{1}}^{\prime} und N2{N_{2}}^{\prime} einerseits und M1′′M_{1}^{\prime\prime} und M2′′M_{2}^{\prime\prime} andererseits fallen zusammen.

Ich gehe zum zweiten Satz über, der sich ergibt, wenn man CC^{\prime} und C′′C^{\prime\prime} als Kurven dritter Ordnung voraussetzt.

Ich kann in N1=N2{N_{1}}^{\prime}={N_{2}}^{\prime} die Tangente an CC^{\prime} ziehen. Ich verbinde ferner M1{M_{1}}^{\prime} und M2{M_{2}}^{\prime} durch eine Sekante. Diese beiden Geraden schneiden sich auf CC^{\prime}. Ebenso kann ich in M1′′=M2′′M_{1}^{\prime\prime}=M_{2}^{\prime\prime} die Tangente an C′′C^{\prime\prime} ziehen und mit der Sekante N1′′N2′′N_{1}^{\prime\prime}N_{2}^{\prime\prime} zum Schnitt bringen. Der Schnittpunkt liegt auf C′′C^{\prime\prime}.

Diese wenigen Beispiele lassen zur Genüge erkennen, wie zahlreich die besonderen Fälle sind.

Time-stamp: "5.05.2019 01:04"

Kapitel 5 Über transfinite Zahlen

Meine Herren! Ich will heute über den Begriff der transfiniten Kardinalzahl vor Ihnen sprechen; und zwar will ich zunächst von einem scheinbaren Widerspruch reden, den dieser Begriff enthält. Dazu schicke ich folgendes voraus: meiner Ansicht nach ist ein Gegenstand nur dann denkbar, wenn er sich mit einer endlichen Anzahl von Worten definieren läßt. Einen Gegenstand, der in diesem Sinne endlich definierbar ist, will ich zur Abkürzung einfach “definierbar” nennen. Demnach ist also ein nicht definierbarer Gegenstand auch undenkbar. Desgleichen will ich ein Gesetz “aussagbar” nennen, wenn es in einer endlichen Anzahl von Worten ausgesagt werden kann.

Herr Richard hat nun bewiesen, daß die Gesamtheit der definierbaren Gegenstände abzählbar ist, d. h. daß die Kardinalzahl dieser Gesamtheit 0\aleph_{0} ist. Der Beweis ist ganz einfach: sei α\alpha die Anzahl der Wörter des Wörterbuches, dann kann man mit nn Wörtern höchstens αn\alpha^{n} Gegenstände definieren. Läßt man nun nn über alle Grenzen wachsen, so sieht man, daß man nie über eine abzählbare Gesamtheit hinauskommt. Die Mächtigkeit der Menge der denkbaren Gegenstände wäre also 0\aleph_{0}. Herr Schoenflies hat gegen diesen Beweis eingewandt, daß man mit einer einzigen Definition mehrere, ja sogar unendlich viele Gegenstände definieren könne. Als Beispiel führt er die Definition der konstanten Funktionen an, deren es offenbar unendlich viele gibt. Dieser Einwand ist deshalb unzulässig, weil durch solche Definitionen gar nicht die einzelnen Gegenstände, sondern ihre Gesamtheit, in unserem Beispiel also die Menge der konstanten Funktionen definiert wird, und diese ist ein einziger Gegenstand. Der Einwand von Herrn Schoenflies ist also nicht stichhaltig.

Nun hat bekanntlich Cantor bewiesen, daß das Kontinuum nicht abzählbar ist; dies widerspricht dem Beweise von Richard. Es fragt sich also, welcher von beiden Beweisen richtig ist. Ich behaupte, sie sind beide richtig, und der Widerspruch ist nur ein scheinbarer. Zur Begründung dieser Behauptung will ich einen neuen Beweis für den Cantorschen Satz geben: Wir nehmen also an, es sei eine Strecke ABAB gegeben und ein Gesetz, durch welches jedem Punkte der Strecke eine ganze Zahl zugeordnet wird. Wir wollen der Einfachheit halber die Punkte durch die ihnen zugeordneten Zahlen bezeichnen. Wir teilen nun unsere Strecke durch zwei beliebige Punkte A1A_{1} und A2A_{2} in drei Teile, die wir als Unterstrecken 11. Stufe bezeichnen; diese teilen wir wieder in je drei Teile und erhalten Unterstrecken 22. Stufe; dieses Verfahren denken wir uns ins Unendliche fortgesetzt, wobei die Länge der Unterstrecken unter jede Grenze sinken soll. Der Punkt 11 gehört nun einer oder höchstens, wenn er mit A1A_{1} oder A2A_{2} zusammenfällt, zweien der Unterstrecken erster Stufe an, es gibt also sicher eine, der er nicht angehört. Auf dieser suchen wir den Punkt mit der niedrigsten Nummer, die nun mindestens 22 sein muß, auf. Unter den 33 Unterstrecken 22. Stufe, die zu derjenigen Strecke 11. Stufe gehören, auf der wir uns befinden, ist nun wieder mindestens eine, der der zuletzt betrachtete Punkt nicht angehört. Auf dieser setzen wir das Verfahren fort und erhalten so eine Folge von Strecken, die folgende Eigenschaften hat: jede von ihnen ist in allen vorhergehenden enthalten, und eine Strecke ntern^{\textrm{ter}} Stufe enthält keinen der Punkte 11 bis n-1n-1. Aus der ersten Eigenschaft folgt, daß es mindestens einen Punkt geben muß, der ihnen allen gemeinsam ist; aus der zweiten Eigenschaft folgt aber, daß die Nummer dieses Punktes größer sein muß als jede endliche Zahl, d. h. es kann ihm keine Zahl zugeordnet werden.

Was haben wir nun zu diesem Beweise vorausgesetzt? Wir haben ein Gesetz vorausgesetzt, das jedem Punkte der Strecke eine ganze Zahl zuordnet. Dann konnten wir einen Punkt definieren, dem keine ganze Zahl zugeordnet ist. In dieser Hinsicht unterscheiden sich die verschiedenen Beweise dieses Satzes nicht. Dazu mußte aber das Gesetz zuerst feststehen. Nach Richard müßte anscheinend ein solches Gesetz existieren, aber Cantor hat das Gegenteil bewiesen. Wie kommen wir aus diesem Dilemma heraus? Fragen wir einmal nach der Bedeutung des Wortes “definierbar”. Wir nehmen die Tafel aller endlichen Sätze und streichen daraus alle diejenigen, die keinen Punkt definieren. Die Übrigbleibenden ordnen wir den ganzen Zahlen zu. Wenn wir jetzt die Durchmusterung der Tafel von neuem vornehmen, so wird es sich im allgemeinen zeigen, daß wir jetzt einige Sätze stehen lassen müssen, die wir vorher gestrichen haben. Denn die Sätze, in welchen man von dem Zuordnungsgesetz selbst sprach, hatten früher keine Bedeutung, da die Punkte den ganzen Zahlen noch nicht zugeordnet waren. Diese Sätze haben jetzt eine Bedeutung, und müssen in unserer Tafel bleiben. Würden wir jetzt ein neues Zuordnungsgesetz aufstellen, so würde sich dieselbe Schwierigkeit wiederholen und so ad infinitum. Hierin liegt aber die Lösung des scheinbaren Widerspruchs zwischen Cantor und Richard. Sei M0M_{0} die Menge der ganzen Zahlen, M1M_{1} die Menge der nach der ersten Durchmusterung der Tafel aller endlichen Sätze definierbaren Punkte unserer Strecke, G1G_{1} das Gesetz der Zuordnung zwischen beiden Mengen. Durch dieses Gesetz kommt eine neue Menge M2M_{2} von Punkten als definierbar hinzu. Zu M1+M2M_{1}+M_{2} gehört aber ein neues Gesetz G2G_{2}, dadurch entsteht eine neue Menge M3M_{3} usw. Richards Beweis lehrt nun, daß, wo ich auch das Verfahren abbreche, immer ein Gesetz existiert, während Cantor beweist, daß das Verfahren beliebig weit fortgesetzt werden kann. Es besteht also kein Widerspruch zwischen beiden.

Der Schein eines solchen rührt daher, daß dem Zuordnungsgesetz von Richard eine Eigenschaft fehlt, die ich mit einem von den englischen Philosophen entlehnten Ausdruck als “prädikativ” bezeichne. (Bei Russell, dem ich das Wort entlehne, ist eine Definition zweier Begriffe AA und AA^{\prime} nicht prädikativ, wenn AA in der Definition von AA^{\prime} und umgekehrt vorkommt.) Ich verstehe darunter folgendes: Jedes Zuordnungsgesetz setzt eine bestimmte Klassifikation voraus. Ich nenne nun eine Zuordnung prädikativ, wenn die zugehörige Klassifikation prädikativ ist. Eine Klassifikation aber nenne ich prädikativ, wenn sie durch Einführung neuer Elemente nicht verändert wird. Dies ist aber bei der Richardschen nicht der Fall, vielmehr ändert die Einführung des Zuordnungsgesetzes die Einteilung der Sätze in solche, die eine Bedeutung haben, und solche, die keine haben. Was hier mit dem Wort “prädikativ” gemeint ist, läßt sich am besten an einem Beispiel illustrieren: wenn ich eine Menge von Gegenständen in eine Anzahl von Schachteln einordnen soll, so kann zweierlei eintreten: entweder sind die bereits eingeordneten Gegenstände endgültig an ihrem Platze, oder ich muß jedesmal, wenn ich einen neuen Gegenstand einordne, die anderen oder wenigstens einen Teil von ihnen wieder herausnehmen. Im ersten Falle nenne ich die Klassifikation prädikativ, im zweiten nicht. Ein gutes Beispiel für eine nicht prädikative Definition hat Russell gegeben: AA sei die kleinste ganze Zahl, deren Definition mehr als hundert deutsche Worte erfordert. AA muß existieren, da man mit hundert Worten jedenfalls nur eine endliche Anzahl von Zahlen definieren kann. Die Definition, die wir eben von dieser Zahl gegeben haben, enthält aber weniger als hundert Worte. Und die Zahl AA ist also definiert als undefinierbar.

Zermelo hat nun gegen die Verwerfung der nicht prädikativen Definitionen den Einwand erhoben, daß damit auch ein großer Teil der Mathematik hinfällig würde, z. B. der Beweis für die Existenz einer Wurzel einer algebraischen Gleichung.

Dieser Beweis lautet bekanntlich folgendermaßen:

Gegeben ist eine Gleichung F(x)=0F(x)=0. Man beweist nun, daß |F(x)|\left|F(x)\right| ein Minimum haben muß; sei x0x_{0} einer der Argumentwerte, für den das Minimum eintritt, also

|F(x)||F(x0)|\left|F(x)\right|\geq\left|F(x_{0})\right|

Daraus folgt dann weiter, daß F(x0)=0F(x_{0})=0 ist. Hier ist nun die Definition von F(x0)F(x_{0}) nicht prädikativ, denn dieser Wert hängt ab von der Gesamtheit der Werte von F(x)F(x), zu denen er selbst gehört.

Die Berechtigung dieses Einwandes kann ich nicht zugeben. Man kann den Beweis so umformen, daß die nicht prädikative Definition daraus verschwindet. Ich betrachte zu diesem Zwecke die Gesamtheit der Argumente von der Form m+nip\frac{m+ni}{p}, wo mm, nn, pp ganze Zahlen sind. Dann kann ich dieselben Schlüsse wie vorher ziehen, aber der Argumentwert, für den das Minimum von |F(x)|\left|F(x)\right| eintritt, gehört im allgemeinen nicht zu den betrachteten. Dadurch ist der Zirkel im Beweise vermieden. Man kann von jedem mathematischen Beweise verlangen, daß die darin vorkommenden Definitionen usw. prädikativ sind, sonst wäre der Beweis nicht streng.

Wie steht es nun mit dem klassischen Beweise des Bernsteinschen Theorems? Ist er einwandfrei? Das Theorem sagt bekanntlich aus, daß, wenn drei Mengen AA, BB, CC gegeben sind, wo AA in BB und BB in CC enthalten ist, und wenn AA äquivalent CC ist, auch AA äquivalent BB sein muß. Es handelt sich also auch hier um ein Zuordnungsgesetz. Wenn das erste Zuordnungsgesetz (zwischen AA und CC) prädikativ ist, so zeigt der Beweis, daß es auch ein prädikatives Zuordnungsgesetz zwischen AA und BB geben muß.

Was nun die zweite transfinite Kardinalzahl 1\aleph_{1} betrifft, so bin ich nicht ganz überzeugt, daß sie existiert. Man gelangt zu ihr durch Betrachtung der Gesamtheit der Ordnungszahlen von der Mächtigkeit 0\aleph_{0}; es ist klar, daß diese Gesamtheit von höherer Mächtigkeit sein muß. Es fragt sich aber, ob sie abgeschlossen ist, ob wir also von ihrer Mächtigkeit ohne Widerspruch sprechen dürfen. Ein aktual Unendliches gibt es jedenfalls nicht.

Was haben wir von dem berühmten Kontinuumproblem zu halten? Kann man die Punkte des Raumes wohlordnen? Was meinen wir damit? Es sind hier zwei Fälle möglich: entweder behauptet man, daß das Gesetz der Wohlordnung endlich aussagbar ist, dann ist diese Behauptung nicht bewiesen; auch Herr Zermelo erhebt wohl nicht den Anspruch, eine solche Behauptung bewiesen zu haben. Oder aber wir lassen auch die Möglichkeit zu, daß das Gesetz nicht endlich aussagbar ist. Dann kann ich mit dieser Aussage keinen Sinn mehr verbinden, das sind für mich nur leere Worte. Hier liegt die Schwierigkeit. Und das ist wohl auch die Ursache für den Streit über den fast genialen Satz Zermelos. Dieser Streit ist sehr merkwürdig: die einen verwerfen das Auswahlpostulat, halten aber den Beweis für richtig, die anderen nehmen das Auswahlpostulat an, erkennen aber den Beweis nicht an.

Doch ich könnte noch manche Stunde darüber sprechen, ohne die Frage zu lösen.

Kapitel 6 La mécanique nouvelle

Mesdames, messieurs!

Aujourd’hui, je suis obligé de parler français, et il faut que je m’en excuse. Il est vrai que dans mes précédentes conférences je me suis exprimé en allemand, en un très mauvais allemand: parler les langues étrangères, voyez-vous, c’est vouloir marcher lorsqu’on est boiteux; il est nécessaire d’avoir des béquilles; mes béquilles, c’étaient jusqu’ici les formules mathématiques et vous ne sauriez vous imaginer quel appui elles sont pour un orateur qui ne se sent pas très solide. Dans la conférence de ce soir, je ne veux pas user de formules, je suis sans béquilles, et c’est pourquoi je dois parler français.

En ce monde, vous le savez, il n’est rien de définitif, rien d’immuable; les empires les plus puissants, les plus solides, ne sont pas éternels: c’est là un thème que les orateurs sacrés se sont plu bien souvent à développer. Les théories scientifiques sont comme les empires, elles ne sont pas assurées du lendemain. Si l’une d’elles semblait à l’abri des injures du temps, c’était, certes, la mécanique newtonienne: elle paraissait incontestée, c’était un monument impérissable; et voilà qu’à son tour, je ne dirai pas que le monument est par terre, ce serait prématuré, mais en tout cas il est fortement ébranlé. Il est soumis aux attaques de grands démolisseurs: vous en avez un parmi vous, M. Max Abraham, un autre est le physicien hollandais M. Lorentz. Je voudrais, en quelques mots, vous parler des ruines de l’ancien édifice et du nouveau bâtiment que l’on veut élever à leur place.

Tout d’abord qu’est-ce qui caractérisait l’ancienne mécanique? C’était ce fait très simple: je considère un corps en repos, je lui communique une impulsion, c’est à dire je fais agir sur lui, pendant un temps donné une force donnée; le corps se met en mouvement, acquiert une certaine vitesse; le corps étant animé de cette vitesse, faisons agir encore la même force pendant le même temps, la vitesse sera doublée; si nous continuons encore, la vitesse sera triplée après que nous aurons une troisième fois donné une impulsion identique. Recommençons ainsi un nombre suffisant de fois, le corps finira par acquérir une vitesse très grande, qui pourra dépasser toute limite, une vitesse infinie.

Dans la nouvelle mécanique, au contraire, on suppose qu’il est impossible de communiquer à un corps partant du repos une vitesse supérieure à celle de la lumière. Que se passe-t-il? Je considère le même corps au repos; je lui donne une première impulsion, la même que précédemment, il prendra la même vitesse; renouvelons une seconde fois cette impulsion, la vitesse va encore augmenter, mais elle ne sera plus doublée; une troisième impulsion produira un effet analogue, la vitesse augmente mais de moins en moins, le corps oppose une résistance qui devient de plus en plus grande. Cette résistance, c’est l’inertie, c’est ce qu’on appelle communément la masse; tout ce passe alors dans cette nouvelle mécanique comme si la masse n’était pas constante, mais croissait avec la vitesse. Nous pouvons représenter graphiquement les phénomènes: dans l’ancienne mécanique, le corps prend après la première impulsion une vitesse representée par le segment Oν1¯\overline{O\nu_{1}}; après la deuxième impulsion Oν1¯\overline{O\nu_{1}} s’accroît d’un segment ν1ν2¯\overline{\nu_{1}\nu_{2}} qui lui est égal, à chaque nouvelle impulsion, la vitesse s’accroît de la même quantité, le segment qui la représente s’accroît d’une longueur constante; dans la nouvelle mécanique, le segment vitesse s’accroît de segments ν1ν2¯\overline{\nu_{1}^{\prime}\nu_{2}^{\prime}}, ν2ν3¯\overline{\nu_{2}^{\prime}\nu_{3}^{\prime}}, …qui sont de plus en plus petits et tels que nous ne pouvons pas dépasser une certaine limite, la vitesse de la lumière.

Comment a-t-on été conduit à de telles conclusions? A-t-on fait des expériences directes? Les divergences ne se produiront que pour les corps animés de grandes vitesses; c’est alors seulement que les différences signalées deviennent sensibles. Mais, qu’est-ce qu’une très grande vitesse? Est-ce celle d’une automobile qui fait 100 kilomètres à l’heure; on s’extasie dans la rue sur une telle rapidité; à notre point de vue, c’est pourtant bien peu, une vitesse d’escargot. L’astronomie nous donne mieux: Mercure, le plus rapide des corps célestes parcourt lui aussi 100 kilomètres environ, non plus à l’heure mais à la seconde: pourtant, cela ne suffit pas encore, de telles vitesses sont trop faibles pour révéler les différences que nous voudrions observer. Je ne parle pas de nos boulets de canon, ils sont plus rapides que les automobiles, mais beaucoup plus lents que Mercure; vous savez cependant qu’on a découvert une artillerie dont les projectiles sont beaucoup plus vite: je veux parler du radium qui envoie dans tous les sens de l’énergie, des projectiles; la rapidité du tir est bien plus grande, la vitesse initiale est de 100 000100\,000 kilomètres par seconde, le tiers de la vitesse de la lumière; le calibre des projectiles, leur poids, sont, il est vrai, bien plus faibles et nous ne devons pas compter sur cette artillerie pour augmenter la puissance militaire de nos armées. Peut-on expérimenter sur ces projectiles? De telles expériences ont été effectivement tentées; sous l’influence d’un champ électrique, d’un champ magnétique il se produit une déviation qui permet de se rendre compte de l’inertie et de la mesurer. On a constaté ainsi que la masse dépend de la vitesse et énoncer cette loi: L’inertie d’un corps croît avec sa vitesse qui reste inférieure à celle de la lumière, 300 000300\,000 kilomètres par seconde.

Je passe maintenant au deuxième principe, le principe de relativité. Je suppose un observateur qui se déplace vers la droite; tout se passe pour lui comme s’il était au repos, les objets qui l’entourent se déplaçant vers la gauche: aucun moyen ne permet de savoir si les objets se déplacent réellement, si l’observateur est immobile ou en mouvement. On l’enseigne dans tous les cours de mécanique, le passager sur le bateau croit voir le rivage du fleuve se déplacer, tandis qu’il est doucement entraîné par le mouvement du navire. Examinée de plus près, cette simple notion acquiert une importance capitale; on n’a aucun moyen de trancher la question, aucune experience ne peut mettre en defaut le principe: il n’y a pas d’espace absolu, tous les déplacements que nous pouvons observer sont des deplacements relatifs. Ces considerations bien familières aux philosophes, j’ai eu quelquefois l’occasion de les exprimer: j’en ai même recueilli une publicité dont je me serais volontiers passé, tous les journaux réactionnaires français m’ont fait démontrer que le soleil tournait autour de la terre; dans le fameux procès entre l’Inquisition et Galilée, Galilée aurait eu tous les torts.

Revenons à l’ancienne mécanique: elle admettait le principe de relativité; au lieu d’être fondées sur des expériences, ses lois étaient déduites de ce principe fondamental. Ces considerations suffisaient pour les phénomènes purement mécaniques, mais cela n’allait plus pour d’importantes parties de la physique, l’optique par exemple. On considérait comme absolue la vitesse de la lumière relativement à l’éther: cette vitesse pouvait être mesurée, on avait théoriquement le moyen de comparer le déplacement d’un mobile à un deplacement absolu, le moyen de décider si oui ou non un corps était en mouvement absolu.

Des expériences délicates, des appareils extrêmement précis, que je ne décrirai pas devant vous, ont permis d’essayer la réalisation pratique d’une pareille comparaison: le résultat a été nul. Le principe de rélativite n’admet aucune restriction dans la nouvelle mécanique; il a, si j’ose ainsi dire, une valeur absolue.

Pour comprendre le rôle que joue le principe de relativité dans la Nouvelle Mécanique, nous sommes d’abord amenés à parler du temps apparent, une invention fort ingénieuse du physicien Lorentz. Nous supposons deux observateurs l’un AA à Paris, l’autre BB à Berlin. AA et BB ont des chronomètres identiques et veulent les régler: mais ce sont des observateurs méticuleux comme il n’y en a guère; ils exigent dans leur réglage une extraordinaire exactitude: ce sera, par exemple, non une seconde, mais un milliardième de seconde. Comment pourront-ils faire? De Paris à Berlin, AA envoie un signal télégraphique, avec un sans-fil, si vous voulez, pour être tout à fait moderne. BB note le moment de la réception et ce sera pour les deux chronomètres l’origine des temps. Mais le signal emploie un certain temps pour aller de Paris à Berlin, il ne va qu’avec la vitesse de la lumière; la montre de BB serait donc en retard; BB est trop intelligent pour ne point s’en rendre compte; il va remédier a cet inconvenient. La chose semble bien simple: on croîse les signaux, AA reçoit et BB envoie, on prend la moyenne des corrections ainsi faites, on a l’heure exacte. Mais cela est-il bien certain? Nous supposons que de AA à BB le signal emploie le même temps que pour aller de BB à AA. Or AA et BB sont emportés dans le mouvement de la terre par rapport à l’éther, véhicule des ondes électriques. Quand AA a envoyé son signal il fuit devant lui, BB s’éloigne de même, le temps employé sera plus long que si les deux observateurs étaient au repos; si au contraire c’est BB qui envoie, AA qui reçoit, le temps est plus court parce que AA va au devant des signaux; il leur est absolument impossible de savoir si leurs chronomètres marquent ou non la même heure. Quelle que soit la méthode employée les inconvénients restent les mêmes l’observation d’un phénomène astronomique, une méthode optique quelconque se heurtent aux mêmes difficultés, BB ne pourra jamais connaître qu’une différence apparente de temps, qu’une espèce d’heure locale. Le principe de relativité s’applique intégralement.

Dans l’ancienne mécanique pourtant, on démontrait avec ce principe toutes les lois fondamentales. On pourrait être tenté de reprendre les raisonnements classiques et de raisonner comme il suit? Soit encore deux observateurs, AA et BB pour les nommer comme on nomme toujours deux observateurs en mathématiques; supposons les en mouvement, s’éloignant l’un de l’autre; aucun d’eux ne peut dépasser la vitesse de la lumière; par exemple BB sera animé de 200 000200\,000 kilométres vers la droite, AA de 200 000200\,000 vers la gauche. AA peut se croire au repos et la vitesse apparente de BB sera, pour lui, 400 000400\,000 kilomètres. Si AA connait la mécanique nouvelle il se dira: BB a une vitesse qu’il ne peut atteindre, c’est donc que moi aussi je suis en mouvement. Il semble qu’il pourrait décider de sa situation absolue. Mais il faudrait qu’il puisse observer le mouvement de BB lui-même; pour faire cette observation AA et BB commencent par régler leurs montres, puis BB envoie à AA des télégrammes pour lui indiquer ses positions successives; en les réunissant AA peut se rendre compte du mouvement de BB et tracer la courbe de ce mouvement. Or les signaux se propagent avec la vitesse de la lumière; les montres qui marquent le temps apparent varient à chaque instant et tout se passera comme si la montre de BB avançait. BB croira aller beaucoup moins vite et la vitesse apparente qu’il aura relativement à AA ne dépassera pas la limite qu’elle ne doit pas atteindre. Rien ne pourra révéler à AA s’il est en mouvement ou en repos absolu.

Il faut encore faire une troisième hypothèse beaucoup plus surprenante, beaucoup plus difficile à admettre, qui gêne beaucoup nos habitudes actuelles. Un corps en mouvement de translation subit une déformation dans le sens même où il se déplace; une sphère, par exemple, devient comme une espèce d’ellipsoïde aplati dont le petit axe serait parallèle à la translation. Si l’on ne s’aperçoit pas tous les jours d’une transformation pareille c’est qu’elle est d’une petitesse qui la rend presque imperceptible. La terre, emportée dans sa révolution sur son orbite se déforme environ de 1/200 000 000\nicefrac{{1}}{{200\,000\,000}}: pour observer un pareil phénomène il faudrait des instruments de mesure d’une précision extrême, mais leur précision serait infinie qu’on n’en serait pas plus avancé car emportés eux aussi dans le mouvement ils subiront la même transformation. On ne s’apercevra de rien; le mètre que l’on pourrait employer deviendra plus court comme la longueur qu’on mesure. On ne peut savoir quelque chose qu’en comparant à la vitesse de la lumière la longueur de l’un de ces corps. Ce sont là de delicates experiences, réalisées par Michelson et dont je ne vous exposerai pas le détail; elles ont donné des résultats tout à fait remarquables; quelqu’étranges qu’il nous paraissent, il faut admettre que la troisième hypothèse est parfaitement vérifiée.

Telles sont les bases de la nouvelle mécanique, avec l’appui de ces hypothèses on trouve qu’elle est compatible avec le principe de relativité.

Mais il faut la rattacher alors à une conception nouvelle de la matière.

Pour le physicien moderne, l’atome n’est plus l’élément simple; il est devenu un véritable univers dans lequel des milliers de planètes gravitent autour de soleils minuscules. Soleils et planètes sont ici des particules électrisées soit négativement soit positivement; le physicien les appelle électrons et bâtit le monde avec elles. D’aucuns se représentent l’atome neutre comme une masse centrale positive autour de laquelle circulent un grand nombre d’électrons chargés négativement, dont la masse électrique totale est égale en grandeur à celle du noyau central.

Cette conception de la matière permet de rendre compte aisément de l’augmentation de la masse d’un corps avec sa vitesse, dont nous avons fait un des caractères de la mécanique nouvelle. Un corps quelconque n’étant qu’un assemblage d’électrons, il nous suffira de le montrer sur ces derniers. Remarquons, à cet effet, qu’un électron isolé se déplaçant à travers l’éther engendre un courant électrique, c’est-à-dire un champ électromagnétique. Ce champ correspond à une certaine quantité d’énergie localisée non dans l’électron, mais dans l’éther. Une variation en grandeur ou en direction de la vitesse de l’électron modifie le champ et se traduit par une variation de l’énergie électromagnétique de l’éther. Alors que dans la mécanique newtonienne la dépense d’énergie n’est due qu’à l’inertie du corps en mouvement, ici une partie de cette dépense est due à ce que l’on peut appeler l’inertie de l’éther relativement aux forces électromagnétiques. L’inertie de l’éther augmente avec la vitesse et sa limite devient infinie lorsque la vitesse tend vers la vitesse de la lumière. La masse apparente de l’électron augmente donc avec la vitesse; les expériences de Kaufmann montrent que la masse réelle constante de l’électron est négligeable par rapport à la masse apparente et peut être considérée comme nulle.

Dans cette nouvelle conception, la masse constante de la matière a disparu. L’éther seul, et non plus la matière, est inerte. Seul l’éther oppose une résistance au mouvement, si bien que l’on pourrait dire: il n’y a pas de matière, il n’y a que des trous dans l’éther. Pour les mouvements stationnaires ou quasi-stationnaires, la mécanique nouvelle ne diffère pas — au degré d’approximation de nos mesures près — de la mécanique newtonienne, avec cette seule différence que la masse n’est plus indépendante ni de la vitesse, ni de l’angle que fait cette vitesse avec la direction de la force accélératrice. Si par contre la vitesse a une accélération considérable, dans le cas, par ex., d’oscillations très rapides, il y a production d’ondes hertziennes représentant une perte d’énergie de l’électron entraînant l’amortissement de son mouvement. Ainsi, dans la télégraphie sans fil, les ondes émises sont dues aux oscillations des électrons dans la décharge oscillante.

Des vibrations analogues ont lieu dans une flamme et de même encore dans un solide incandescent. Pour Lorentz, il circule à l’intérieur d’un corps incandescent un nombre considérable d’électrons qui, ne pouvant pas en sortir, volent dans tous les sens et se réfléchissent sur sa surface. On pourrait les comparer à une nuée de moucherons enfermés dans un bocal et venant frapper de leurs ailes les parois de leur prison. Plus la temperature est élevée, plus le mouvement de ces électrons est rapide et plus les chocs mutuels et les réflexions sur la paroi sont nombreuses. A chaque choc et à chaque réflexion une onde électromagnétique est émise et c’est la perception de ces ondes qui nous fait paraître le corps incandescent.

Le mouvement des électrons est presque tangible, dans un tube de Crookes. Il s’y produit un véritable bombardement d’électrons partant de la cathode. Ces rayons cathodiques frappent violemment l’anticathode et s’y réfléchissent en partie donnant ainsi naissance à un ébranlement électromagnétique que plusieurs physiciens identifient avec les rayons Röntgen.

Il nous reste en terminant à examiner les relations de la mécanique nouvelle avec l’astronomie. La notion de masse constante d’un corps s’évanouissant, que deviendra la loi de Newton? Elle ne pourra subsister que pour des corps en repos. De plus il faudra tenir compte du fait que l’attraction n’est pas instantanée. On peut donc se demander avec raison si la mécanique nouvelle ne va réussir qu’à compliquer l’astronomie sans obtenir une approximation supérieure a celle que nous donne la mécanique céleste classique. Mr. Lorentz a abordé la question. Partant de la loi de Newton supposée vraie pour deux corps électrisés au repos, il calcule l’action électrodynamique des courants engendrés par ces corps en mouvement; il obtient ainsi une nouvelle loi d’attraction contenant les vitesses des deux corps comme paramètres. Avant d’examiner comment cette loi rend compte des phénomènes astronomiques, remarquons encore que l’accélération des corps célestes a comme conséquence un rayonnement électromagnétique, donc une dissipation de l’énergie se faisant ressentir en retour par un amortissement de leur vitesse. A la longue, les planètes finiront donc par tomber sur le soleil. Mais cette perspective ne peut guère nous effrayer, la catastrophe ne pouvant arriver que dans quelques millions de milliards de siècles. Revenant maintenant à la loi d’attraction, nous voyons aisément que la différence entre les deux mécaniques sera d’autant plus grande que la vitesse des planètes sera plus grande. S’il y a une différence appréciable, ce sera donc pour Mercure qu’elle sera la plus grande, Mercure ayant de toutes les planètes la plus grande vitesse. Or il arrive justement que Mercure présente une anomalie non encore expliquée: le mouvement de son périhélie est plus rapide que le mouvement calculé par la theorie classique. L’accélération est de 38" trop grande. Leverrier attribua cette anomalie à une planète non encore découverte et un astronome amateur crut observer son passage au soleil. Depuis lors plus personne ne l’a vue et il est malheureusement certain que cette planète aperçue n’était qu’un oiseau. Or la mécanique nouvelle rend bien compte du sens de l’erreur relative à Mercure, mais elle laisse cependant encore une marge de 32" entre elle et l’observation. Elle ne suffit donc pas à ramener la concordance dans la théorie de Mercure. Si ce résultat n’est guère décisif en faveur de la mécanique nouvelle, il est encore moins défavorable à son acceptation puisque le sens dans lequel elle corrige l’écart de la théorie classique est le bon. La théorie des autres planètes n’est pas sensiblement modifié dans la nouvelle théorie et les résultats coïncident à l’approximation des mesures près à ceux de la théorie classique.

Pour conclure, il serait prématuré, je crois, malgré la grande valeur des arguments et des faits érigés contre elle, de regarder la mécanique classique comme définitivement condamnée. Quoiqu’il en soit d’ailleurs, elle restera la mécanique des vitesses très petites par rapport à celle de la lumière, la mécanique donc de notre vie pratique et de notre technique terrestre. Si cependant, dans quelques années sa rivale triomphe, je me permettrai de vous signaler un écueil pédagogique que n’éviteront pas nombre de maîtres, en France, tout au moins. Ces maîtres n’auront rien de plus pressé, en enseignant la mécanique élémentaire à leurs élèves, que de leur apprendre que cette mécanique là a fait son temps, qu’une mécanique nouvelle où les notions de masse et de temps ont une toute autre valeur la remplace; ils regarderont de haut cette mécanique périmée que les programmes les forcent à enseigner et feront sentir à leurs élèves le mépris qu’ils lui portent. Je crois bien cependant que cette mécanique classique dédaignée sera aussi nécessaire que maintenant et que celui qui ne la connaîtra pas à fond ne pourra comprendre la mécanique nouvelle.

Time-stamp: " 5.05.2019 01:04"

Time-stamp: " 4.07.2019 01:09"