Computergestützte Methodik · REV 4.2 · 2026

Die Mathematik hinter dem Spiegel

Name: Methodik: Gesichtsalter, Puls & HRV
Creator: Maurice Lichtenberg

Deine Webcam sieht ein Gesicht. Ein paar Sekunden später bekommst du eine Einschätzung, wie alt du aussiehst, und einen Blick auf dein Herz. Wie? Zwischen Kamera und Zahl liegt eine lange Kette aus Signalverarbeitung und Deep Learning, und jeder Wert, den du siehst, hat sich gegen ein Dutzend Konkurrenten durchgesetzt. Hier siehst du, was wirklich passiert.

Erstellt von Maurice Lichtenberg, Gründer, Longevity Cities

478

getrackte Gesichtspunkte

250 Hz

effektive Schlag-Zeitauflösung

4. Ordnung

Nullphasen-IIR-Kaskade

10+

fusionierte Schätzer pro Scan

Zwei Pipelines, ein Gesicht

Die eine Pipeline liest dein Alter direkt aus den Pixeln. Sie ist ein Transformer (ein neuronales Netz, das jeden Bildteil gegen jeden anderen abwägt) und schaut sich Gesicht und Körper zusammen an. Warum beides? Weil ein Gesicht für sich genommen lügen kann. Haltung, Bildausschnitt und Statur geben dem Modell eine zweite Meinung.

Die andere Pipeline liest dein Herz aus genau dieser Haut. Jedes Mal, wenn dein Herz schlägt, wird dein Gesicht einen winzigen Tick röter. Wir reden von Bruchteilen eines Prozents, viel zu wenig fürs Auge. Um das herauszuholen, mitteln wir tausende Hautpixel und projizieren, filtern, tracken und fusionieren das Signal über die ganze Aufnahme. Das ist Photoplethysmographie (Blutfluss ablesen über die Farbe des Lichts auf der Haut).

Live-Signalkette

Teil I

Optische Altersregression

Dual-Stream-Transformer

Alter aus einem einzigen Bild lesen

Schneide eng aufs Gesicht zu und du wirfst die Hälfte der Geschichte weg. Schlechtes Licht, ein schiefer Winkel, ein grobes Bild: Jedes davon kann ein paar Jahre vortäuschen, in beide Richtungen.

Zuerst findet dich das Modell. Es zieht einen Rahmen um jedes Gesicht und den zugehörigen Körper, ordnet beide einander zu und ignoriert alle anderen im Bild. Jeder Ausschnitt wird ohne Verzerren skaliert und normalisiert (auf den Wertebereich gebracht, den das Netz erwartet). Dann wird er in ein feines Raster aus Kacheln zerlegt, dicht genug für die Dinge, die ein Gesicht wirklich altern lassen: feine Linien, die Art, wie Licht in der Haut streut. Zwei Ströme, Gesicht und Körper, tauschen sich über Attention aus (das Netz entscheidet, welche Kacheln zählen). Ist dein Gesicht unscharf, bekommt der Körper still mehr Gewicht. Am Ende steht eine Zahl: dein Alter.

Kanalweise Normalisierung speist ein dichtes Token-Gitter; Cross-Stream-Attention fusioniert Gesicht und Körper.

Teil II

Photoplethysmographische Inferenz

ROI · Hautsegmentierung

Haut in eine Wellenform verwandeln

Das Herzsignal ist winzig. Ein Bruchteil eines Prozents Farbänderung der Haut, versteckt unter Kamerarauschen, Auto-Helligkeit und jedem kleinen Wackeln deines Kopfes.

Also gehen wir auf die Jagd. Ein 478-Punkte-Netz (ein Raster, das das Modell über dein Gesicht legt) verfolgt Stirn und Wangen Bild für Bild. In diesen Bereichen behalten wir nur Haut und mitteln tausende Pixel auf einmal. Genau diese Mittelung ist der Trick: Rauschen ist zufällig und hebt sich auf, während sich der Puls aufsummiert. Wir beobachten außerdem eine ruhige Stelle im Hintergrund und ziehen ihre Lichtänderungen ab, damit eine flackernde Lampe nie für dein Herz gehalten wird. Übrig bleibt eine saubere Farbspur pro Kanal, das Rohmaterial für alles Weitere.

Regions-Mittelwertspuren: tausende Hautpixel pro Region und Bild, mit Hintergrundkorrektur.

POS · plane-orthogonal-to-skin

Den Puls herausprojizieren

Rot, Grün und Blau tragen alle den Puls, aber eben auch Spiegelungen und Bewegung. Nimm einen einzelnen Kanal und du bekommst den Herzschlag mit Müll vermischt.

Die Lösung: keiner einzelnen Farbe trauen. Wir kippen das Signal auf eine Ebene, die am Hautton ausgerichtet ist (die POS-Projektion, kurz für plane-orthogonal-to-skin). Auf dieser Ebene hebt sich der Helligkeitsmüll von Licht und Bewegung weitgehend auf, und der Puls bleibt übrig. Das Schlaue daran: Die genaue Kippung stellt sich laufend aus dem Signal selbst ein und passt sich an, wenn sich dein Licht und deine Bewegung ändern.

Chrominanzsignale s₁, s₂ und ihre varianzadaptive Kombination s = s₁ + α·s₂.

Butterworth · filtfilt

Filtern, ohne die Zeit zu verbiegen

Hier lauert eine Falle. Ein normaler Filter putzt das Signal, schiebt aber jede Spitze leicht nach hinten. Und die Lage der Spitzen ist das Einzige, was wir nicht verschieben dürfen, denn die Herzratenvariabilität steckt in den Abständen zwischen den Schlägen.

Also filtern wir zweimal. Wir schicken einen Bandpass (er behält die Herzfrequenzen und wirft den Rest weg) vorwärts durch das Signal, dann nochmal rückwärts. Die beiden Durchläufe heben ihre Zeitverschiebung gegenseitig auf, und die Spitzen landen genau dort, wo dein Herz sie gesetzt hat. Dieser Vorwärts-rückwärts-Trick heißt Nullphasen-Filterung. Vorher ziehen wir die langsame Drift ab, damit ein allmählich heller werdender Raum nicht wie ein echter Trend aussieht.

Bilineares Pre-Warping setzt die Grenzfrequenz; Vorwärts-Rückwärts-Filterung liefert eine Nullphasen-Antwort doppelter Ordnung.

Welch · Whitening

Die Frequenz eines Herzschlags finden

Und jetzt: Wie hoch ist dein Puls wirklich? Ein paar Sekunden verrauschtes Signal können den echten Schlag unter Echos verstecken: Harmonische beim Doppelten, Geister beim Halben und ein Schleier aus Kamerarauschen.

Um ihn zu finden, schauen wir das Signal im Frequenzbereich an (welche Frequenzen am stärksten sind), mit Welchs Methode, die mehrere überlappende Fenster mittelt, damit uns eine verrauschte Stelle nicht täuscht. Wir glätten das Hintergrundrauschen der Kamera, prüfen doppelt, dass wir nicht auf einer Harmonischen oder einem Halb-Echo hängen, und schärfen die Gewinner-Spitze unter den Abstand der Frequenzstufen. Wir schubsen sanft Richtung biologisch sinnvoller Werte, blockieren aber nie hart.

Gemittelte Periodogramme, spektrales Whitening und parabolische Spitzenverfeinerung lokalisieren die kardiale Frequenz.

Hidden Markov · Viterbi

Ein Herzschlag ist ein Pfad, kein Punkt

Lies den Puls Bild für Bild, und er springt. Die lauteste Frequenz flackert zwischen ein paar Kandidaten hin und her, also sieht ein naiver Wert aus wie Rauschen.

Also lesen wir nicht mehr Bild für Bild, sondern die ganze Geschichte auf einmal. Wir behandeln die Rate als etwas, das sich glatt bewegt und gern driften darf, aber teuer für Sprünge bezahlt. Dann findet ein Algorithmus namens Viterbi den einen wahrscheinlichsten Pfad durch alle Bilder gleichzeitig (dieselbe Idee, die ein verrauschtes Handysignal dekodiert). Er nutzt eine kurze Verzögerung, um knapp vorauszuschauen, bevor er sich festlegt. Das Ergebnis ist ein Puls, der dir folgt, statt zu zucken.

Emission plus Gauß'sche Übergangsstrafe; Viterbi dekodiert den global optimalen Ratenpfad.

Spline · AGC · Template

Jeden einzelnen Schlag rekonstruieren

Der spannende Teil der HRV wird in Millisekunden gemessen. Das ist feiner als der Abstand zwischen zwei Kamerabildern, also sehen wir es roh aus der Webcam noch nicht.

Wir kommen über Überabtastung dahin. Zwischen die Bilder wird eine glatte Kurve gelegt (ein kubischer Spline), damit wir einen Schlag auf wenige Millisekunden genau timen können. Wir skalieren die Welle so, dass eine schwankende Belichtung nichts verzerrt, und finden jeden Schlag, indem wir ihn mit einem Durchschnittsschlag aus deiner eigenen Aufnahme abgleichen. Abstände, die komisch aussehen, werden markiert, Lücken bleiben ehrlich, und ein klar verpasster Schlag wird rekonstruiert, bevor wir das Timing ablesen. Erst dann messen wir die Abstände zwischen den Schlägen.

Kubische Spline-Überabtastung, z-Score-Verstärkungsregelung, Ensemble-Template-Erkennung und Ektopie-Verwerfung.

RMSSD · SDNN · Stress

Die Statistik der Zwischenräume

Dein Herz schlägt nie wie ein Metronom, und das ist gut so. Das winzige Schwanken in den Abständen zwischen den Schlägen ist dein Nervensystem bei der Arbeit, und genau das fängt die HRV ein.

Aus den bereinigten Schlag-zu-Schlag-Abständen rechnen wir die übliche HRV-Familie. RMSSD und ihr Partner SD1 stehen für die beruhigende, parasympathische Seite (Ruhe und Erholung). SDNN fasst die Gesamtschwankung zusammen. pNN50 zählt die größeren Sprünge, und ein Stressindex aus der russischen Raumfahrtmedizin (der Baevsky-Index) liest, wie starr dein Rhythmus ist. Wir stabilisieren jeden Wert über mehrere Teilfenster, damit ein verrauschter Scan dir sagt, dass er unsicher ist, statt dir eine selbstbewusst falsche Zahl zu geben.

Sukzessivdifferenz-, Streuungs-, geometrische und Poincaré-Deskriptoren der Intervallvariabilität.

APG · zweite Ableitung

Steifigkeit, geschrieben in die Pulsform

Steife Arterien ändern nicht, wie schnell dein Herz schlägt. Sie ändern die Form jeder Pulswelle, auf eine Art, die fürs Auge viel zu fein ist.

Um die Form zu sehen, nehmen wir die zweite Ableitung des Pulses (im Grunde seine Beschleunigung, die die Knicke in der Welle betont). Jeder Schlag wird so zu einer Reihe kleiner Landmarken-Höcker, und deren Größen verschieben sich, wenn Arterien steifer werden. Wir mitteln viele Schläge für einen sauberen Wert und ziehen daraus einen Gefäß-Alterungsindex, einen Reflexionsindex und die Breite des Pulses. Das sind relative Werte, keine klinische Steifigkeitszahl.

Fiduzialpunkte der zweiten Ableitung ergeben Alterungsindex, Reflexionsindex und Pulsbreiten-Deskriptoren.

Drei-Pfad-Fusion

Drei Wege, einen Atemzug zu hören

Auch deine Atmung versteckt sich im Puls, gleich auf drei leise Arten. Für sich allein ist jede davon wackelig.

Atmung lässt die Grundlinie langsam auf und ab driften, sie beschleunigt und bremst dein Herz (das ist die respiratorische Sinusarrhythmie, etwas ganz Gesundes), und sie verändert die Höhe jedes Schlags. Wir schätzen alle drei getrennt und melden eine Atemrate nur, wenn sie sich einig sind. Weil die Schläge zeitlich ungleichmäßig verteilt sind, nutzen wir ein Verfahren für unregelmäßige Daten (das Lomb-Scargle-Periodogramm) statt einer normalen Fourier-Transformation.

Basislinien-, Sinusarrhythmie- und Amplitudenpfad, fusioniert durch gewichteten Spektralkonsens.

Multi-Schätzer-Übereinstimmung

Wissen, wann man nicht antwortet

Jede dieser Methoden kann selbstbewusst und völlig daneben liegen. Deshalb darf keine einzelne Zahl allein für sich sprechen.

Jeder Wert, den du siehst, wurde gegengeprüft. Wir bestimmen den Puls auf vier Arten: aus dem Spektrum, aus den Schlagabständen, aus dem Viterbi-Track und aus zerlegten Teilfenstern. Eine Zahl geht nur raus, wenn die sich einig sind und sich der Wert beruhigt hat. Streiten sie, läuft der Scan weiter, vertraut den schwachen Quellen weniger oder antwortet einfach nicht. Zu wissen, wann man still bleibt, ist das Wichtigste, was die ganze Pipeline tut.

Eine Zahl wird nur veröffentlicht, wenn unabhängige Schätzer übereinstimmen und der Track konvergiert ist.

Symbole

C̄c(t): Regions-Mittelwert des Farbkanals c zur Zeit t
s, α: POS-Chrominanzsignal und sein varianzadaptives Gewicht
fs, fc: Abtastfrequenz und Filter-Grenzfrequenz
ωc: Pre-gewarpte digitale Grenzfrequenz (bilineare Transformation)
Hzp: Nullphasen-Antwort (Vorwärts-Rückwärts-Filter)
P̂(f): Welch-Schätzung der Leistungsspektraldichte
δ: Parabolischer Sub-Bin-Spitzenversatz
γ: Spektraler Whitening-Exponent (Wert zurückgehalten)
δt(j): Viterbi-Score des Ratenzustands j im Bild t
aij: Quadratische Übergangsstrafe zwischen Ratenzuständen
zi: Lokal z-skalierte (verstärkungsgeregelte) Probe
IBI: Inter-Beat-Intervall in Millisekunden
RMSSD: Wurzel des mittleren Quadrats sukzessiver IBI-Differenzen
SD1: Kurzfristige Poincaré-Streuung, RMSSD/√2
SI: Geometrischer Baevsky-Stressindex
x″(t): Beschleunigungs-Plethysmogramm (APG), 2. Ableitung des Pulses
AGI / RI: Vaskulärer Alterungsindex / Reflexionsindex
μ, σ: Lokaler Mittelwert und Standardabweichung
τ, ε: Übereinstimmungs-Toleranz und Konvergenz-Schranke

Ausgewählte Referenzen

Eine ehrliche Anmerkung. Diese Seite zeigt dir, wie wir arbeiten, sie diagnostiziert dich nicht. Das Tool ist für Neugier und Bildung da, kein Medizinprodukt, und jede Zahl, die es aus deiner Kamera liest, ist eine Schätzung, keine Diagnose.