Ein Anfänger-Tutorial zu regulären Ausdrücken

Reguläre Ausdrücke, oft als Regex oder Regexp abgekürzt, sind Zeichenfolgen, die ein Suchmuster definieren. Sie werden häufig zum Abgleichen von Zeichenfolgen, zum Ersetzen von Teilzeichenfolgen und zum Extrahieren von Informationen aus Texten verwendet.

Warum reguläre Ausdrücke lernen?

Das Erlernen regulärer Ausdrücke kann Ihre Fähigkeit, Textdaten zu verarbeiten, erheblich verbessern. Mit Regex können Sie:

  • Suchen Sie im Text nach bestimmten Mustern.
  • Überprüfen Sie eingegebene Daten wie E-Mail-Adressen und Telefonnummern.
  • Extrahieren Sie bestimmte Teile eines Textes, etwa Daten und URLs.
  • Ersetzen Sie Teilzeichenfolgen im Text anhand von Mustern.

Grundlegende Komponenten regulärer Ausdrücke

Regex besteht aus Literalzeichen und Metazeichen. Hier sind einige der grundlegenden Komponenten:

  • Literale Zeichen: Zeichen, die mit sich selbst übereinstimmen. Beispielsweise entspricht a "a".
  • Metazeichen: Sonderzeichen mit bestimmten Bedeutungen, wie ., *, + und ?.

Häufige Metazeichen und ihre Bedeutungen

Das Verständnis von Metazeichen ist der Schlüssel zur Beherrschung von regulären Ausdrücken. Hier sind einige der am häufigsten verwendeten:

  • . - Stimmt mit jedem einzelnen Zeichen außer dem Zeilenumbruch überein.
  • * – Stimmt mit 0 oder mehr Wiederholungen des vorhergehenden Elements überein.
  • + – Stimmt mit einer oder mehreren Wiederholungen des vorhergehenden Elements überein.
  • ? – Stimmt mit 0 oder 1 Wiederholung des vorhergehenden Elements überein.
  • [] – Stimmt mit jedem der Zeichen in den Klammern überein.
  • {} – Gibt eine bestimmte Anzahl von Vorkommen des vorhergehenden Elements an.
  • () – Gruppiert mehrere Token und erstellt Erfassungsgruppen.
  • | – Fungiert als ODER-Operator.

Grundlegende Regex-Muster mit Beispielen

Sehen wir uns einige grundlegende Regex-Muster und ihre Funktionsweise an:

cat

Entspricht exakt der Zeichenfolge "cat".

.at

Stimmt mit jeder Zeichenfolge überein, die aus einem einzelnen Zeichen gefolgt von "at" besteht, z. B. "cat", "bat", "hat".

\d{3}

Stimmt mit genau drei Ziffern überein, z. B. "123", "456", "789".

[a-z]

Passt zu jedem Kleinbuchstaben von "a" bis "z".

(dog|cat)

Stimmt entweder mit "dog" oder "cat" überein.

Verwenden von Regex in Programmiersprachen

Reguläre Ausdrücke werden in vielen Programmiersprachen unterstützt. Hier sind Beispiele für die Verwendung von Regex in Python und JavaScript:

Python-Beispiel

import re

# Search for 'dog' in a string
pattern = r'dog'
text = 'The dog barked loudly.'
match = re.search(pattern, text)

if match:
    print('Match found:', match.group())
else:
    print('No match found')

JavaScript-Beispiel

// Search for 'dog' in a string
const pattern = /dog/;
const text = 'The dog barked loudly.';
const match = text.match(pattern);

if (match) {
    console.log('Match found:', match[0]);
} else {
    console.log('No match found');
}

Abschluss

Reguläre Ausdrücke sind ein leistungsstarkes Werkzeug für jeden, der mit Textverarbeitung zu tun hat. Durch das Verstehen und Üben der grundlegenden Komponenten und Muster können Sie Ihre Fähigkeit, Text in Ihren Programmierprojekten zu verarbeiten und zu manipulieren, erheblich verbessern. Experimentieren Sie mit verschiedenen Mustern und vertiefen Sie Ihr Wissen, um das volle Potenzial von Regex auszuschöpfen.