Reguläre Ausdrücke 11: Der senkrechte Strich

Es ist soweit. Die letzte Regel dieser Artikel-Serie über reguläre Ausdrücke ist an der Reihe. In dieser letzten Regel soll die ODER-Verknüpfung besprochen werden, welche auch sehr nützlich ist.

Regel 11
Der senkrechte Strich (|) wird als ODER-Operator zwischen zwei Ausdrücke gestellt.

Jeder weiß, wie wichtig ein ODER-Operator in jeder Sprache ist – egal ob Programmier- oder Scriptsprache. Damit darf solch eine Verknüpfung natürlich auch in regulären Ausdrücken nicht fehlen. Das Prinzip ist sehr einfach. Der senkrechte Strich wird zwischen zwei reguläre Ausdrücke gestellt und „matcht“ somit entweder den einen oder den anderen.

Weiterlesen …

Reguläre Ausdrücke 10: Klammern

Die vorletzte Regel und immer noch mittendrin. Heute geht es um eines der wichtigsten Konzepte regulärer Ausdrücke: Gruppierungen. Man kann mehrere Zeichen in einen Ausdruck verwandeln. Das ist nichts neues. Mit * konnte man das auch. Jedoch ist es auch möglich reguläre Ausdrücke zu gruppieren und auf diese weitere Operatoren anzuwenden. Dieser Artikel zeigt wie’s geht.

Weiterlesen …

Reguläre Ausdrücke 9: Zeilenanfang und -ende

Die bis jetzt vorgestellten Regeln sind alle schön und gut, aber es fehlt immer noch etwas Salz an der Suppe. Was ist z.B. wenn ich Ausdrücke nicht irgendwo suche, sondern an einer bestimmten Position – z.B. am Zeilenanfang oder am Zeilenende. Natürlich gibt es auch dafür Metazeichen in der Welt der regulären Ausdrücke. Die zwei Zeichen, welche Zeilenanfang und -ende markieren, sollen heute vorgestellt werden.

Weiterlesen …

Reguläre Ausdrücke 8: Zeichenklassen

Heute geht es darum eigene Zeichenklassen in regulären Ausdrücken zu definieren und zu benutzen. Dies klingt schwieriger als es eigentlich ist; trotzdem ist Regel 8 wohl eine der wichtigsten und umfangreichsten der 11 Regeln, die in dieser Artikel-Serie vorgestellt werden. Wer sich also bis jetzt eher gelangweilt hat, kommt wohl gleich auf seine Kosten. Regel 8 wurde in fünf Teilregeln gegliedert. Das scheint etwas viel zu sein, jedoch gehören die Regeln logisch zusammen (also zu den Zeichenklassen).

Weiterlesen …

Reguläre Ausdrücke 7: Geschweifte Klammern

In den bisherigen Artikeln haben wir schon einiges über reguläre Ausdrücke gelernt. Wir können jetzt schon beliebige Zeichen suchen (Zeichen-Escaping) und die Anzahl der Vorkommnisse beschränken (wie in den letzten vier Artikeln gezeigt worden ist). Was uns jedoch bei der Mengenangabe noch fehlt, ist eine genauere Beschränkung. Dazu heute mehr.

Weiterlesen …

Reguläre Ausdrücke 6: Das Pluszeichen

Regel Nummer 6. Nach dieser Regel sind bereits mehr als die Hälfte der 11 Regeln behandelt worden und ihr habt es fast hinter euch. Klingt etwas pessimistisch aufmunternd. Ist manchmal aber auch nötig bei regulären Ausdrücken. Denn Regeln 3 bis 6 ähneln sich doch sehr. Deshalb lohnt sich weiterlesen. Heute gibt es eine Einführung in das Pluszeichen und eine Übersicht der bis jetzt wichtigsten Zeichen.

Weiterlesen …

Reguläre Ausdrücke 5: Das Sternchen

In dem fünften Artikel dieser Reihe soll ein allseits bekannter Quantor erklärt werden. Auch Benutzer, die nie von regulären Ausdrücken gehört haben, kennen *. Obwohl dieser Quantor sehr bekannt ist, gehört er zu den regulären Ausdrücken und soll also hier erklärt werden.

Als erstes, wie immer, die Regel:

Regel 5
Der vor dem Quantor stehende Ausdruck darf beliebig oft vorkommen. Das heißt, dass er nullmal, einmal oder mehrmals auftauchen darf.

Weiterlesen …

Reguläre Ausdrücke 4: Das Fragezeichen

Es geht weiter mit regulären Ausdrücken. In diesem Artikel soll ein neues Zeichen mit spezieller Bedeutung erklärt werden: das Fragezeichen. Dabei handelt es sich, wie in den anderen (geschriebenen und noch kommenden) Artikeln um kein unverständliches Prinzip. Im Gegenteil: Das Fragezeichen ist schnell verstanden. Jedoch sind reguläre Ausdrücke, also alle Zeichen kombiniert, so gewaltig, dass eine einfache Einführung von Nöten ist um die Basis aller Ausdrücke zu verstehen. Deshalb also kleine Schritte, dafür am Ende aber mit Erfolg. Nun aber genug des Smalltalk und auf in den Kampf.

Weiterlesen …

Reguläre Ausdrücke 3: Der Punkt

In diesem Artikel geht es richtig los mit den regulären Ausdrücken. Nach „normalen“ Zeichen und dem Zeichen-Escaping letzten Dienstag, geht es heute um den Punkt. Nachdem ihr diesen Artikel durchgelesen habt, werdet ihr in der Lage sein einfache und doch praktische Ausdrücke zu erstellen. Weiterlesen lohnt sich also wie immer.

Weiterlesen …

Reguläre Ausdrücke 1: Einführung & normale Zeichen

Die Unix-Tools, die bis jetzt beschrieben worden sind, arbeiten zum größten Teil ohne reguläre Ausdrücke (einige implementieren auch die Möglichkeit). Es gibt jedoch viele Tools, die ohne Kenntnisse über reguläre Ausdrücke nur sehr eingeschränkt funktionieren. Einige solcher Tools sind grep, sed und die üblichen Editoren wie vi/vim und emacs oder die Scriptsprache perl. Der Plan ist also, die Grundlagen regulärer Ausdrücke zu beschreiben, damit die richtige Macht der Shell und der langen Kommandos erkennbar wird.

Weiterlesen …

Unix-Tools 8: info

Er gilt als Inbegriff der Unix-Philosophie und wird von vielen erfahrenen Benutzer jedem Anfänger als ultimativer erster Konsolen-Befehl gegeben. Die Rede ist von man man. man-Seiten (dt. Manualseiten) sind Bedienungsanleitungen für Programme. In diesen werden alle Parameter, Bugs und Copyright-Informationen aufgelistet. Es gibt jedoch noch eine mächtigere, aber nicht so bekannte Variante: info. Diese soll heute beschrieben werden.

Weiterlesen …

Unix-Tools 7: strings

UNIX/Linux ist bei Hobbyadministratoren und Informatikstudenten sehr beliebt. Kein Wunder, stellt es doch eine komplette Server- und Entwicklungsumgebung zur Verfügung. Das heutige Tool strings richtet sich mehr an die Programmierer als an die Administratoren. Wie der Name schon sagt, handelt es sich auch hierbei um ein String verarbeitendes Programm. Strings sind nicht mehr als zusammengesetzte Zeichen – also Zeichenketten (jeder Programmierer wird wissen, wovon ich rede).

Weiterlesen …

Unix-Tools 6: join & paste

UNIX/Linux ist hauptsächlich ein sehr beliebtes Server-Betriebssystem. Viele Datenbank- und Webserver laufen auf diesem stabilen System. Wer viel mit Datenbankservern wie z. B. von Oracle oder MySQL (gehört ja letztendlich der gleichen Firma) arbeitet, sollte weiterlesen. Denn relationsalgebraische Operationen lassen sich auch auf normale Textdateien anwenden, durchaus sinnvoll.

Weiterlesen …

Unix-Tools 5: fmt

fmt ist die Unix-Abkürzung für format (dt. formatieren). Und genau darum geht es auch in diesem Beitrag. Unix startete seine Karriere als Internet-Betriebssystem noch lang bevor es grafische Benutzerschnittstellen wie KDE, GNOME & Co. gab. Aber auch damals wurden Berichte geschrieben, E-Mails verschickt und Diagramme erstellt. Wenn es darum geht, einen ASCII-Text via Konsole zu formatieren, kann fmt recht nützlich werden.

Weiterlesen …