Was ist Markdown?

Markdown ist eine leichtgewichtige Auszeichnungssprache, die einfache Symbole zur Textformatierung verwendet. Zeichen wie # für Überschriften, ** für Fettschrift, * für Kursivschrift sowie - oder * für Listen ermöglichen das Erstellen strukturierter Dokumente ohne einen visuellen Editor. Es wird häufig in README-Dateien, Dokumentationen, Notiz-Apps, Blogs und Entwicklerplattformen wie GitHub verwendet.

Obwohl Markdown in seiner Rohform leicht lesbar ist, gibt es Situationen, in denen man den reinen Textinhalt ohne Formatierungssyntax benötigt. Markdown manuell zu bereinigen ist mühsam, besonders bei komplexen Dokumenten mit verschachtelten Listen, Blockzitaten, Tabellen und Inline-Code.

Beschreibung des Tools

Dieses Tool konvertiert Markdown in sauberen Klartext, indem es die Formatierungssyntax entfernt und dabei die strukturellen Elemente des Dokuments beibehält. Im Gegensatz zu einem einfachen „Alle Sonderzeichen entfernen"-Ansatz werden Listenmarkierungen (-, *, +), Nummern geordneter Listen, Blockzitat-Indikatoren (>), horizontale Trennlinien (---) und Tabellenstrukturen intelligent erhalten. Das Ergebnis ist lesbarer, gut strukturierter Klartext, der die Organisation des Originaldokuments beibehält – ohne jegliche Markdown-spezifische Syntax.

Beispiele

Eingabe (Markdown):

# Project Overview

This is a **bold** statement with *italic* emphasis and a [link](https://example.com).

- First item
- Second item
- Third item

> Important note with **emphasis**

1. Step one
2. Step two

Ausgabe (Klartext):

Project Overview

This is a bold statement with italic emphasis and a link.

- First item
- Second item
- Third item

> Important note with emphasis

1. Step one
2. Step two

Funktionen

  • Entfernt Inline-Formatierung — Entfernt Fettschrift, Kursivschrift, Durchstreichungen, Inline-Code-Backticks sowie Link- und Bildsyntax, behält jedoch den sichtbaren Text bei
  • Erhält Listenmarkierungen — Behält -, *, + für ungeordnete Listen sowie die Nummerierung geordneter Listen bei
  • Behält Blockzitate — Erhält >-Präfixe, sodass zitierte Abschnitte visuell erkennbar bleiben
  • Verarbeitet Tabellen — Konvertiert Markdown-Tabellen in pipe-getrennte Klartextzeilen
  • Entfernt HTML-Tags — Jegliches in Markdown eingebettetes Inline-HTML wird aus der Ausgabe entfernt

Anwendungsfälle

  • Inhalte für E-Mails kopieren — Sauberen Text aus Markdown-Dokumenten extrahieren, um ihn in E-Mail-Clients einzufügen, die kein Markdown-Rendering unterstützen
  • Text für nicht-technische Zielgruppen aufbereiten — Formatierungssyntax entfernen, bevor Inhalte mit Personen geteilt werden, die mit Markdown nicht vertraut sind
  • Datenextraktion — Lesbaren Text aus Markdown-basierter Dokumentation oder README-Dateien für Indizierung, Suche oder Weiterverarbeitung extrahieren

Funktionsweise

Das Tool analysiert die Markdown-Eingabe mithilfe eines standardkonformen Markdown-Parsers in einen abstrakten Syntaxbaum (AST). Anschließend durchläuft es jeden Knoten im Baum – Überschriften, Absätze, Listen, Blockzitate, Code-Blöcke, Tabellen und Inline-Elemente – und rekonstruiert den Textinhalt ohne Formatierungsmarkierungen. Inline-Elemente wie Fettschrift, Kursivschrift, Links und Bilder werden auf ihren sichtbaren Text reduziert. Strukturelle Markierungen wie Listenpunkte, nummerierte Präfixe und Blockzitat-Indikatoren werden zur Wahrung der Lesbarkeit beibehalten.

Was wird entfernt bzw. beibehalten

Entfernt Beibehalten
# Überschriften-Marker Überschriftentext
**fett** / *kursiv* Fett-/Kursivtext
[link](url)-Syntax Linktext
`inline code` Code-Inhalt
Code-Fence-Marker Inhalt von Code-Blöcken
![image](url)-Syntax Alt-Text
HTML-Tags
Listenmarkierungen (- * +)
Nummern geordneter Listen
Blockzitat->-Marker
Horizontale Trennlinien ---
Tabellenstruktur