Benutzer:Duesentrieb/csv2wp – Wikipedia

Dieser Abschnitt beschreibt die verschiedenen Felder und Einstellungen von csv2wp. Die Unterüberschriften entsprechen den Überschriften auf der csv2wp-seite. Um die Bedeutung der einzelnen Einstellungen zu verstehen ist es hinfreich den Artikel über CSV-Dateien zu lesen.

In dieses Feld werden die zu konvertierenden CSV-Daten eingetragen. Das kann manuell (bzw. per Copy&Paste) geschehen, oder indem man eine Datei wie im folgenden beschrieben hochlädt.

Dieses Feld dient dem heraufladen einer CSV-Datei, so dass die Daten aus der Datei in das Feld CSV-Daten eingefügt werden. Zum Auswählen der Datei kann man den Knopf rechts neben dem Feld benutzen (Je nach Browser mit "Datei Auswählen", "Browse" oder Ähnlichem beschriftet).

Das zweite Feld dient der Auswahl des Zeichensatzes für die Datei: Wird dieser nicht richtig angegeben, so werden Sonderzeichen (wie z.B. Umlaute) nicht richtig übertragen. In Deutschland sind meistens die folgenden Zeichensätze eingestellt: Für Windows CP-1250, für Mac MacRoman, für Linux ISO-8859-1.

Nach auswählen von Datei und Zeichensatz kann die Datei mit dem Knopf Upload ganz rechts heraufgeladen werden. Die Daten werden dann in das Feld CSV Data eingefügt. Sollten dort Umlaute nicht richtig angezeigt werden, so wurde vermutlich der falsche Zeichensatz ausgewählt und die Datei muss erneut heraufgeladen werden.

Diese Einstellung bestimmt, welches Zeichen zur Trennung der einzelnen Datenfelder verwendet wurde:

Comma (",") (voreinstellung) - Das ist das traditionelle und am weitesten verbeitete Trennzeichen.
Semicolon (";")
Pipe ("|")
Colon (":")
Octothorpe ("#")
TAB - das Tabulator-Zeichen, ebenfalls weit verbreitet
Other - diese Option bietet ein zusätzliches Eingabefeld, in dem ein anderes Trennzeichen angegeben werden kann.

Diese Einstellung bestimmt, welche Zeichen zum Zusammenfassen von Feldern benutzt werden, die Sonderzeichen enthalten. Zwischen zwei Quotation Characters ist die besondere Bedeutung der Separator Characters und sogar der Zeilenumbrüche aufgehoben.

Doubl-Quote ('"') (Voreinstellung) - Doppelte Anführungszeichen sind das traditionelle und am weitesten verbreitete Quotation Character.
Quotes ('"' and ''') - Erlaubt auch einfache Anführungszeichen. Ein Block, der mit einfachen Anführungszeichen begonnen wurde, muss auch mit einem einfachen Anführungszeichen enden - die Bedeutung der doppelten Anführungszeichen ist innerhalb des Blockes aufgehoben. Für Blöcke mit doppelten Anführungszeichen gilt umgekehrt das gleiche.
Other: - diese Option bietet ein zusätzliches Eingabefeld, in dem ein oder mehrere andere Quotation Characters angegeben werden können.
None (use Escape-Character only) - Benutze keine Quotation Characters - Sonderzeichen in Feldern müssen dann mit einem Escape Character geschützt werden.

Es folgt noch eine zusätzliche, von den anderen unabhängige Option:

No traditional escaping by doubling quotes. - diese Option steuert, wie Quotation Characters selbst ein einem gequoteten Block dargestellt werden. Traditionell geschieht dies, indem das Anführungszeichen verdoppelt wird - wird aber diese Option aktiviert, so muss das Anführungszeichen durch das Escape Character geschützt werden.

Backslash ("\") - wird in vielen Programmiersprachen als Escape verwendet.
Questionmark ("?")
Carat ("^") - wird auf manchen Terminals als Escape verwendet.
Octothorpe ("#")
Other: - diese Option bietet ein zusätzliches Eingabefeld, in dem ein anderes Escape Character angegeben werden kann.
None (use Quoting only) (voreinstellung) - Benutze kein Escape Character - sonderzeichen werden immer über Blöcke zwischen Quotation Characters geschützt, die Anführungszeichen selbst werden durch Doppelung dargestellt. Das ist die traditionelle vorgehensweise für CSV.

Diese Einstellungen bestimmt, wie Daten, die einen Zeilenumbruch enthalten, gehandhabt werden. Die Zeilenumbrüche einfach zu übernehmen mach wenig Sinn, da in der Wiki-Syntax Zeilenumbrüche eine spezielle Bedeutung haben, und in HTML gar keine.

Replace with space (Voreinstellung) - Ersetze Zeilenumbrüche mit Leerzeichen. Dadurch werden sie praktisch ignoriert.
Replace with <br> - Ersetze Zeilenumbrüche mit <br>-tags. Dadurch wird ein Zeilenumbruch (aber kein Absatz) an dieser Stelle erzwungen.
Replace with - diese Option bietet ein zusätzliches Eingabefeld, in dem ein anderes Zeichen angegeben werden kann, mit dem Zeilenumbrüche ersetzt werden.

Diese Einstellung bestimmt, wie Zeichen, die eine spezielle Bedeutung haben, behandelt werden.

Do not convert (table contains code) - keine Konvertierung. Das ist dann sinnvoll, wenn die Originaltabelle bereits Markup enthält, also Formatierungszeichen für Wiki- oder HTML-Syntax.
Protect HTML-Special characters (but not quotes) (voreinstellung) - schütze Zeichen, die in HTML eine spezielle Bedeutung haben so, dass sie als normale Zeichen angezeigt werden.
Protect XML-Special characters (including all quotes) - schütze Zeichen, die in XML (bzw. in XHTML) eine spezielle Bedeutung haben so, dass sie als normale Zeichen angezeigt werden. Das ist ähnlich zu der vorherigen Option, aber etwas strenger.
Protect WikiMedia constructs and HTML-Markup - schütze Zeichen, die in HTML oder in Wiki-Syntax eine spezielle Bedeutung haben so, dass sie als normale Zeichen angezeigt werden. Das bezieht sich auf Konstrukte wie [[...]], {{...}}, ''...'', etc.

Hier kann man HTML-Attribute festlegen, die auf die Ausgabe angewendet werden sollen. Das ist besonders sinnvoll für das style="xxx" Attribut, mit dem sich das Aussehen der Tabelle definieren lässt. Ein anderes Beispiel wäre align="right" im for each cell Feld: das richtet alle Zellen rechtsbündig aus.

for the table - die hier angegebenen Attribute werden auf die Tabelle als solches angewendet.
for each cell - die hier angegebenen Attribute werden auf jede Zelle einzeln angewendet.

Gibt an, in welchem Zeichensatz die Ausgabe erfolgen soll. Für die deutsche Wikipedia ist UTF-8 korrekt, das ist die Voreinstellung. Übrigens: Wenn das Resultat per Copy&paste verwendet wird, mach diese Angabe eigentlich keinen Unterschied - der Browser ist für dann die Konvertierung zuständig.

Wenn diese Option gewählt ist wird der Browser gezwungen, die Daten als Binärdatei zu empfangen - die kann dann nur direkt heruntergeladen werden, der Text wird vom Browser nicht angezeigt oder konvertiert. Das ist nützlich, wenn man die Daten in einem bestimmten Zeichensatz speichern will und der Browser dabei Probleme macht. Ausserdem erspart es den Schritt "Speichern unter..." (siehe unten).

Konvertiert den Inhalt des CSV Data Feldes entsprechend den Einstellungen in das MediaWiki-Format für Tabellen (Pipe-Syntax). Das Resultat wird entweder als Text im Browserfenster angezeigt, oder, wenn "as binary download" aktiviert war, zum herunterladen angeboten. Wenn man sich die Daten anzeigen lässt, kann man sie mit Copy&paste weiter verwenden, oder indem man die Seite in eine Datei speichert (je nach Browser und Sprache mit "Save Page", "Save as", "Seite Speichern", "Speichern unter" oder Ähnlichem).

Konvertiert den Inhalt des CSV Data Feldes entsprechend der Einstellungen in eine HTML-Tabelle. Das Resultat wird entweder als HTML-Quelltext im Browserfenster angezeigt, oder, wenn "as binary download" aktiviert war, zum Herunterladen angeboten. Wenn man sich die Daten anzeigen lässt, kann man sie mit Copy&paste weiter verwenden, oder indem man die Seite in eine Datei speichert (je nach Browser und Sprache mit "Save Page", "Save as", "Seite Speichern", "Speichern unter" oder Ähnlichem).

Wenn diese Option aktiviert ist (und "as binary download" nicht), dann wird die erzeugte HTML-Tabelle nicht als Quellcode, sondern als hübsch formatierte Tabelle angezeigt. Das ist ganz nützlich, um mit verschiedenen Formatierungen zu spielen. Man kann die Tabelle auch direkt aus der Vorschau speichern (je nach Browser und Sprache mit "Save Page", "Save as", "Seite Speichern", "Speichern unter" oder Ähnlichem).