Automatische Archivierung
Auf dieser Seite werden Abschnitte
automatisch archiviert
, die seit 3 Tagen mit dem Baustein
{{
Erledigt|
1=
}}
versehen sind
oder deren jüngster Beitrag 180 Tage alt ist. Die Archivübersicht befindet sich unter
Archiv
Abkürzung:
WT:TS
Willkommen in der Teestube!
Diese Seite dient dazu, die
Arbeit
besser zu
koordinieren
, allgemein interessierende
Absprachen
zu treffen, auf
Änderungen
im
Wiktionary
hinzuweisen
oder
Ideen einzubringen
. Anders als das
Meinungsbild
werden hier Vorschläge zunächst zur Diskussion gestellt, eine Abstimmung sollte hingegen auf der Meinungsbild-Seite geschehen.
Mit
diesem Link
kannst du einen neuen Abschnitt erstellen. Bitte unterschreibe deine Beiträge immer mit ~~~~.
An dieser Stelle kannst du dich über
Neuerungen im Wiktionary
informieren.
Teestube und Archiv durchsuchen
Jedes Jahr, in der Regel von Oktober bis Dezember, suchen mehrere Komitees der Wikimedia-Bewegung nach neuen Freiwilligen.
Erfahre mehr über die Komitees auf den jeweiligen Seiten im Meta-Wiki:
Die Bewerbungsphase für die Komitees startet am 30. Oktober 2025. Sie endet für das Affiliations-Komitee am 11. Dezember 2025 und für die Ombudskommission sowie das Fallprüfungskomitee am 11. Dezember 2025. Erfahre, wie du dich bewirbst, indem du
die Ernennungsseite im Meta-Wiki besuchst
. Bitte melde dich mit etwaigen Fragen auf der Diskussionsseite oder über E-Mail an
cst@wikimedia.org
Für das Komitee-Unterstützungsteam
MKaur (WMF)
15:13, 30. Okt. 2025 (MEZ)
Beantworten
Ausgangslage
Die Community des Wiktionary hat sich im Jahre 2011 für eine
Aufteilung der Übersetzungsboxen nach Wortbedeutung
ausgesprochen. Da eine derartige Umstellung nicht ausschließlich durch manuelle Änderungen bewältigbar ist, hat sich
Formatierer
seit Ende 2022 bereit gefunden, seinen
Instance of Bot
für die erforderlichen Umstellungen einzusetzen. Dies umfasste
die Neugestaltung der Überschriftszeile in der Form
|n|G=
Glossentext
|Ü-Liste=
, wobei n für die Nummer der Bedeutung steht,
die Entfernung der Bedeutungsnummer vor den Übersetzungen und
bei mehreren Bedeutungen die Aufteilung und Eintragung der Übersetzungen auf mehrere Übersetzungstabellen.
Die automatisierte Eintragung der Glossentexte aus der zugehörigen Bedeutung erfolgte dann nicht, wenn die Textierung der Bedeutung eine gewisse Maximallänge überschritten hat. Ebenso unterblieb eine Aufteilung auf mehrere Tabellen, wenn Unstimmigkeiten im Aufbau der Bedeutungen eine Automatisierung nicht zulassen.
Da das Erfordernis der Glossenbildung angezweifelt wurde, fand im
Dezember 2024 ein weiteres Meinungsbild
statt, in dem diverse Klarstellungen zur Problematik der Übersetzungen beschlossen wurden.
Um einen Überblick der ausstehenden Umstellungsaufwendungen zu gewinnen und eine gezielte Abarbeitung zu ermöglichen, wurden die
Kategorie:Wartung fehlende Glosse in Ü-Tabelle
(derzeit
10.725
Einträge) und die
Kategorie:Wartung fehlende Bedeutung in Ü-Tabelle
(derzeit
292
Einträge) bei fehlender Nummerierung erstellt. Zudem wurde im
Meinungsbild aus Dezember 2024
durch arithmetische Mittelung eine maximale Länge der Glossen mit 103 Zeichen beschlossen und in
Kategorie:Wartung überlange Glosse in Ü-Tabelle
(derzeit
9.381
Einträge) dokumentiert.
Problemstellung
Obwohl seit 15. März 2024 die Glossen bislang in mehr als 36.000 Einträgen manuell und automatisiert ergänzt wurden, sind noch immer rund zehn Prozent der Einträge mit Übersetzungen mit zumindest einer fehlenden Glosse. Nun, das mag den einen oder anderen nicht weiter stören, denn das eigene Hauptinteresse liegt in der Neuanlage von Einträgen oder bestimmten Vorlieben, spezielle Informationen in den Lemmas einzutragen oder zu verbessern. Und da gibt es sowieso jemanden, der sich um diese Tätigkeiten vermehrt annimmt. Das ist meinerseits keine Kritik, sondern eine bedauernde Feststellung, da das Wiktionary ein Freiwilligenprojekt ist. Dennoch kann diese Aufgabe im Wesentlichen nicht auf eine Person beschränkt bleiben: Abgesehen von den Gründen der Fairness, kann keine weitere Expertise entstehen und der Fertigstellungszeitpunkt der Umstellung rückt unter Umständen auf einen Tag, den wir derzeit Aktiven nicht mehr beeinflussen werden.
Lösungsvarianten
Für die Abarbeitung der
Kategorie:Wartung fehlende Glosse in Ü-Tabelle
schlage ich folgende Alternativen vor:
Variante 1
BOT-Betreiber
Formatierer
wäre zu bitten, die fehlenden Glossen aus den Texten der Bedeutungen automatisiert zu bilden:
vollständig, unter Inkaufnahme, dass die Wartungskategorie der überlangen Glossen anwächst
vollständig, sofern die maximale Länge der Glosse nicht überschritten wird
teilweise, indem der Kontext weggelassen wird, wobei überlange Glossen toleriert werden
teilweise, indem der Kontext weggelassen wird, sofern die maximale Länge der Glosse nicht überschritten wird
Die Varianten 1.2 bis 1.4 dienen nur der Reduzierung der Anzahl der Einträge in dieser Wartungskategorie und erfordern im Anschluss weitere Lösungsansätze. Zusatzbemerkung: Die Variante 1.3 würde zwar eine vollständige Abarbeitung der Wartungskategorie ermöglichen, bedürfte jedoch einer sukzessiven Überprüfung, welche Kontextangaben dennoch ergänzt werden müssten. Eine Alternative bestünde in einer Liste von Begriffen, die jedenfalls in die Glosse automatisch zu übernehmen wären. Die Machbarkeit dieser Varianten müsste jedoch vom BOT-Betreiber
Formatierer
beurteilt werden.
Variante 2
Die Kategorie wird gedanklich in Blöcke von jeweils 200 Einträgen unterteilt, für deren Abarbeitung sich angemeldete Benutzer ab dem Status „Passiver Sichter“ in dieser
Liste
vormerken lassen können. Mit der dort eingetragenen Benutzerkennung verpflichtet man sich zur Eintragung der fehlenden Glossen für die vermerkten Einträge, wobei
kein Erledigungstermin
vorgegeben wird.
Diskussion
Theoretisch sind auch andere Varianten der Abarbeitung denkbar, etwa eine Blockbildung nach Sprachen. Eine Abstimmung erfolgt daher erst nach eingelangten Stellungnahmen.
Grüße in die Runde,
Alexander Gamauf
Diskussion
00:33, 15. Nov. 2025 (MEZ)
Beantworten
Bei dem Meinungsbild im Dezember 2024 habe ich nicht teilgenommen, da ich keine Stimmberechtigung hatte.
Alles in allem denke ich, dass Glossen relativ wenig Nutzen bringen. Sie sind nur bei langen Einträgen mit mehreren Bedeutungen wirklich sinnvoll; bei Einträgen mit nur einer Bedeutung erschließt sich mir ihr Zweck nicht. Außerdem verstehe ich überhaupt nicht den Sinn, sie manuell zu erstellen, wenn es möglich wäre, die entsprechende Definition aus dem Bedeutungsabschnitt automatisch anzuzeigen.
Kurz gesagt: Ich wäre dafür, dass Glossen freiwillig bleiben und im Falle ihrer Nichtangabe automatisch die Definition angezeigt wird. Damit entfiele völlig die Notwendigkeit, Glossen manuell für zehntausende Einträge zu ergänzen.--
Parlaval
Diskussion
01:11, 15. Nov. 2025 (MEZ)
Beantworten
Bei meiner täglichen Arbeit ergänze ich fehlende Glossen meist nebenbei. Das größte Problem sind aber m. E. Übersetzungstabellen, die nicht aufgeteilt wurden, weil die Nummerierung durch a, b usw. nicht passt. Und diese manuelle Umstellung sehr zeitaufwendig, sodass ich sie meist auslasse. Wenn es dort einen Vorschlag zur (Halb-)Automatisierung gäbe, würde ich mich freuen. Schöne Grüße --
Yoursmile
Diskussion
07:07, 15. Nov. 2025 (MEZ)
Beantworten
Oder im Einzelfall mit KI umstellen? Schöne Grüße --
Yoursmile
Diskussion
07:28, 15. Nov. 2025 (MEZ)
Beantworten
Hallo
Yoursmile
, ich gebe dir recht, dass die exzessive Nutzung von Buchstabenunterteilungen in den Bedeutungen ein Horror ist. Wenn ich auf Derartiges stoße, muss ich ausgeruht sein, um dies auf Gleich zu bringen. Ich könnte mir vorstellen, dass wir eine eigene Liste anlegen, in der solche Problemlemmata eingetragen werden, die als besondere Herausforderung abgearbeitet werden kann. Ich bin auch dafür, derartige Definitionen bei Neuanlagen zu verhindern.
Meine Erfahrung mit KI zur Kürzung von überbordenden Bedeutungen ist zwiespältig: manchmal ist sie perfekt, doch kann es passieren, dass als Ergebnis die Bezeichnung des Lemmas herauskommt.
Lieben Gruß,
Alexander Gamauf
Diskussion
11:47, 15. Nov. 2025 (MEZ)
Beantworten
Für mich ist oft die Schwierigkeit von Glossen bei Begriffen mit ähnlichen, aber minutiösen Unterschieden, deren Wörteranzahl bei der Glosse deutlich überschreiten es so zu komprimieren, dass keine Bedeutungsfälschung entsteht oder daraus die Minutiösitätsunterscheidung bei ähnlichen Bedeutungen verloren geht. Bei solchen Glossen lasse ich dann die Finger, diese nebenbei zu ergänzen. --
liewe Grießle, RaveDog
Diskussion
13:24, 15. Nov. 2025 (MEZ)
Beantworten
Hallo @
Parlaval
: Du hättest dich im Dezember 2024 sehr wohl an der Diskussion beteiligen können. Übrigens wurden die Abstimmungspunkte mit großer Mehrheit angenommen. Das zeigt, dass die Community sehr wohl vom Zweck des beschlossenen Übersetzungssystems und den darin festgelegten Regeln überzeugt sind. Zum Sinn der Glossenbildung wurden
hier
Argumente angeführt. --
Alexander Gamauf
Diskussion
11:26, 15. Nov. 2025 (MEZ)
Beantworten
Wenn alle, die den Punkt A 1.1 „mit großer Mehrheit angenommen“ haben, sich an der Ergänzung der Glossen beteiligen würden, gäbe es kein so großes Problem.
Peter
11:30, 15. Nov. 2025 (MEZ)
Beantworten
Alexander Gamauf
Die Argumente beziehen sich ja darauf, warum man überhaupt diese Glossen im Übersetzungsabschnitt haben sollte – aber die Erklärung, warum man so viel Energie in deren manuelle Erstellung stecken muss, fehlt komplett. Punkt 2 könnte man vielleicht noch als Versuch werten, das irgendwie zu begründen. Dem Autor scheinen diese „romanartigen“ Bedeutungsangaben ja nicht zu passen – was mich ehrlich gesagt ein bisschen trifft, weil ich solche selbst oft schreibe. Aber gut, darum soll's hier nicht gehen.
Was aber wirklich gar nicht erklärt wird, ist, warum man nicht einfach automatisch die Bedeutungsangabe einblendet. Das wäre aus meiner Sicht der absolut naheliegende Standard. Zumal ja sowieso die überwältigende Mehrheit dieser Glossen vom Bot erstellt wurde, indem er genau diese Bedeutungsangabe kopiert hat. Dieses Verfahren wurde also faktisch schon genutzt – und vermutlich sogar ohne irgendeine Abstimmung...
Ich hab grundsätzlich nichts gegen Glossen, im Gegenteil: Die Möglichkeit, sie manuell anzulegen, sollte auf jeden Fall bestehen. Aber das sollte eher die zweite Stufe sein. Wenn jemand findet, dass irgendeine vorhandene Bedeutungsangabe zu lang ist, kann er die Glosse ja kürzen. Aber es ist völlig unnötig, von jedem zu verlangen, für jede Bedeutung eine neue Glosse zu basteln, wenn man sie einfach automatisch anzeigen kann.--
Parlaval
Diskussion
18:29, 15. Nov. 2025 (MEZ)
Beantworten
Das Einblenden der Glossen wird ja bereits gemacht. Das hat Mediawiki mit ihrem Parsoid-Parser aber wieder kaputt gemacht, damit uns hier nicht langweilig wird. Wenn du den ausschaltest, geht es wieder. --
Formatierer
Diskussion
18:38, 15. Nov. 2025 (MEZ)
Beantworten
Also ja, klar, es funktioniert – aber zuerst kommt dieses gelbe Fragezeichen, dann „Glosse fehlt“ und danach erst die kopierte Bedeutungsangabe, und das auch noch in einer leicht ausgegrauten Schrift, nicht in normalem Schwarz. Warum kann das nicht so laufen, dass die Bedeutungsangabe ganz normal angezeigt wird, wenn keine Glosse eingetragen ist? Wir brauchen da doch echt kein blödes gelbes Warnsymbol und keinen Fehlerhinweis.
Wenn Alexander Spaß daran hat, Glossen händisch einzupflegen, dann soll er das meinetwegen gerne tun. Aber warum wird das Fehlen einer Glosse gleich so behandelt, als wäre das ein halber Angriff auf die Menschheit – ich meine, auf die „Reinheit des Eintragsformats“? 😂 --
Parlaval
Diskussion
19:00, 15. Nov. 2025 (MEZ)
Beantworten
Hallo
Parlaval
, man muss schon unterscheiden, ob man eine Bedeutungsangabe formuliert, die zudem wegen möglicher Urheberechtsverletzungen divers zu Definitionen der (kommerziellen) Wörterbüchern sein soll, oder eine Angabe für die übersetzende Person macht, um - im Verein mit der Bezeichnung des Lemmas - die zutreffenden Übersetzungen eintragen zu können. Während die Bedeutung durchaus länger sein kann, um sicher zu gehen, dass man das richtige Verständnis erweckt, sollte die Überschrift für die Übersetzung (=Glosse) nur den Definitionsteil der Bedeutung enthalten. Wenn z. B. ein technisches Gerät zur Übersetzung ansteht, sollten nur die charakteristischen Merkmale erwähnt werden, die es von anderen technischen Geräten abgrenzt. Angaben zur Historie, dem Erfinder, Nebenaspekten der Anwendung etc. sind für die Übersetzung unerheblich und lenken nur ab.
Die nachträgliche Eintragung von Glossen ist auch für mich eine Belastung, die ich nur deswegen auf mich nehme, weil ich auch ein einheitliches Layout des Produktes
deutschsprachiges Wiktionary
erreichen möchte. Sie ist zudem die logische Konsequenz der Beschlussfassung aus 2011, an der ich wegen der Verärgerung über das Verhalten einer Administratorin nicht teilgenommen habe.
Eine wirkliche Lösung deines Wunsches nach automatischer Einblendung der Bedeutung in die entsprechende Glosse könnte nur eine KI liefern, über die die Wikimediaprojekte derzeit nicht verfügen. Bis dahin ist menschliche Expertise erforderlich. Gruß,
Alexander Gamauf
Diskussion
13:13, 16. Nov. 2025 (MEZ)
Beantworten
Moin Alexander,
danke für deine Reaktion, aber ehrlich gesagt, verliere ich mich in deinem Ansatz komplett, bzw. ich verstehe einfach nicht, wie du zu diesen ganzen Schlussfolgerungen gekommen bist.
Erstens: Eine Person, die eine Übersetzung macht – also das passende Äquivalent in einer Fremdsprache sucht – muss die Bedeutung unbedingt verstehen. Dafür muss sie sich auf jeden Fall die entsprechende Definition durchlesen. Es ist schlichtweg nicht möglich, qualitativ hochwertige Übersetzungen einzufügen und gleichzeitig den Abschnitt Bedeutung komplett zu ignorieren und sich nur nach der Glosse zu richten. Eine Glosse ist nur eine kurze Erinnerung an die Bedeutung, keine speziell für Übersetzer angepasste Version der Definition!
Zweitens: Ich stimme zwar zu, dass Angaben zur Historie, zum Erfinder oder zu Nebenaspekten der Anwendung für Übersetzungen meistens nicht wichtig sind (auch wenn Nebenaspekte durchaus relevant sein können). Aber ehrlich gesagt kann ich mich nicht erinnern, dass solche Infos in Wiktionary-Definitionen öfter vorkommen. In einem ganzen Jahr habe ich vielleicht zwei oder drei Fälle gesehen, die unnötig lang waren. Ich habe damals extra in der Versionsgeschichte nachgeschaut: Diese Definitionen wurden von einem Nutzer erstellt, der bis heute aktiv ist – vor fast 20 Jahren in seinen Anfangszeiten. Meiner Meinung nach ist das also die absolute Ausnahme. Ich würde sagen, dass 99,99 % der Definitionen in dieser Hinsicht völlig in Ordnung sind – sie sind nicht so lang, dass jemand, der eine Übersetzung einfügt, sie nicht problemlos durchlesen könnte.
Drittens: Für das automatische Einblenden der Definition in die Glosse brauchen wir überhaupt keine KI – ich verstehe nicht, wie du darauf kommst. Das lässt sich problemlos mit JavaScript umsetzen, und der Formatierer hat das ja ohnehin schon vor einiger Zeit implementiert (auch wenn es laut seinen Angaben mit dem neuen Parser nicht funktionieren soll; ich selbst nutze es nicht, kann es also nicht beurteilen, aber auf jeden Fall sollte es lösbar sein).--
Parlaval
Diskussion
19:13, 16. Nov. 2025 (MEZ)
Beantworten
Hallo
Parlaval
, zu deinem ersten Punkt möchte ich dir zu bedenken geben, dass Menschen zur Simultanübersetzung fähig sind, wenn sie entsprechend geübt oder als Kind mehrsprachig aufgewachsen sind. Das ist ja das Phantastische an der natürlichen Intelligenz, dass die Erinnerung an einen bestimmten Kontext, der durch das Lesen oder Hören von Worten in einer bestimmten Sprache ausgelöst wird, automatisch zur Wiedergabe in einer anderen beherrschten Fremdsprache führt. Im Falle einer schriftlichen Übersetzung müssen also genügend Anhaltspunkte vorliegen, die eine Bedeutung von mehreren möglichen anderen entsprechend abgrenzen. Dazu ist im Wiktionary von einer Bedeutung bloß der Definitionsteil in die Glosse zu übernehmen. Leider ist in manchen Einträgen der Erläuterungsteil einer Bedeutung textlich mit dem Definitionsteil vermischt, sodass eine bloße Kopie oftmals zu einer Überlänge führt. Ich spreche hier aus Erfahrung nach Bearbeitung von mehreren tausend Einträgen zur Glossenbildung. Bei deinem dritten Punkt gehen wir von verschiedenen Voraussetzungen aus: Während ich vom beschlossenen Regelwerk der verpflichtenden Glossenbildung ausgehe, träumst du vom Schlaraffenland der Automatismen, die derzeit nur als hilfreicher Lückenbüßer durch eine Funktion von
Formatierer
realisiert ist. Wenn die automatische Glossenbildung dein Ziel ist, rate ich dir, ein entsprechendes Meinungsbild zu initiieren. Gruß,
Alexander Gamauf
Diskussion
17:44, 17. Nov. 2025 (MEZ)
Beantworten
Alexander Gamauf
. Ich hab so ein Gefühl, dass wir komplett aneinander vorbeireden – vor allem, weil du auf meine eigentlichen Argumente gar nicht eingegangen bist. Deshalb würde ich's mal anders versuchen: Wenn du meinst, dass es in diesem Projekt eine ganze Reihe von Bedeutungsangaben gibt, in denen Definitionsteil und Erläuterungsteil so stark miteinander vermischt sind, dass die Erstellung einer Übersetzung dadurch erschwert oder sogar unmöglich wird und man deshalb unbedingt eine eigene Glosse braucht, die dieses Problem löst – könntest du bitte mal fünf oder zehn konkrete Beispiele nennen, damit wir über etwas Handfestes sprechen können?--
Parlaval
Diskussion
18:37, 17. Nov. 2025 (MEZ)
Beantworten
Parlaval
: Das wird einige Zeit in Anspruch nehmen, weil ich keine Aufzeichnungen geführt habe. --
Alexander Gamauf
Diskussion
18:53, 17. Nov. 2025 (MEZ)
Beantworten
Parlaval
: Wie versprochen habe ich
hier
einige Beispiele zusammengetragen, die aufzeigen sollen, dass eine automatisierte Übertragung der Bedeutungsangaben in die entsprechende Glosse ohne KI äußerst kompliziert wäre. Anders wäre es, wenn die Bedeutung einen strukturierten Aufbau hätte, etwa „Definitionsteil; Erläuterungsteil“. Der Definitionsteil könnte 1:1 automatisch in die Glosse übernommen werden, der Erläuterungsteil dient dem Verständnis für diejenigen, die den Begriff noch nicht kennen. Für den Übersetzenden genügt der Definitionsteil in Verbindung mit der Lemmabezeichnung. Gruß,
Alexander Gamauf
Diskussion
19:05, 26. Nov. 2025 (MEZ)
Beantworten
Wie ich
hier
bereits versucht habe zu diskutieren, denke ich, dass viele Lesende die Formulierung „für diese Bedeutung siehe den deutschen Übersetzungsabschnitt“ nicht verstehen. Ich weiß trotz jahrelanger Mitarbeit an diesem Projekt nicht, was mit dem „deutschen Übersetzungsabschnitt“ gemeint ist. Sind es die darunter angegebenen deutschen Übersetzungen oder die drittsprachlichen Übersetzungen in den verlinkten deutschsprachigen Einträgen? Wer nur einen einzigen (oder den ersten) Eintrag im Wiktionary ansieht, „erwartet“ (
Spezial:Diff/10240748
) an dieser Stelle keine Glosse, vor allem, wenn es nur eine Bedeutung gibt.
Peter
11:21, 15. Nov. 2025 (MEZ)
Beantworten
Hallo @
Peter Gröbner
, sollte ein Bedarf für die von dir kritisierte Diktion bestehen, bitte ich um Gegenvorschläge. Gruß,
Alexander Gamauf
Diskussion
11:52, 15. Nov. 2025 (MEZ)
Beantworten
Habe ich
hier
bereits am 1. März gemacht: „für diese Bedeutung siehe die Übersetzungen der nachfolgenden deutschsprachigen Wörter“. Oder „für diese Bedeutung siehe die Übersetzungen der nachfolgenden deutschsprachigen Wörter in deren Einträgen“.
Peter
11:55, 15. Nov. 2025 (MEZ)
Beantworten
Hallo @
Peter
: Ich habe - auf deine Kritik reagierend - die Textierung bei Angabe von
G=sdü/sdÜ
zur Klarstellung erweitert (Beispiel:
fat
). Ich hoffe, jetzt ist der Apfel gegessen. Gruß,
Alexander Gamauf
Diskussion
15:01, 16. Nov. 2025 (MEZ)
Beantworten
Ich würde es nicht verstehen, wenn ich die Diskussionen nicht verfolgt hätte, ich hoffe, Lesende verstehen es.
Peter
16:41, 16. Nov. 2025 (MEZ)
Beantworten
Wenn (endlich) entschieden würde (z. B.
hier
), ob Übersetzungen fremdsprachlicher Wörter in Drittsprachen überhaupt gewünscht sind, könnte sich die Form der vorzunehmenden Bearbeitungen bei etwa einem Fünftel der betroffenen Einträge (
incategory:"Wartung fehlende Glosse in Ü-Tabelle" -incategory:Deutsch
) ändern.
Peter
18:04, 15. Nov. 2025 (MEZ)
Beantworten
Dann wäre auch geklärt, ob
solche
meiner Meinung nach durchaus sinnvolle Änderungen (in diesem Fall durch
English Ultra
) zulässig sind. Abgesehen davon, dass dadurch aktuell die meines Erachtens schwer verständliche Formulierung „für diese Bedeutung siehe den deutschen Übersetzungsabschnitt ( Deutsch:)“ entsteht.
Peter
08:27, 17. Nov. 2025 (MEZ)
Beantworten
Frage an
Formatierer
: Du hast an anderer Stelle geschrieben: „Kommen bestimmte Zeichen - wie HTML-Code - in den Bedeutungen vor, werden bisher die Glossen nicht gefüllt.“ Kann es sein, dass du auch Bedeutungen, in denen z. B. „[1]“ vorkommt, nicht in die Glosse überträgst? Könntest du Angaben, die chemische Summenformeln (etwa,
H2O
in H₂O) enthalten, in der Bedeutung ändern und danach transferieren? Oder globaler gefragt, welche der bisher angesprochenen Lösungsvarianten erscheinen dir am erfolgsversprechendsten? Deine Antwort beeinflusst maßgeblich die weitere Vorgangsweise. Gruß,
Alexander Gamauf
Diskussion
23:15, 29. Nov. 2025 (MEZ)
Beantworten
Ich benutze die Prüfung auf bestimmte Zeichen hauptsächlich als Sicherheitsleine. Falls der Bot mal danebengreift, wird die Ü-Tabelle nicht zerstört. Es werden also nur Texte übernommen, die die folgende Regex erfüllen. Die andere Bearbeitung sollte selbsterklärend sein. Sonst einfach fragen. Wenn man Text auf eine bestimmte Länge abschneidet, darf sich darin ja keine "halbe" HTML oder sonstige Struktur befinden, da sich sonst Klammerungsprobleme ergeben. Eckige Klammern führen zum Ausschluss. Es könnte sich ein externer Link dahinter verbergen. Man kann die Prüfung auch grundsätzlich abschalten und einfach alles übernehmen. --
Formatierer
Diskussion
09:11, 30. Nov. 2025 (MEZ)
Beantworten
Regex matchSimpleText = new Regex(@"^[a-zA-ZäöüÄÖÜß\s,;/():„“\-]+$"); // Für Glosse
...
if (result.Contains("{{")) {
result = helper.APIExpandTemplates("", title, result);
result = Utils.SubstVorlageK(result);
result = Utils.SubstWikilinks(result);
result = result.Replace("
result = result.Replace("m", "");
result = result.Replace("n", "");
result = result.Replace("f", "");
result = result.Replace(" "," "); // zwei Leerzeichen zu einem
result = result.Replace("''",""); // italics löschen
Match match = matchSimpleText.Match(result);
if (match.Success && result.Length <= 103) { // max. 103 Zeichen für Glosse
...
Meinung Udo T.
Ich wäre dafür, Variante 1.1 umzusetzen.
Danach kann man sich der
Kategorie:Wartung überlange Glosse in Ü-Tabelle
annehmen und diese Zug um Zug abarbeiten.
Das dürfte in meinen Augen sehr wahrscheinlich der effizientere Weg sein. Am Ende sollten in
Kategorie:Wartung fehlende Glosse in Ü-Tabelle
eigentlich nur noch Einträge zu finden sein, bei denen es fehlende Bedeutungsangaben gibt (also diese hier:
Kategorie:Wiktionary:Definition fehlt
).
Ich habe in der Vergangenheit auch schon regelmäßig Einträge abgearbeitet, meistens so 15 - 20 Stück am Tag, also binnen einer Woche ca. 100. Aber wenn da nur ein oder 2 Benutzer mitmachen, dann dauert es halt trotzdem gefühlt endlos und es ist und bleibt eine ermüdende und unerfreuliche Arbeit. Leider habe ich berufsbedingt auch nicht immer die Zeit und die Nerven dafür und bis zu meinem Ruhestand dauert es noch etwas. Außerdem fallen ja auch immer wieder andere Wartungsaufgaben an.
Von daher bin ich der Meinung, dass die Umsetzung von Variante 1.1 am zweckmäßigsten sein dürfte. Gruß --
Udo T.
Diskussion
13:41, 15. Nov. 2025 (MEZ)
Beantworten
Meinung Scripturus
Variante 1.4
, dann weitersehen. Variante 1.1 erzeugt m.E. zu viele Monsterglossen wie in
Hugo
(auf dem Handy 4 Zeilen Glosse). Ich habe auch kein Problem damit, die Leerglosse so wie jetzt stehen zu lassen. Es ist Community-Aufgabe, das nach und nach abzuarbeiten, ob man das nun gezielt nach Wartungsliste macht oder immer mal mit, wenn man es sieht. Das dauert dann so lang, wie es dauert. --
Scripturus
Diskussion
01:30, 17. Nov. 2025 (MEZ)
Beantworten
Beschlussfassung
Da seit längerem keine weiteren Stellungnahmen mehr erfolgten und die Einladung zur Mitarbeit keinen durchschlagenden Erfolg zeitigte, soll durch die an diesem Thema interessierten Wiktionary-Mitarbeiter eine Abstimmung ab 12. Februar 2026, 12 Uhr bis einschließlich 19. Februar 2026, 12 Uhr, über die vorgeschlagenen Lösungsvarianten der Variante 1 erfolgen.
BOT-Betreiber
Formatierer
wäre zu bitten, die fehlenden Glossen aus den Texten der Bedeutungen automatisiert zu bilden:
Variante 1.1
Ich bin für die vollständige Übernahme der Bedeutung in die Glosse, unter Inkaufnahme, dass die Wartungskategorie der überlangen Glossen anwächst:
Diskussion zur Beschlussfassung
Ich lade unsere aktiven Administratoren
Dr. Karl-Heinz Best
Edfyr
Peter
Formatierer
Trevas
und
Akinom
, die bisher an dieser Diskussion betreiligten
Parlaval
Scripturus
Yoursmile
RaveDog
Udo
und insbesonders
Seidenkäfer
ein, ihre Meinung hier zu vertreten. Eure Gruppenmeinung soll die optimale Vorgangsweise zur Bereinigung dieses Problemfeldes sicherstellen, soll das leidige Thema zu einem baldigen Abschluss führen.
Bei meiner Einschätzung, bin ich von der Befürchtung ausgegangen, dass überlange Glossen schon bisher keine Beachtung gefunden haben und das Problem von fehlenden Glossen zu wenig brauchbaren Glossen verschoben und perpetuiert wird.
Grüße in die Runde,
Alexander Gamauf
Diskussion
12:36, 13. Feb. 2026 (MEZ)
Beantworten
Ich habe dem
oben Gesagten
nichts hinzuzufügen.
Peter
13:51, 13. Feb. 2026 (MEZ)
Beantworten
Es ist dein gutes Recht, zu einem Problem keine Meinung zu haben oder zu äußern. --
Alexander Gamauf
Diskussion
15:05, 13. Feb. 2026 (MEZ)
Beantworten
Ergebnis
An der Abstimmung haben acht Abstimmungsberechtige teilgenommen. Die Variante 1.1 hat keine Zustimmung gefunden, die Variante 1.2 eine Stimme, die Variante 1.4 zwei Stimmen erhalten.
Die Variante 1.3 hat mit fünf Stimmen die größte Zustimmung erhalten.
BOT-Betreiber
Formatierer
wird daher gebeten, die fehlenden Glossen aus den Texten der Bedeutungen automatisiert zu bilden, wobei der Text der Bedeutung in die entsprechende Glosse automatisiert übertragen werden soll, indem der Kontext weggelassen wird, wobei überlange Glossen toleriert werden.
Danke an die Teilnehmenden der Abstimmung. Grüße in die Runde,
Alexander Gamauf
Diskussion
12:06, 19. Feb. 2026 (MEZ)
Beantworten
Ich habe jetzt testweise einige Bearbeitungen blockweise durchgeführt. Das sieht soweit ganz gut aus. Trotzdem werden noch einige Einträge übrigbleiben. Da muss ich mal beim nächsten Dump schauen, was da noch geht. Ab diesem Jahr werden Dumps aber nur noch einmal im Monat zur Verfügung gestellt. --
Formatierer
Diskussion
08:44, 22. Feb. 2026 (MEZ)
Beantworten
Spezial:Beiträge/Instance_of_Bot
--
Formatierer
Diskussion
08:49, 22. Feb. 2026 (MEZ)
Beantworten
Nachfragen
Hier
wurde der Kontext (bei aktuell lediglich einer Bedeutung) in die Glosse übernommen. Ist das im Sinne des Ergebnisses der Abstimmung? --
Peter
09:52, 22. Feb. 2026 (MEZ)
Beantworten
Die Vorlage K wurde erst in der Version vom 22. Februar 2026, 09:59 Uhr eingetragen. Da war vorher keine Vorlage K. --
Formatierer
Diskussion
10:08, 22. Feb. 2026 (MEZ)
Beantworten
Ja.
Die Frage in der Abstimmung bezog sich auf Kontexte, nicht auf die Vorlage. Das ist ein Wartungs- bzw. technisches Problem.
Peter
10:10, 22. Feb. 2026 (MEZ)
Beantworten
Man könnte auch einfach jeglichen Text abschneiden, der einem Doppelpunkt vorausgeht oder ggf. mehreren. Inklusive Doppelpunkt natürlich. Wenn das immer so funktioniert. --
Formatierer
Diskussion
10:32, 22. Feb. 2026 (MEZ)
Beantworten
Es war nicht leicht für mich, einen Fall zu finden, bei dem die wesentliche Bedeutungsunterscheidung vor dem Doppelpunkt erfolgt:
ihr
Peter
10:56, 22. Feb. 2026 (MEZ)
Beantworten
Ich lasse jetzt die Bedeutungen mit Doppelpunkt erstmal weg. Schauen wir mal was am Ende übrigbleibt. --
Formatierer
Diskussion
08:39, 23. Feb. 2026 (MEZ)
Beantworten
So, der Botlauf ist jetzt durch. Um den übriggebliebenen Rest zu analysieren, braucht es einen neuen Dump. --
Formatierer
Diskussion
14:21, 24. Feb. 2026 (MEZ)
Beantworten
Hallo zusammen,
wer kein Freund der Vorlage
{{
Autoarchiv-Erledigt
}}
ist (die von
SpBot
betreut wird), kann ab sofort wieder die Vorlage
{{
Autoarchiv
}}
für seine Benutzer-Diskussions-Seite verwenden. Der Bot
TaxonBot
von
Doc Taxon
wird sich ab sofort um die Archivierung der Diskussions-Seiten mit
{{
Autoarchiv
}}
kümmern.
Herzlichen Dank an
Doc Taxon
dafür, dass sein Bot nun die schon etwas länger verwaiste Archivierung von Diskussions-Seiten mit Vorlage
{{
Autoarchiv
}}
übernimmt.
Die Vorlage
{{
Autoarchiv
}}
ist in meinen Augen auch besser geeignet, um auf Meta-(Diskussions)-Seiten aufzuräumen, insbesondere dann, wenn diese nicht so häufig aufgesucht werden. Ich werde mal in den nächsten Tagen und Wochen (vielleicht
zwischen den Jahren
) schauen, was man umstellen kann.
Gruß --
Udo T.
Diskussion
17:47, 7. Dez. 2025 (MEZ)
Beantworten
Gern geschehen, --
Doc Taxon
Diskussion
18:05, 7. Dez. 2025 (MEZ)
Beantworten
…, die am Beginn von Substantiven stehen, werden nach einem Blick in die
Kategorie:Gebundenes Lexem (Deutsch)
aktuell nur bei
Lowcarb-
Lowfat-
Möchtegern-
Nachkriegs-
Nullachtfünfzehn-
Polit-
Schwieger-
Sonder-
US-
Vize-
und
Vorkriegs-
sowie einigen SI-Einheiten-Präfixen als Lemma großgeschrieben. Die Diskussion begann
hier
mit dem
Benutzer:Parlaval
und
Karl-Heinz
. Gruß in die Runde,
Peter
09:15, 21. Dez. 2025 (MEZ)
Beantworten
M.E. entscheidet allein die Wortart des durch das Lexem spezifizierten Wortes, ob groß- oder kleingeschrieben wird, ebenso wie den Genus, z.B.
die
Möchtegernkünstlerin <->
der
Möchtergern. (möchtegernkünstlerisch?) Wir haben hier Lexeme, die wegen ihrer
Bedeutung
fast nur vor Substantiven stehen (aber: vorkriegszeitlich). US fällt aus der Reihe, weil es sich um die Abkürzung eines Toponyms, also Eigennamens handelt.
Edfyr
Diskussion
11:38, 21. Dez. 2025 (MEZ)
Beantworten
Siehe dazu auch die
Diskussion:riesen-, Riesen-
. Was ist mit Lexemen, die (im Deutschen) keine selbständigen Wörter sind, wie
balneo-
Peter
12:08, 21. Dez. 2025 (MEZ)
Beantworten
Ich startete diese Diskussion, weil ich dachte, es wäre sinnvoll, vor der Änderung von Rotlinkherkünften (z. B. bei
Sonderzeichen
) verbindlich zu klären, wie die Lemmata der Lexeme lauten sollen.
Peter
12:21, 21. Dez. 2025 (MEZ)
Beantworten
Großschreibung bedeutet doch etwas: Substantiv oder Eigenname. Ein gebundenes Lexem
war
vielleicht mal ein Adverb/Adjektiv (sonder) oder ein Substantiv,
ist es aber nun nicht mehr
. Dann muss man es auch nicht (mehr) großschreiben. Ich bin dafür, dass wir kleinschreiben, wenn keine gewichtige Referenz groß schreibt. Das träfe dann auch auf balneo- zu. DWDS scheint die „Affixe“ wie balneo-, sonder-
immer
klein zu schreiben – kKurzzeit-/lLangzeit- führt es allerdings nicht auf.
Edfyr
Diskussion
23:10, 6. Jan. 2026 (MEZ)
Beantworten
Also ich bin dafür, dies im Einzelfall abzuwägen und darauf zu schauen, wird es mehr in Substantiven verwendet (dann wäre ich ehr für Großschreibung) oder wird es mehr in anderen Wortarten verwendet, dann wäre ich für Kleinschreibung. Bei Lexemen, die ausschließlich groß geschrieben werden (US-) wäre ich für die Großschreibung, selbsterklärend.
KimKelting
Diskussion
12:57, 8. Jan. 2026 (MEZ)
Beantworten
TOP20 user pageviews pages from public logs:
7937948 Spezial:Suche
2516812 Wiktionary:Hauptseite
1701208 -
992476 Wiktionary:Deutsch
222839 Hilfe:Hörbeispiele
154532 Spezial:Letzte_Änderungen
148503 porno
85283 Verzeichnis:Deutsch/Namen/die_häufigsten_Nachnamen_Deutschlands
73248 Verzeichnis:International/Smileys
61917 𒀭
57441 Bubatz
54782 Sexvideo
52181 Multijobber
50965 Hilfe:Sonderzeichen/Tabelle
49505 erratisch
49294 Öl
47588 Verzeichnis:Deutsch/Namen/die_häufigsten_männlichen_Vornamen_Deutschlands
44806 µ
43138 Englisch
40780 Verzeichnis:Deutsch/Essen_und_Trinken/Lebensmittel
--
Dušan Kreheľ
Diskussion
14:12, 6. Jan. 2026 (MEZ)
Beantworten
Die Halbwertszeit der Besuche der Hauptseite scheint aktuell etwa dreieinhalb Jahre zu betragen:
. Für den richtigen optischen Eindruck „Bei null beginnen“ anklicken!
Peter
13:59, 15. Feb. 2026 (MEZ)
Beantworten
Ich habe letztens die Begriffe
Regenpfeiferartige
Kürbisartige
Lilienartige
und
Nelkenartige
überarbeitet. Ich bin mir zwar recht sicher, dass Wörter mit der Endung
-artige
Pluralwörter sind und auch ohne Genus, wollte mich aber hier nochmal absichern. Was meint ihr?
KimKelting
Diskussion
21:34, 9. Jan. 2026 (MEZ)
Beantworten
Siehe dazu auch die
Diskussion:Falkenartige
--
Peter
10:43, 22. Jan. 2026 (MEZ)
Beantworten
Siehe dazu auch
meine heutigen Diskussionsbeiträge zu den Unterbegriffen
Peter
09:02, 22. Jan. 2026 (MEZ)
Beantworten
Siehe dazu auch
meine heutigen Diskussionsbeiträge zu den Oberbegriffen
. --
Peter
10:08, 22. Jan. 2026 (MEZ)
Beantworten
Die Kontextangabe "Medizin" unter
diluieren
findet sich zwar auch in DWDS und Duden, es lässt sich aber keine Beispielverwendung nach Beginn des 20. Jh. finden. Die rezenteste Begriffsverwendung im
DTA
stammt von Ludwig Feuerbach. Die Begriffseinengung auf die Medizin ergibt sich aus den Fundstellen im DTA nicht. Der Begriff wird im 19. Jh. wohl allgemein bildungssprachlich verwendet, etwa in der Philosophie, der Rechtswissenschaft, der Chemie.
Ich würde die Bedeutung also gern wie folgt anpassen:
[1]
veraltet
bildungssprachlich
verdünnen
Sofern ich die Regeln korrekt verstanden habe, können Bedeutungen, die sich nicht mit Nachschlagewerken belegen lassen, nach der Fünf-Zitate-Regel belegt werden. Die Begriffsverwendung außerhalb der Medizin lässt sich mit den Funden im DTA gut belegen, wie belege ich aber, den Kontext
veraltet
? Für das rezente Ausbleiben der Verwendung des Begriffs lässt sich naturgemäß kein Zitat finden.
--
Dr.üsenfieber
Diskussion
12:21, 23. Jan. 2026 (MEZ)
Beantworten
Diese Diskussion würde eigentlich eher zum jeweiligen Eintrag gehören. Unabhängig davon sei aber darauf hingewiesen, dass DWDS auch Korpora anbietet, die nur nach Anmeldung zugänglich sind. In einigen dieser Korpora finden sich durchaus neuere Verwendungen von
diluieren
; im WebXL-Korpus gibt es mehrere Belege aus den letzten etwa 15 Jahren. Ganz verschwunden ist der Begriff also nicht, auch wenn er außerhalb fachsprachlicher Kontexte deutlich seltener geworden ist.--
Parlaval
Diskussion
17:32, 23. Jan. 2026 (MEZ)
Beantworten
Ich fürchte, da ist etwas ziemlich Ärgerliches passiert: Das deutsche Projekt Gutenberg hat das komplette Layout der Website geändert. Dadurch funktionieren jetzt tausende Links von Wiktionary zu Projekt Gutenberg nicht mehr – das ist von deren Seite schon echt eine Sauerei. Keine Ahnung, ob man das irgendwie automatisiert mit einem Bot beheben kann… aber das alles manuell zu fixen wäre eine echte Strafarbeit.
Parlaval
Diskussion
12:43, 29. Jan. 2026 (MEZ)
Beantworten
Ja, das ist in der Tat richtig übel. Es geht um aktuall 2.613 Einbindungen von Vorlage
{{
DiB-Projekt Gutenberg-DE
}}
Der einzige Trost ist, dass anscheinend teilweise Weiterleitungen angelegt wurden, Allerdings landet man nicht mehr beim richtigen Kapitel, sondern immer beim ersten Kapitel.
Ich konnte anhand von 3 Beispielen bis jetzt auch kein Muster erkennen:
Eintrag „
klieben
Eintrag „
Schluckspecht
Eintrag „
affigieren
Beim 2. Beispiel kann man erkennen, dass auch teilweise die Nummerierung der Kapitel nicht mehr stimmt bzw. sich einfach um eins verschoben hat (25 vs. 26), weil man unter dem neuen 1 nun die Titelseite abgelegt hat und somit das 1. Kapitel dann mit 2 nummeriert wurde...
Gruß --
Udo T.
Diskussion
15:05, 29. Jan. 2026 (MEZ)
Beantworten
Hallo
Udo T.
und
Parlaval
, das Gutenberg-Projekt nimmt auf seine Leser nicht wirklich Rücksicht. Denn die Suchfunktion auf
dieser Seite
liefert nicht die gleichen Ergebnisse wie zuvor. So habe ich für das Lemma „
leben
“ nach „dreitausend Jahren“ gesucht und den Link zum zitierten Werk nicht angezeigt bekommen, dafür zehn andere. Egal, welche Suchbegriffe man eingibt, bekommt man nicht mehr als 10 Treffer.
Um einen besseren Überblick zu bekommen, habe ich die
Vorlage:DiB-Projekt Gutenberg-DE
dahingehend angepasst, dass die betroffenen
2.603
Einträge in der
Kategorie:Wiktionary:Webadresse verschoben (Gutenberg)
aufgelistet werden. Es gibt jedoch
derzeit insgesamt betroffene 2.875 Einträge
, da nicht alle Aufrufe von Gutenberg mit der Vorlage erfolgen. Gruß,
Alexander Gamauf
Diskussion
23:24, 29. Jan. 2026 (MEZ)
Beantworten
Ich habe ein kleines Script gebastelt, das einen Teil der Links automatisch generiert. (Siehe
Benutzer:Parlaval/GutenbergLinks
). Es lädt die einzelnen Kapitel der verlinkten Bücher herunter und versucht, die Seite zu finden, auf der das jeweilige Zitat vorkommt. Das Problem ist, dass manche Zitate in leicht veränderter oder anders formatierter Weise erscheinen, weshalb längst nicht alle Treffer gefunden werden. Aber zumindest erleichtert es einen Teil der Arbeit. Außerdem möchte ich die Website nicht unnötig belasten, daher lade ich die Seiten bewusst langsam herunter — entsprechend wird das Generieren der neuen URLs noch eine Weile dauern.--
Parlaval
Diskussion
03:14, 30. Jan. 2026 (MEZ)
Beantworten
Hallo
Alexander
und
Parlaval
, ich habe in der Vorlage
{{
DiB-Projekt Gutenberg-DE
}}
einen Link zur letzten verfügbaren Version bei archive.org eingebaut. Diese ist nach bisherigen Tests eigentlich immer vorhanden. Der Trick dabei ist: Man verwendet einfach
gefolgt vom Parameter "Online" mit der bisherigen URL, siehe
diese Änderung
von mir.
Die 2999 ist ein Trick, damit archive.org die letzte verfügbare Archiv-Version der übergebenen URL anzeigt. Es gäbe zwar laut Google Gemini auch noch den URL-Parameter "latest" (antselle von "2999"), aber der hat in meinen Tests nicht funktioniert.
Damit können interessierte Leser nun bei Bedarf weiterhin direkt zum korrekten Kapitel springen, halt nur in der früheren Version.
Man könnte sich sogar überlegen, ob man die Vorlage
{{
DiB-Projekt Gutenberg-DE
}}
generell auf die letzte archivierte Version umbaut. Aber dazu müsste man erst wissen, ob auch alle URLs von der früheren Projekt-Gutenberg-Webseite bei archive.org verfügbar sind. Ich bastle mal ein python-Skript, mit dem ich versuchen werde, das herauszufinden...
Die obigen 3 alten Link-Versionen sehen dann so aus:
Gruß --
Udo T.
Diskussion
15:05, 31. Jan. 2026 (MEZ)
Beantworten
Hallo
Udo
, da hast du eine gute Idee realisiert, dennoch die Quelle eines Zitats zum Projekt Gutenberg aufzutun. Dieses Feature wird uns sicher über die Umstellungsszeit hinweghelfen. Ich präferiere dennoch die Deep Links wegen der schnelleren Antwortzeiten. Gruß,
Alexander Gamauf
Diskussion
17:05, 31. Jan. 2026 (MEZ)
Beantworten
Hallo
Alexander
, ja, die Antwortzeit ist bei archive.org natürlich schlechter. Aber ich sag mir, immer noch besser, wie wenn man immer nur auf der Einstiegsseite eines Werkes landet und dann das richtige Kapitel selber suchen muss... ;o)
Das python-Skript ist übrigens schon fertig und läuft bereits. Wir haben 3.831 (unterschiedliche!) Verlinkungen zu "www.projekt-gutenberg.org" und es sind bereits über 630 URLs geprüft worden. Bis jetzt sind alle alten URLS bei archive.org verfügbar. Wenn überhaupt, dann sind es am Ende allenfalls eine Handvoll, die nicht bei archive.org verfügbar sind. Und diese könnte man dann schon mal vorab auf die neuen URLs umstellen. Gruß --
Udo T.
Diskussion
17:16, 31. Jan. 2026 (MEZ)
Beantworten
Nachtrag:
Vielleicht könnte man den letzten Vorschlag von mir, also alle Links auf die letzte Archiv-Version umzuleiten, auch nur für alle bisherigen Verlinkungen umsetzen und für neue Einträge mit neuen Verlinkungen zum Projekt Gutenberg einfach eine neue Vorlage, z. B.
{{
DiB-Projekt Gutenberg-DE-2026
}}
anlegen. Gruß --
Udo T.
Diskussion
15:44, 31. Jan. 2026 (MEZ)
Beantworten
Die neue Vorlage wäre allerdings in der Anwendung völlig ident, da die jeweilige URL nicht vorgegeben ist, sondern individuell vom Anwender/der Anwenderin beigebracht wird. Dein Archiv-Aufruf wird ja nunmehr, abhängig von der Form der URL, berücksichtigt. Gruß --
Alexander Gamauf
Diskussion
17:21, 31. Jan. 2026 (MEZ)
Beantworten
Das stimmt natürlich. Diese neue Vorlage wäre aber auch nur notwendig gewesen, wenn wir die bisherige Vorlage meinem oben gemachten Vorschlag folgend komplett auf die archive.org-URLs umgestellt hätten. Da das aber nicht gewünscht ist, kann man die bisherige Vorlage natürlich weiterhin einsetzen und mit Deiner Ergänzung wird dann praktischerweise bei neuen URLs zu Gutenberg der Zusatz mit dem Archiv-Link nicht angezeigt. Gruß --
Udo T.
Diskussion
18:12, 31. Jan. 2026 (MEZ)
Beantworten
Mein Skript schafft es aktuell, in etwa 60
% der Fälle für die ursprünglichen URLs entsprechende URLs auf der neuen Website zu finden. Momentan habe ich ungefähr 1.500 solcher Paare – diese Links sollten sich per Bot automatisch aktualisieren lassen. Deshalb würde ich das vorerst nicht manuell machen,
Alexander
, das ist einfach unnötige Arbeit.
Danach kümmere ich mich um die verbleibenden 40
%. Ein Teil davon lässt sich wahrscheinlich noch automatisiert verarbeiten. Problematisch sind vor allem eingebettete Vorlagen in den Beispielen – häufig erscheint dort die Vorlage
{{L}}
, etwa beim Eintrag
Schluckspecht
. Ich hatte ohnehin den Eindruck, dass dieses Format so nicht korrekt ist?
Und dann gibt es Fälle, in denen Bücher, die in der alten Version verfügbar waren, in der neuen aus unerklärlichen Gründen fehlen, zum Beispiel „Casanova: Erinnerungen“, siehe z. B. den Eintrag
Bank
. Auf dieses Werk verweisen Dutzende Links – in solchen Fällen bleibt wirklich nichts anderes übrig, als auf archive.org zu verlinken.--
Parlaval
Diskussion
18:49, 31. Jan. 2026 (MEZ)
Beantworten
Hallo
Parlaval
, ich habe nicht vor, die Umstellung massenhaft zu betreiben, sondern rein zu Studienzwecken, welcherart Probleme dabei auftreten können. Du könntest vor dem Suchvorgang den Text
{{L|Direktor|Director}}
auf
Director
reduzieren, da die
Vorlage:L
bloß auf die nunmehr gültige Schreibweise verlinkt. Bei der vorhergehenden Umstellung des Projektes Gutenberg ist Ähnliches passiert, dass manche Literaturquellen im Nirvana verschwunden sind. Ich habe damals auf Google-Books oder andere Quellen umgestellt. Nunmehr haben wir ja die Möglichkeit, archive.org zu nutzen. --
Alexander Gamauf
Diskussion
19:32, 31. Jan. 2026 (MEZ)
Beantworten
Info
: Alle unsere URLs zur alten Gutenberg-Seite sind bei archive.org abrufbar. Gruß --
Udo T.
Diskussion
19:27, 31. Jan. 2026 (MEZ)
Beantworten
Bisher konnte ich für 2428 alte URLs passende neue finden, siehe:
Benutzer:Parlaval/GutenbergLinks
— diese Links lassen sich also per Bot aktualisieren. Für die
verbleibenden 1662 URLs
müssen noch neue Entsprechungen gefunden werden.--
Parlaval
Diskussion
18:19, 2. Feb. 2026 (MEZ)
Beantworten
Hallo
Parlaval
, ich habe ein eigenes python-Skript für Pywikibot erstellt, dass diese Aufgabe übernehmen kann. Ein paar Test-Änderungen habe ich durchgeführt, siehe die
Bearbeitungen meines Bots von heute zw. 19:54 und 20:12
. Ich habe eine Gruppierungsfunktion eingebaut, damit der Bot bei mehreren Links in einem Eintrag keine mehrfachen Bearbeitungen durchführt (siehe
Änderung bei „Abbitte tun“
, die ja in deinem json 3 x einzeln vorkommen). Von daher wäre es vielleicht sinnvoll, noch etwas abzuwarten, bis du die fehlenden "new_url" in
Benutzer:Parlaval/GutenbergLinks/missing
gefunden hast. Oder wird das noch länger dauern? Aber andererseits ist es ja auch nicht so dringend, dass man da jetzt so schnell ändern muss, denke ich mal. Gruß --
Udo T.
Diskussion
20:29, 2. Feb. 2026 (MEZ)
Beantworten
Hallo zusammen,
die sog. "magic links" für ISBN, RFC und PMID sind eigentlich schon seit einigen Jahren veraltet und sollen früher oder später ganz deaktiviert werden.
Während sich die Verwendung von RFC und PMID bei uns im WIktionary in Grenzen hält (siehe „
Kategorie:Seiten,_die_magische_RFC-Links_verwenden
“ und „
Kategorie:Seiten,_die_magische_PMID-Links_verwenden
“), sieht das bei ISBN natürlich anders aus.
Für ISBN wurde nun die Parserfunktion
{{#isbn}}
eingeführt, die im Endeffekt genau dasselbe anzeigt wie bisher und auch zu „
Spezial:ISBN-Suche
“ führt, wenn man draufklickt:
SBN 978-3-411-04164-0
ergibt bisher
ISBN 978-3-411-04164-0
und
{{#isbn:978-3-411-04164-0}}
ergibt ebenfalls
ISBN 978-3-411-04164-0
Die meisten Verwendungen von ISBN geschehen über Vorlagen und hier wahrscheinlich zum größen Teil über die Vorlage
{{
Literatur
}}
Ich habe vor, in nächster Zeit zunächst einzelne Tests zu machen und dann Zug um Zug erst mal alle Vorlagen umzustellen.
Sobald alle Vorlagen in Bezug auf ISBN umgestellt sind, wird man dann in „
Kategorie:Seiten,_die_magische_ISBN-Links_verwenden
“ sehen, was noch übriggeblieben ist. Aber ich vermute mal, dass ISBN in Einträgen direkt eher selten verwendet wurde. Wenn, dann evtl. noch auf Disk.-Seiten oder im Meta-Bereich.
Sobald die Umstellung beendet ist, wären wir dann gerüstet, falls es irgendwann mal heißen sollte, dass die sog. "magic links" endgültig deaktiviert werden sollen.
Ob es für RFC und PMID auch Parserfunktionen geben wird, muss ich noch herausfinden. Man könnte aber auch vorsorglich Vorlagen für RFC und PMID schreiben.
Gruß --
Udo T.
Diskussion
15:42, 10. Feb. 2026 (MEZ)
Beantworten
Hallo
Udo
, es freut mich, dass du dich dieses Problems annimmst. Wenn du Unterstützung brauchen solltest, kannst du auf mich zählen. Gruß,
Alexander Gamauf
Diskussion
17:57, 10. Feb. 2026 (MEZ)
Beantworten
Info
: Von den
50
Seiten, die ISBN enthalten, sind derzeit
73.787
händisch eingetragen worden. Das schafft nur ein BOT!
Alexander Gamauf
Diskussion
19:18, 10. Feb. 2026 (MEZ)
Beantworten
Hallo
Alexander
, Du hast das "insource" in Deiner Suche falsch befüllt. Die korrekte Suche ist
diese hier
und die ergibt "nur noch" 11.225 Treffer. Klar, auch das muss ein Bot machen, aber ich habe ja einen und das ist dann auch kein Problem für UT-Bot. Aber ich will mich trotzdem zuerst um die ganzen Vorlagen-Einbindungen kümmern. Es eilt ja im Übrigen auch (noch!) nicht... ;o) Gruß --
Udo T.
Diskussion
19:55, 10. Feb. 2026 (MEZ)
Beantworten
Nachtrag:
Es sind sogar noch etwas weniger, nämlich 10.009. Mit der RegEx nur nach /ISBN / zu suchen, findet dann auch Sachen wie "ISBN = 9-xxx-xxx...". Also muss man mit /ISBN [0-9]/ suchen, siehe
hier
. Gruß --
Udo T.
Diskussion
20:41, 10. Feb. 2026 (MEZ)
Beantworten
Nachtrag:
Nachdem die Parserfunktion anscheinend noch in der Entwicklung ist, werde ich zunächst nur Tests machen und mit einer Umstellung noch abwarten. Siehe
w:Hilfe:Parserfunktionen/Verschiedenes#isbn
und
phab:T413375
. Gruß --
Udo T.
Diskussion
17:44, 10. Feb. 2026 (MEZ)
Beantworten
Info
: Unter
Benutzer:Udo T./ISBN-Umstellung
halte ich mal alles fest, was ich bisher an Modulen und Vorlagen gestestet habe und was man ändern muss. --
Udo T.
Diskussion
14:46, 11. Feb. 2026 (MEZ)
Beantworten
Info
: Ich habe nebenan in der WP bei PerfektesChaos nachgefragt, ob sich im Aufruf der Parserfunktion noch etwas ändern wird. Laut ihm wird allenfalls noch ein zusätzlicher und optionaler Parameter für formal falsche ISBNs dazukommen, was für die Umstellung bei uns aber irreleveant ist. Außerdem wird die Zahlenwurst später evtl. noch mit korrekten Bindestrichen ausgegeben werden, was dann aber automatisch geschehen wird.
D. h. also, dass ich loslegen kann. ich werde zu nächst das „
Modul:Zitation
“, das von Vorlage
{{
LiteraturN
}}
verwendet wird und Vorlage
{{
Literatur
}}
anpassen. Desweiteren noch die Vorlagen, welche ich
hier
aufgelistet habe.
Danach werde ich abwarten, bis sich die Trackung-Kat
Seiten, die magische ISBN-Links verwenden
aktualisiert hat. Diese werde ich dann zunächst nur im Entrags-NR von meinem Bot abgrasen lassen. Danach wird man dann weitersehen, wo überall noch ein ein Magic Link f. ISBN stehen wird. Gruß --
Udo T.
Diskussion
16:06, 22. Feb. 2026 (MEZ)
Beantworten
Nächste
Info
: Spätestens morgen früh wird mein Bot dann wohl fertig mit der Umstellung auf die ISBN-Parserfunktion sein. Es werden dann nur noch Benutzer- und Benutzer-Disk-Seiten in die „
Kategorie:Seiten, die magische ISBN-Links verwenden
“ stehen sowie 2 Seiten im WT-Raum, die vollgeschützt sind und nur durch einen Admin bearbeitet werden können.
Da Vorlagen innerhalb von
ref>
leider nicht substituiert werden, war der Einsatz von Vorlage
{{
ISBN
}}
mittels
{{subst:ISBN|978-3-...}}
leider nicht möglich. Dadurch wären alle ISBNs überprüft und bei Bedarf auch sauber formatiert worden. Mein Bot hat also in einem 1. Schritt zunächst nur alle ISBNs in die neue Parserfunktion umwandeln können, ohne dabei zu prüfen und zu formatieren.
Die gute Nachricht: Ich habe nun ein python-Skript geschrieben, das dies nun in einem 2. Schritt nachholen kann, indem es alle ISBNs innerhalb von
{{#isbn:x-xxx-xxxxx-x}}
überprüft und bei Bedarf auch sauber formatiert, siehe z. B. (in Summe)
diese Änderung
auf einer Testseite. Einträge mit Verdacht auf fehlerhafte ISBN werden dann in die „
Kategorie:Wiktionary:Seite mit ungültiger ISBN
“ gesteckt. Bei diesen Einträgen ist dann manuell die ISBN zu prüfen und zu korrigieren und in den Fällen, in denen eine ISBN formal falsch, aber dennoch korrekt ist, wird dann z. B.
{{Verdacht auf Falsche ISBN|311-018-041-2}}
einfach in
{{Falsche ISBN|311-018-041-2}}
abgeändert.
Diesen 2. Lauf werde ich aber erst ab dem 02. März machen, da ich mir ab dann alle Seiten, die
{{#isbn:x-xxx-xxxxx-x}}
enthalten, einfach über den neuen Datenbank-Dump heraussuchen kann.
Gruß --
Udo T.
Diskussion
21:51, 26. Feb. 2026 (MEZ)
Beantworten
Nun befinden sich aktuell nur noch 60 Seiten in „
Kategorie:Seiten, die magische ISBN-Links verwenden
“. Zwei davon sind die vollgeschützten Seiten im WT-Namensraum: „
Wiktionary:Fragen zum Wiktionary/Archiv bis Anfang Januar 07
“ und „
Wiktionary:Löschkandidaten/keine Belegstelle/Archiv 2007
“. Entweder ein Admin setzt den Schutz runter auf "aktive Sichter" oder die Anpassungen müssen von einem Admin vorgenommen werden.
Die Benutzer- und Benutzer-Disk-Seiten habe ich erstmal in Ruhe gelassen, mit Ausnahme solcher Seiten, deren Benutzer seit mehreren Jahren wikiweit nicht mehr aktiv sind und ähnliche. Wenn ein Benutzer es wünscht, kann mein Bot natürlich auch diese Seiten anpassen; dazu bitte einfach unten in
die Liste
eintragen.
Ansonsten bleibt auf diesen Seiten die alte ISBN-Syntax und sobald die Magic Links deaktiviert werden, kann man eben nicht mehr drauf klicken, um die betreffende ISBN zu suchen.
Gruß --
Udo T.
Diskussion
11:42, 27. Feb. 2026 (MEZ)
Beantworten
Udo
, die von dir oben angegebenen vollgeschützten Seiten im WT-Namensraum habe ich händisch bearbeitet. Gruß,
Alexander Gamauf
Diskussion
12:00, 28. Feb. 2026 (MEZ)
Beantworten
Hallo zusammen,
ich habe heute die zwei anderen "magischen Wörter", RFC und PMID, umgestellt.
Für RFC habe ich eine Vorlage aus der Wikipedia importiert, siehe Vorlage
{{
RFC
}}
. Anstelle von z.
B. bisher
RFC 4646
ist nun im einfachsten Fall
{{RFC|RFC=4646}}
bei direkter Eingabe in einem Eintrag anzugeben. Man kann auch den Pseudo-Interwikilink
[[RFC:4646]]
verwenden, was ich aber erst vorhin herausgefunden habe. Mit der Vorlage
{{
RFC
}}
kann man allerdings bei Bedarf noch weitere Parameter mitgeben, siehe die Vorlagen-Doku.
Für PMID bitte anstatt z.
B.
PMID 31028759
in Zukunft bei direkter Eingabe in einem Eintrag nur noch den Pseudo-Interwikilink
[[PMID:31028759]]
verwenden.
Wichtig:
Wenn man in den Vorlagen
{{
Literatur
}}
oder
{{
LiteraturN
}}
einen RFC oder eine PMID angeben will, ändert sich an der bisherigen Vorgehensweise nichts. Also bitte einfach weiterhin als Parameter
|RFC=
bzw.
|PMID=
angeben. Die beiden Vorlagen bzw. das dahinterstehende
Modul:Zitation
habe ich entsprechend angepasst.
Gruß --
Udo T.
Diskussion
20:12, 12. Feb. 2026 (MEZ)
Beantworten
Um künftig Diskussionen wie
LA: Osterverkehre
vorzugeugen: Wie wär’s, wenn wir eine Anmerkung in die Vorlage
{{
Deutsch Substantiv Übersicht
}}
einfügen? In kleiner Schrift, oder „Info“ mit Link auf Hilfe:Dativ-e mit dem Hinweis, dass das Dativ-e nicht falsch, aber veraltend ist, jedoch in getragener/feierlicher oder dichterischer Sprache (noch) verwendet wird? Gegebenenfalls, z. B. bei
Fall
, könnte die Anmerkung deaktiviert werden.
Edfyr
Diskussion
11:47, 13. Feb. 2026 (MEZ)
Beantworten
Pro
Danke!
Peter
13:41, 13. Feb. 2026 (MEZ)
Beantworten
Hallo
Edfyr
, eine Anmerkung würde ich für zu bombastisch halten. Sie könnte außerdem mit einer oder sogar mehreren bereits existieren anderen Anmerkungen in Konflikt geraten. Außerdem sollte man immer auch an Handy-Nutzer denken.
Was ich für besser hielte, wäre eine automatisch erzeugte kleine und hochgestellte Fußnote (Zahl 1, Stern oder Fragezeichen) hinter dem Dativ-e, die man entweder direkt als Link realiseren könnte oder ähnlich wie im en.wiktionary unterhalb der Flexbox mit einem weiterführenden Link erscheinen lassen könnte (siehe z. B.
en:Fall#Declension
und dann die „Declension“ aufklappen). Eine passende Seite, wohin man verlinken kann und auf der alles erklärt wird, hätten wir auch schon: „
Wiktionary:Dativ-e
“. Gruß --
Udo T.
Diskussion
11:31, 14. Feb. 2026 (MEZ)
Beantworten
Nachtrag:
Ich habe mal in einer Test-Vorlage (
{{
Deutsch Substantiv Übersicht-Test
}}
diese Änderung
eingebaut und diese Test-Vorlage danach zur Veranschaulichung im Eintrag „
Fall
“ eingebaut. Gruß --
Udo T.
Diskussion
12:55, 14. Feb. 2026 (MEZ)
Beantworten
Bin dafür! Ich konnte das kleine Fragezeichen auch auf meinem Smarpthone mit meine Wurstfiner anklicken. Gruß,
Edfyr
Diskussion
12:34, 15. Feb. 2026 (MEZ)
Beantworten
Nach einer etwaigen Umsetzung in der eigentlichen Vorlage
{{
Deutsch Substantiv Übersicht
}}
müsste man sofort testen, ob die Änderung in Konflikt mit
Formatierers
checkpage
gerät. Die Test-Vorlage
{{
Deutsch Substantiv Übersicht-Test
}}
, in der ich
diese Änderung
vorgenommen habe, ignoriert
checkpage
leider, sodass ich das vorab nicht testen kann. Gruß --
Udo T.
Diskussion
12:52, 15. Feb. 2026 (MEZ)
Beantworten
Das sollte funktionieren, da checkpage nur die Parameter der Vorlage auswertet, und da ändert sich ja nichts. Allerdings gibt es den Dativ-Parameter noch in 4 Varianten und jeweils einmal pur, einmal mit * und einmal mit **. Wo sich die e-Variante verbirgt, war bisher nicht festgelegt und könnte zufällig verteilt sein. --
Formatierer
Diskussion
13:24, 15. Feb. 2026 (MEZ)
Beantworten
Hallo
Edfyr
und
Formatierer
, neuer Vorschlag:
Mit
dieser Änderung
in der Test-Vorlage
{{
Deutsch Substantiv Übersicht-Test
}}
habe ich das „
“ nun nach vorne zum Text „Dativ“ verlagert. Es wird aber nur angezeigt, wenn einer der 10 Parameter:
Dativ Singular*
Dativ Singular**
Dativ Singular 1*
Dativ Singular 1**
Dativ Singular 2*
Dativ Singular 2**
Dativ Singular 3*
Dativ Singular 3**
Dativ Singular 4*
Dativ Singular 4**
gefüllt wird. Siehe beim Eintrag „
Fall
“, wo die Test-Vorlage immer noch eingebaut ist. Gruß --
Udo T.
Diskussion
13:45, 20. Feb. 2026 (MEZ)
Beantworten
Gefällt mir, auch weil es Personen, die keine Muttersprachler sind, eine Orientierungshilfe bietet. Woher sollen sie wissen, welche Dativ-(/Genitiv-)Form in welcher Textsorte Verwendung findet? Lob und guten Gruß,
Edfyr
Diskussion
21:13, 22. Feb. 2026 (MEZ)
Beantworten
Hello everyone,
This is a notice regarding an ongoing data migration on Wikidata that may affect your election-related templates and Lua modules (such as
Module:Itemgroup/list
).
The Change:
Currently, many templates pull electoral maps from Wikidata using the property
P1846
, combined with the qualifier
P180
Q19571328
We are migrating this data (across roughly 4,000 items) to a newly created, dedicated property:
P14226
What You Need To Do:
To ensure your templates and infoboxes do not break or lose their maps, please update your local code to fetch data from
P14226
instead of the old
P1846
P180
structure. A
list of pages
was generated using Wikimedia Global Search.
Deadline:
We are temporarily retaining the old data on
P1846
to allow for a smooth transition. However, to complete the data cleanup on Wikidata, the old
P1846
statements will be removed after
May 1, 2026
. Please update your modules and templates before this date to prevent any disruption to your wiki's election articles.
Let us know if you have any questions or need assistance with the query logic. Thank you for your help!
ZI Jony
using
MediaWiki message delivery
Diskussion
19:09, 3. Apr. 2026 (MESZ)
Beantworten
US