Erzeugen kompakter Textboxen

vorhergehende Artikel in: Java Komponenten
20.12.2021

In einem Text Zeilenumbrüche einzufügen, um eine bestimmte Zeilenlänge nicht zu überschreiten ist trivial. Ebenso trivial ist es, einen Text so umzubrechen, dass eine bestimmte Zeilenanzahl nicht überschritten wird - Wie bricht man aber die Zeilen automatisch um, wenn die resultierenden Textblöcke besonders kompakt sein sollen - also weder zu lange, noch zu viele Zeilen aufweisen sollen?

Der Grund für diese Überlegungen war das Projekt zur Umwandlung von WARC-Dateien in GraphViz-Representationen: Werden die Pfade zu den Seiten nicht umgebrochen, sind die Knoten im Graphen sehr flach, aber dafür auch extrem breit.

Ich wollte daher einen Mechanismus, der in einen jeden Textblock für sich Zeilenumbrüche so einfügte, dass der resultierende Block möglichst kompakt wurde - kurz gesagt sollte der Mechanismus dafür sorgen, dass in einer Zeile mehr Zeichen erlaubt waren, wenn der gesamte Text länger war, als wenn der Text kürzer war. Gleichzeitig sollte die Anzahl der Zeilen auch umso mehr steigen, umso länger der Text war.

Das Ergebnis der von mir dazu geschriebenen Methode sieht für den aus 36 Zeichen bestehenden Text ristwibutiun. Hei muk neme eis loppe so aus:

ristwibutiun. Hei
muk neme eis
loppe

Für einen deutlich längeren Text - nämlich die 245 Zeichen hier rogram. Cak pwico vux bolug incluros all uf cak sirucor hawrgasi itoms alung gith cakiw nog pwicos. Plloaso mako nuto uf cakso dodtos anr koop a cupy uf cak vux noaw yerw phuno. Whag schengos, uf efed, quiel ba mada su otrenzr swipontgwook proud ergibt diese Methode mit ansonsten gleichen Parametern das folgende Resultat:

rogram. Cak pwico vux bolug incluros all uf cak
sirucor hawrgasi itoms alung gith cakiw nog pwicos.
Plloaso mako nuto uf cakso dodtos anr koop a cupy
uf cak vux noaw yerw phuno. Whag schengos, uf
efed, quiel ba mada su otrenzr swipontgwook
proud

Man erkennt, dass sowohl die Zeichenanzahl pro Zeile wie auch die Anzahl der Zeichen mit der Länge des Gesamttexts propertional ansteigen.

Der Code selbst dazu lautet:

public static java.lang.String insertLinebreaksForCompactness(
    java.lang.String input,
    double compactnessRatio,
    java.lang.String wordBoundaryCharacters,
    java.lang.String lineBreak)
{
    double c=input.length();
    double dy=java.lang.Math.max(1.0,java.lang.Math.sqrt
        (c/java.lang.Math.abs(compactnessRatio)));
    double dx=compactnessRatio*dy;
    int y=(int)dy;
    //System.out.println(input+" "+c+" "+dx+" "+dy);
    java.util.regex.Pattern pattern=java.util.regex.Pattern.compile
        ("(["+java.util.regex.Pattern.quote(wordBoundaryCharacters)+"])");
    java.util.regex.Matcher matcher = pattern.matcher(input);
    int fromIndex=0;
    java.lang.StringBuffer result=new java.lang.StringBuffer();
    java.lang.StringBuffer lineBuf=new java.lang.StringBuffer();
    while ( matcher.find(fromIndex)) {
        java.lang.String partToAdd=input.substring
            (fromIndex,matcher.start())+matcher.group(1);
        if((lineBuf.length()<1)
            ||(lineBuf.length()+partToAdd.length()<y))
            lineBuf.append(partToAdd);
        else if(y-lineBuf.length()>
            (lineBuf.length()+partToAdd.length())-y)
            lineBuf.append(partToAdd);
        else
        {
            result.append(lineBuf.toString());
            result.append(lineBreak);
            lineBuf=new java.lang.StringBuffer(partToAdd);
        }
        fromIndex=matcher.end();
    }
    java.lang.String partToAdd=input.substring(fromIndex);
    if((lineBuf.length()<1)||
        (lineBuf.length()+partToAdd.length()<y))
    {
        lineBuf.append(partToAdd);
        result.append(lineBuf.toString());
    }
    else
    {
        result.append(lineBuf.toString());
        result.append(lineBreak);
        result.append(partToAdd);
    }
    return result.toString();
}

Alle Artikel rss Wochenübersicht Monatsübersicht Codeberg Repositories Mastodon Über mich home xmpp


Vor 5 Jahren hier im Blog

  • Derangement - theoretische Betrachtungen

    23.12.2020

    Ich habe bereits über meine Implementierung eines Derangement berichtet - hier noch einige theoretische Nachbetrachtungen...

    Weiterlesen

Neueste Artikel

  • Asymmetrische Kryptographie

    Ich habe mich mit der Idee schon länger getragen: Nochmal einen Rundumschlag zu asymmetrischer Kryptographie zu machen. Dabei werde ich mich auf Demonstrationen der einzelnen Konzepte und Operationen mit Beispielcode konzentrieren und zu jedem der vorgestellten Konzepte mehr oder weniger ausführlich bezüglich der Einsatzszenarien und Vor- und Nachteile Stellung beziehen

    Weiterlesen
  • Eingereichter Vortag zum 39C3 - Gentlemen - check your architecture!

    Dieser Vortrag wurde zum 39C3 eingereicht und abgelehnt. Ich möchte einige Open-Source-Frameworks für verschiedene Programmiersprachen vorstellen, mit denen sich Architekturregeln pro Projekt oder Organisation festlegen und mithilfe gängiger Testinfrastrukturen durchsetzen lassen.

    Weiterlesen
  • Chatkontrolle vermeiden ist gleichzeitig unwichtig und nicht genug!

    Das ist ein Abstract eines Vortrages, den ich auf dem 39C3 halten wurde, der aber abgelehnt wurde

    Weiterlesen

Manche nennen es Blog, manche Web-Seite - ich schreibe hier hin und wieder über meine Erlebnisse, Rückschläge und Erleuchtungen bei meinen Hobbies.

Wer daran teilhaben und eventuell sogar davon profitieren möchte, muss damit leben, daß ich hin und wieder kleine Ausflüge in Bereiche mache, die nichts mit IT, Administration oder Softwareentwicklung zu tun haben.

Ich wünsche allen Lesern viel Spaß und hin und wieder einen kleinen AHA!-Effekt...

PS: Meine öffentlichen Codeberg-Repositories findet man hier.