Schabby's Blog
Reserve Orbital Defence Commander

Mein alter Freund und Diplomarbeitsvater Mikio Braun hat eine Suchmaschine gebaut für Twittermeldungen die anhand des Zahl der retweets eine Meldung ranked. Die Idee dahinter ist, dass eine Meldung die häufig geretweeted wird relevanter ist, als Meldungen die seltener geretweeted wurden. In seinem Blog, beschreibt er wie Twimpact genau funktioniert.


Problembeschreibung:

  • HTML Tags und Elemente entfernen aus Strings in Java
  • Strip HTML tags aus Text oder String in Java
  • Java HTML Tags aus String entfernen
  • RegEx oder Regular Expression um HTML aus Strings in Java zu entfernen
  • HTML in Strings löschen in Java
  • HTML aus Text entfernen in Java

Lösung:
Ich bin bisher kein großer RegExp-Wizard. Ich bin über die Lösung bei Dzone Snippet Repository gestolpert. Es ist so einfach wie ich es mir erhofft habe:

public String stripHtmlTags(String text)
{
   return text.replaceAll("\\<.*?\\>;", "");
}

Wir schreiben das Jahr 2009, August 15. 1:40. Ich stoppe die Zeit bis die Herren Pip, Alpar und Co. mir hier einen unanständigen Kommentar hinterlassen. Immerhin gabs nen Backlink und für mich einen zweiten Post. Schnarch. Feierabend.


So. tipptipptipp. Ich beginne.

Dieser Blog wird erstmal nur meinen alten Blog enthalten, den ich mangels Political Correctness nicht lange öffentlich hielt. Ich denke aber nun, dass die Welt alt genug für die Wahrheit zu erfahren.