Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > Übersicht tags
Diese Bibliothek bietet Funktionen zum Parsen und Konvertieren von HTML-Dateien.
Binden Sie die Bibliothek stets am Anfang eines Skripts ein:
let html = require('common/html'); html.text('<p>Text to convert</p>');
Konvertiert HTML in Plain Text.
Übergeben Sie entweder einen String oder ein agorum core-Objekt.
Syntax
agorum core-Objekt
html.text(objects.find('agorum core-Objekt'));
String
html.text('string');
Beispiel
let objects = require('common/objects'); let html = require('common/html'); // per agorum core-Objekt let text = html.text(objects.find('agorum-id')); // oder als String text = html.text('<p>Text to convert</p>'); // oder als Stream text = html.text(objects.find('agorum-id').contentStream);
Rückgabewerte
Sie erhalten einen String.
Säubert ein HTML.
Beispiel
let html = require('common/html'); let cleanHtml = html.clean('<p>Guter Inhalt</p><script>alert("Böser Inhalt");</script><p>Weiterer guter Inhalt</p>');
Ergebnis
<p>Guter Inhalt</p> <p>Weiterer guter Inhalt</p>
Rückgabewerte
Sie erhalten einen String.
Analysiert ein HTML und greift direkt auf die DOM-Struktur zu.
Übergeben Sie einen String oder ein agorum core-Objekt.
Beispiel
let objects = require('common/objects'); let html = require('common/html'); let document = html.parse(objects.find('agorum-id')); // zum Beispiel alle A-Tags (Links) aus dem Dokument herausholen: let links = html.parse(objects.find('1218952')).body().getElementsByTag('a');
Rückgabewerte
Sie erhalten ein Document-Objekt aus der jsoup-Bibliothek zurück.
Kodiert den Text, sodass ein Browser ihn unverändert anzeigen kann.
Übergeben Sie einen String.
Beispiel
let html = require('common/html'); let escaped = html.escape('<test>');
Ergebnis
<test>
Rückgabewerte
Sie erhalten einen String.
let html = require('common/html'); let htmlDoc = html.parse('täüsßt'); let settings = htmlDoc.outputSettings(); settings.escapeMode(Packages.org.jsoup.nodes.Entities.EscapeMode.extended); settings.charset("ASCII"); let html = htmlDoc.body().html();