PHP strip_tags alternatíva
A strip_tags() függvénnyel az a nagy probléma, hogy a multibyte-os karaktereket hibásan kezeli. Erre egy lehetséges megoldás:
HTML átalakítása Textile formátumba
Új szórakozásom (nem szórakozás), hogy a HTML dokumentációkat akarom átvinni wiki-be, ami Textile formátumot használ.
Mivel nem akarok mindent újra begépelni, így elkezdtem konvertert keresni.
Volt 1-2 ígéretes, de végül a html2textile python script mellett döntöttem. Ez csak egy függvény, amit aztán úgy használunk, ahogy tetszik.
Íme egy szösszenet, ami a beírt elérési úton kigyűjti az összes html fájlt és egy bizonyos részletét kiolvasva átalakítja textile formátumba:
<br /> from html2textile import html2textile<br /> import codecs<br /> import os</p> <p>dir_path = “/foo/bar”<br /> os.