HTML átalakítása Textile formátumba
Új szórakozásom (nem szórakozás), hogy a HTML dokumentációkat akarom átvinni wiki-be, ami Textile formátumot használ.
Mivel nem akarok mindent újra begépelni, így elkezdtem konvertert keresni.
Volt 1-2 ígéretes, de végül a html2textile python script mellett döntöttem. Ez csak egy függvény, amit aztán úgy használunk, ahogy tetszik.
Íme egy szösszenet, ami a beírt elérési úton kigyűjti az összes html fájlt és egy bizonyos részletét kiolvasva átalakítja textile formátumba:
<br />
from html2textile import html2textile<br />
import codecs<br />
import os</p>
<p>dir_path = “/foo/bar”<br />
os.chdir(dir_path)<br />
for files in os.listdir("."):<br />
if files.endswith(".html"):<br />
f = codecs.open( dir_path+'/'+files , ‘r’, ‘utf-8’)<br />
lines = ‘'<br />
read = 0<br />
for line in f:<br />
if ( line == “\n” ):<br />
read = 1<br />
if ( line == "
read = 0<br /> if ( read ):<br /> lines += line</p> <p> lines = html2textile(lines)<br /> f.close()<br /> f = open('/foo/baz/'+files+'.textile’, ‘w’)<br /> f.write( lines.encode(‘utf-8’) )<br /> f.close()
A kezdő és vég pont, ami között olvasni kell itt szerencsére adott volt. Más esetben például a tag jól használható.
A forrás innen letölthető: html_textile_converter