Manpages konvertieren nach dvi / pdf / html / amazon kindle (troff, groff, kindlegen)

Autor: Raphael Eiselstein <rabe_at_uugrn.org>
Datum: Mon, 2 Jan 2012 04:23:07 +0100
Hallo zusamen,

ich habe seit einiger Zeit einen amazon kindle, den ich nicht nur für
Literatur nutze(n will), sondern auch zB um eigene Dokumente "offline"
verfügbar zu haben, zum Beispiel die oftmals sehr guten FreeBSD
Manpages.

Die kann man entweder lokal im Terminal lesen oder sich in bestimmte
Ausgabeformate konvertieren lassen, zum Beispiel nach PostScript:

man -t 5 rc.conf > man_5_rc.conf.ps

------
%!PS-Adobe-3.0
%%Creator: groff version 1.19.2
------

-t routet das ganze durch troff und das wiederum scheint das durch groff
zu routen. Ich habe keine Ahnung von troff und groff, ich kapiere
ansatzweise, dass es um Verarbeitung von Markup und Satzinfos geht, dass
man damit zB auch html oder postscript generieren kann. Insgesamt
verstehe ich die genaueren Zusammenhänge allerdings kein Stück.

Mein bisheriger Versuch war, das Posctscript als PDF zu konvertieren und
per Mail an meinalias_at_kindle.com zu schicken. Das kommt auch an und kann
angezeigt werden, wahlweise in lesbarer Schrift oder auf einer Seite
oder kurz: PDF in A4 will man nicht auf einem solchen Display lesen!

Nun bietet amazon ein tool, mit dem man (vereinfachtes html) in das
proprietäre kindle-Format konvertieren kann. Dabei werden Absätze,
Listen etc nachher ordentlich dargestellt und es gibt auch ein nutzbares
TOC. 

Der HTML-Output von http://www.freebsd.org/cgi/man.cgi ist scheinbar
nicht dazu geeignet.

Mein Ansatz wäre jetzt folgender: Für manpages ist PDF schon ganz okay,
wenn man groff irgendwie mitteilen kann, dass es A5 oder ein
vergleichbares Seitenformat verwenden soll. Dann werden im PDF die
Dokumentstrukturen ordentlich gerendert *und* es ist auf dem
kindle Display lesbar ohne Augenkrebs davon zu bekommen.

Finde ich aber alles nicht sonderlich angenehm, denn die Manpages liegen
in einem Format vor, dass letztlich optimal für das jeweilige
Ausgabemedium gerendert werden kann, unter Berücksichtigung von
Überschriften, Absätzen, Seitenzahlen, etc. Vor Allem aber ohne
hässliche Umbrüche wie man sie im Usenet auch als "Kammquoting" kennt.

Es wird also darauf hinauslaufen, die manpage-Sourcen (troff?) durch
geschickte Aneinanderreihung von Tools (troff, groff, <...html...>, 
kindlegen) in mehr oder weniger native kindle ebooks zu konvertieren. 

Der erste Versuch wäre, die ManPages in html 2.0 zu konvertieren und dann
weiter in das kindle-Format. 

* Wie erzeuge ich aus manpage-sourcen html Version 2.0? -T html sieht
  schlimm aus, der html-Output enthält keinerlei Absatzformatierung.

* Ein Umweg via DVI/TeX ...

zcat /usr/share/man/man5/rc.conf.5.gz | troff -Tdvi | grodvi -pA5

... wobei ich hier mit "-pA5" das Papierformat bereits angebe. Das wäre
dann Richtung PS/PDF. Komme ich von DVI irgendwie zu sinnvollem html?

Wer kennt bessere Alternativen oder Ansätze zur Konvertierung von
troff-sourcen in ein kindle-taugliches format?

Gruß
Raphael
--  
Raphael Eiselstein <rabe@uugrn.org>               http://rabe.uugrn.org/
xmpp:freibyter@gmx.de  | https://www.xing.com/profile/Raphael_Eiselstein   
GnuPG:                E7B2 1D66 3AF2 EDC7 9828  6D7A 9CDA 3E7B 10CA 9F2D
.........|.........|.........|.........|.........|.........|.........|..


-- 
UUGRN e.V. http://www.uugrn.org/
http://mailman.uugrn.org/mailman/listinfo/uugrn
Wiki: https://wiki.uugrn.org/UUGRN:Mailingliste
Archiv: http://lists.uugrn.org/

Empfangen am 02.01.2012

Dieses Archiv wurde generiert von hypermail 2.2.0 : 02.01.2012 CET