Ce billet est une traduction libre de l'article : Productive Monday: htmldoc - HTML to PS/PDF Converter écrit par Chris Tyler.

htmldoc

htmldoc est un petit programme simple à l'usage, mais néanmoins puissant, de conversion de pages HTML en fichiers PostScript ou PDF. Il permet en outre la fusion de plusieurs pages HTML en une seule, ainsi que l'ajout d'une table des matières et d'un index à un document HTML. Une application parmi d'autres de ce programme est ainsi la sauvegardes de manuels en ligne en PDF, plus faciles à consulter et à imprimer sous cette forme.

Il se présente sous la forme d'une interface graphique, dans laquelle on pourra spécifier soit un fichier local, soit une URL à traiter. Il peut cependant être lancé en ligne de commande comme « filtre » dans un traitement batch de documents, tel que dans l'exemple suivant :

$ echo "<html><body><h1>Heading</h1><p>Some HTML output...</p></body></html>" | htmldoc --format ps3 --bodyfont Helvetica --header ... --footer ... --webpage - | lpr

htmldoc supportant les tables ainsi que les images, on pourrait envisager aisément la mise en place d'un système de génération de documents à la volée, tels que des factures, déclarations et autres rapports illustrés. À partir de simples fichiers texte, traités en batch (sur le modèle de l'exemple précédent) à l'aide de sed, awk ou encore perl, on pourrait ainsi produire des sorties HTML lus par htmldoc pour conversion en PostScript ou impression directe.

À noter que ce programme est développé par la société Easy Software Products, également à l'origine de CUPS, le système d'impression livré sous Fedora.

Installation en ligne de commande : yum install htmldoc

Installation depuis le gestionnaire de paquetages graphique : Applications → Bureautique → htmldoc

Entrée dans le menu : Applications → Bureautique → HTMLDOC

Commande : /usr/bin/htmldoc

Site du projet : http://www.htmldoc.org/