VroniPlag Wiki

This Wiki is best viewed in Firefox with Adblock plus extension.

MEHR ERFAHREN

VroniPlag Wiki

Die XML-Ausgabe der letzten VersionXML-Ausgabe der letzten Version ist leider etwas schwer lesbar. Praktischer wäre vielleicht eine Ausgabe in html.

Anstatt jetzt aber ein Stylesheet zu erstellen, was gleichzeitig die Links extrahiert und eine html-Ausgabe erzeugt, nutze ich wieder die Möglichkeit, Befehle über eine pipe ("|") miteinander zu verketten.

pdftohtml -i -stdout -hidden -xml DATEI.pdf | saxonb-xslt -s:-  extractlinks.xsl | saxonb-xslt -s:- converttohtml.xsl > DATEI.html

Im Prinzip ist es dieselbe Kommandozeile wie beim letzten Mal, die einzigen Unterschiede sind

  • Wegfall von "sed", da ich mittlerweile die von pdftohtml verwendete dtd gefunden habe
  • ein zusätzlicher pipe-Operator, der noch einmal den xslt-Prozessor mit einem neuen Stylesheet aufruft

converttohtml.xsl[]

Das Stylesheet erzeugt ein Inhaltsverzeichnis, und hebt die versteckten Linktext farbig, und die Linkziele (href-Attribute) zusätzlich in fett hervor.

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
  <xsl:output method="html" indent="yes"/>
  <xsl:template match="@*|node()">
    <html>
      <head>
          </head>
      <body>
        <h1>Table of contents</h1>
        <ol>
          <xsl:apply-templates select="page" mode="toc"/>
        </ol>
        <!-- <xsl:apply-templates select="page"/>-->
        <xsl:apply-templates/>
      </body>
    </html>
  </xsl:template>
  <xsl:template match="page">
    <h2>
      <a name="#{generate-id()}">Page <xsl:value-of select="@number"/>
            </a>
    </h2>
    <xsl:apply-templates/>
  </xsl:template>
  <xsl:template match="page" mode="toc">
    <li>
      <a href="#{generate-id()}">Page <xsl:value-of select="@number"/></a>
    </li>
  </xsl:template>
  <xsl:template match="a">
    <font color="blue">
      <xsl:value-of select="."/>
      <b>
        <xsl:value-of select="@href"/>
      </b>
    </font>
  </xsl:template>
  <xsl:template match="text">
    <xsl:apply-templates select="a"/>
    <xsl:value-of select="."/>
  </xsl:template>
</xsl:stylesheet>


Ergebnis[]

[Ausgabe ist gekürzt]

Table of contents[]

Page 49

Page 65

Page 49[]

[...] Kolmogorov-Smirnov Test Kruskal-Wallis Test Mann-Whitney Test einfaktorielle ANOVA Post-Hoc-Tests i Stichproben http://www.pflegewiki.de/wiki/Stichprobe1. Der Kolmogorov-Smirnov-Test untersucht, ob zwei Stichproben (Datenreihen) aus derselben Verteilung stammen. Üblicherweise wird er auch angewendet, um zu normal verteilt http://www.pflegewiki.de/wiki/Normalverteilttesten, [...]

Page 65[]

Wasser oder Alkohol stellen für den Haftverbund auf Grund seiner funktionellen Hydroxylgruppe http://de.wikipedia.org/wiki/Hydroxylgruppe Hydroxylgruppe [...]