Installatie en configuratie van LaTeX op Windows 7 in functie van pandoc

Installatie pandoc

Bij de installatie van pandoc werden weinig problemen gemeld. Voor windows is er een installer op de download pagina van pandoc.

De gedownloade installer zal de verschillende onderdelen van pandoc op de juiste plaats zetten.

Te onthouden is dat er regelmatig updates en bugfixes beschikbaar komen. Het kan handig zijn om die af en toe te bekijken.

Ook te onthouden/ter herinnering is dat applicaties bestemd voor de commandolijn niet openen door er op te klikken in bijvoorbeeld Windows Explorer, maar wel vanaf ... de commandolijn interface. Over de mogelijke Command-line-interfaces op Windows hadden we het in een eerdere howto.

Installatie en configuratie LaTeX voor pdf output

Conversies met pandoc van markdown naar html, MediaWiki markup, docx, odt, epub .. lijken doorgaans vlekkeloos te verlopen.[^1] De problemen dienen zich aan bij het converteren naar pdf; meer specifiek bij de installatie en configuratie van LaTeX, een opmaaksysteem voor wetenschappelijke teksten onderliggend gebruikt door Pandoc om pdf-bestanden te genereren..

De gerapporteerde problemen doen zich voor op twee niveau's:

  1. installatie, configuratie en updates van MiKTeX (het op pandoc.org aangeraden LaTeX-programma voor Windows)
  2. output van documenten die Japans bevatten (en/of macrons, geaccentueerde Latijnse letters)

Welke LaTeX?

Er zijn een aantal alternatieven voor LaTeX, zowel voor Windows als Mac OS X. Op pandoc.org worden respectievelijk MiKTeX en BasicTeX aanbevolen, vermoedelijk om bandbreedte en schijfruimte te besparen. Deze beide installeren namelijk enkel de basis, extra benodigde functionaliteit wordt achteraf apart toegevoegd (via de MiKTeX Package Manager bijvoorbeeld). Dat is een verdedigbare aanpak, maar die veronderstelt wel dat de gebruiker weet welke extra pakketten nodig zijn.

Het alternatief is texlive (windows) of MacTeX (Mac OS X) te gebruiken. Daarin zit alle functionaliteit, maar beide zijn meer dan 2G groot.

Voor deze tutorial heb ik (in eerste instantie) MiKTeX op Windows 7 geïnstalleerd (in een Virtual Box).

Het installatieprogramma downloaden en opstarten:

De installatie duurt een hele tijd, maar resulteert uiteindelijk in een bruikbare installatie.

Tenminste, bruikbaar voor bestanden zonder Japans, een pdf mét Japanse tekens genereren mislukt met

een foutboodschap:

Unicode ... not set up for use with LaTeX.

en een tip:

try running pandoc with --latex-engine=xelatex

Weergave Japans configureren

XeLaTeX geeft de mogelijkheid om externe fonts of fonts beschikbaar binnen je OS te importeren. Er is een Japanse font nodig om Japans te kunnen weergeven. Standaard zit dat niet in MiKTeX.

Bij de sessie rond duurzaam auteurschap bekeken we al kort hoe je het pandoc sjabloon kan aanpassen voor Japans. Samengevat kan dat in drie stappen

  1. zet het standaard pandoc sjabloon om naar een bestand:

$ pandoc -D latex > pandoc.template

  1. editeer dat bestand (pandoc.template dus) door regel 23 en 24 aan te passen. Het hoeft niet MS Mincho te zijn, je kiest een Japanse font op je toestel.
\else % if luatex or xelatex
  \ifxetex
    \usepackage{mathspec}
    \usepackage{xltxtra,xunicode,fontspec,xeCJK}
  \setCJKmainfont{MS Mincho}

wordt

  1. genereer de pdf, met als optie het aangepaste bestand

$ pandoc -o outputbestandsnaam.pdf --latex-engine=xelatex --template=pandoc.template inputbestandsnaam.md

![](http://hc.ulyssis.be/assets/20160411-mdg16-pandoc_template3.png)

Troubleshooting

Bovenstaande stappen zouden moeten volstaan om een pdf met Japans erin te genereren, maar de vele vragen van windowsgebruikers suggereren dat het niet altijd zo simpel is. Ook niet bij deze installatie:

Opnieuw een foutboodschap:

package l3kernel too old

Wat te oud is moet je updaten, bovendien heeft tex.stackexchange een aantal berichten waarin aangegeven wordt dat dit probleem van de baan is met een meer recente MiKTeX versie. Met 'Update MiKTeX' kunnen we die update doen:

En daar liep de test vast, onmogelijk om een verbinding te leggen met een 'package repository' en dus onmogelijk om de update te doen. Zonder begrijpelijke foutboodschappen overigens. Stuck.

De oplossing was ... een dagje wachten. Achtergrondinformatie is alweer op tex.stackexchange te vinden maar waar het op neerkomt is dat alle verzoeken naar MiKTeX repo's vanuit de KU Leuven blijkbaar vanaf hetzelfde IP-adres vertrekken, wat het verkeer nogal eens doet vastlopen.

Na een dagje wachten verliep de update vlotjes en resulteerde

in

Extra

  • LaTeX gebruiken we normaliter niet rechtstreeks in onze workflow. Wie toch geïnteresseerd is in een degelijke handleiding zal die vinden in de documentatie van ShareLaTeX, een online LaTeX editor. (het stuk over support voor Japans bij wijze van voorbeeld).
  • Om "een dagje wachten" te vermijden zou men, zoals hoger vermeld, de volledige pakketten kunnen installeren. Ulyssis biedt daarvoor een ftp-site aan, downloaden kan van daar zonder dat er twee gigabyte van de kotnetlimiet af gaan. Maar het blijft wel 2G schijfruimte, een optie die vooral aangewezen is bij frequent gebruik van LaTeX.

  • Vraag pagina-einde:

Hoe kan ik in markdown een pagina-einde aangeven om een pagina verdeling te hebben in PDF-formaat?

Hiervoor dienen de LaTeX tags \newpage en \pagebreak. Die kunnen rechtstreeks op de gewenste plaats in het markdown bestand opgenomen worden. (bron)

  • Vraag TOC:

Hoe kan ik de inhoudstafel in markdown correct maken en deftig resultaat verkrijgen in PDF-formaat?

Geef de optie --tocmee aan het pandoc-commando:

$ pandoc --toc -o output.pdf input.md

  • Vraag uitlijning beelden:

Hoe zorg ik er voor dat beelden op de gewenste plaats tussen de tekst komen te staan?

Dit vraagt nog wat meer testen, maar ook hier zal een aanpassing van het standaard pandoc sjabloon bij komen kijken.

  • Voor een vollediger remake van voornoemde standaard pandoc sjabloon verwijzen we door naar Stevie Poppe's tutorial. [^2]

[^1]: Check de observaties rond mediawiki markup en pandoc op het Japanse Studies lab

[^2]: Poppe, Stevie. “Tutorial - Sublime-Text, Miktex, En Meer!” Japanologie Lab, April 3, 2016.

Feedback 1 individuele oefeningen | Refereren Japanse bronnen

Algemene opmerkingen eerste drafts

  • everything looks like a failure in the middle
  • scheiden workflow en inhoud (cfr. doelstellingen inleiding)
  • onderzoeksvraag formuleren problematisch
  • welk referentiesysteem doorgaans?
  • markdown naar pdf howto
  • markdown table converter tool
  • feedback vóór paasvakantie geen goed idee?
  • coggle blijkbaar handig
  • "invloed" is een te vage term om op te nemen in een onderzoeksvraag

Kies een verwijzingssysteem

  • Preferences --> Export --> Bibliographical styles
  • we hebben een voorkeur voor Chicago A of B
  • vermeld die keuze ook in je inleiding van je paper

Verwijzen naar Japanse bronnen

  • voor de meeste courante types bronnen kan je de voorbeelden in de richtlijnen_verhandeling-3.3 gebruiken (paragraaf 2.9, vanaf p. 27). Daar wordt per type bron twee voorbeelden in CA en CB gegeven, telkens een Japanse en niet-Japanse bron, bijvoorbeeld:

  • types bronnen die je daar niet in vindt, heb je mogelijk wel in
    • het MLZbook (voor digitale types), cfr infra
    • de Monumenta Niponnica stylesheet (voor klassieke types), cfr. infra

MLZ

youtube intro

MLZ proofsheets

proofsheets for each Zotero item type in each of the styles in the MLZ family.

mlzbook

Bennett, Frank G. 2013. Citations: Out of the Box.

Monumenta Nipponica stylesheet

Een pdf-bestand dat 31 A4-tjes telt, iets groter dus dan het woord stylesheet doet vermoeden. Het volgt grotendeels de 14e editie van de Chicago Manual of Style en bestaat uit drie delen: algemene richtlijnen (voor het indienen van een artikel ter publicatie), stylistische conventies en een deel over bibliografische verwijzingen.

  • Deel 1 doet even glimlachen waar gesproken wordt over Digital (Computer Disk) Versions of Manuscripts, verder is het een behoorlijk droog document dat vooral voor onderzoek waarbij veel Japanse bronnen gebruikt worden waardevol zal blijken.
  • Deel 2 behandelt het gebruik van macrons en verbindingstekens naast de correcte weergave van de namen van religieuze instituten, persoonlijke titels, historische periodes, oorlogen, titels van gedichten etc.
  • Deel 3 stelt de fijne kantjes van het (hybride) verwijzingssysteem van MN voor. Refereren naar Frequently Cited Series, zenshū, gedichten uit belangrijke bundels… Kortom, alles waar je nooit had kunnen aan denken om te vragen.

Aanvullende voorbeelden DDC

  • Gebaseerd op Monumenta Nipponica
  • Er zijn een aantal verschillen met de hoger aangehaalde richtlijnen verhandeling:
    • geen haakjes gebruikt
    • transcriptie komt vóór de kanji/kana te staan
    • basisregel: kies zelf maar wees consequent

Formats: Noot vs referentielijst

Volledige noot:

Newton N. Minow and Craig L. LaMay, Inside the Presidential Debates: Their Improbable Past and Promising Future (Chicago: University of Chicago Press, 2008), pp. 24–25.

Bekorte noot:

Minow and LaMay, Presidential Debates, p. 138. of Minow and LaMay 2008, p. 138.

In referentielijst:

Minow, Newton N., and Craig L. LaMay. Inside the Presidential Debates: Their Improbable Past and Promising Future. Chicago: University of Chicago Press, 2008.

Andere voorbeelden (referentielijst-format)

Artikel

Ashida Kōichi 芦田耕一. "Fujiwara no Takamitsu ni okeru Yokawa to Tōnomine no ichi" 藤原高光における横川と多武峰の位置. Kokugo to kokubungaku 国語と国文学 57:6 (1980), pp. 12–27.

Recensie

Köhn, Stephan. Recensie van Adam Kern, Manga from the Floating World: Comicbook Culture and the Kibyōshi of Edo Japan. MN 62:2 (Zomer 2007), pp. 235–37.

Afstudeerscriptie

Balis, Thomas. "De maatschappelijke discussie omtrent geweld in populaire cultuur: Videogames, manga en anime." Masterproef, Japanologie, KU Leuven, 2008.

Krantenartikel

Asahi shinbun (Osaka). "Kanseido takai kokusan no kyodai kagami" 完成度高い国産の巨大鏡. 27 februari 1996.

Vertaalwerk: a) fictie (nadruk op vertaler)

Segawa Seigle, Cecilia, vert. The Family, door Shimazaki Tōson. University of Tokyo Press, 1976.

Vertaalwerk: b) non-fictie (nadruk op orig. auteur)

Maruyama Masao. Studies in the Intellectual History of Tokugawa Japan, vert. Hane Mikiso. University of Tokyo Press, 1974.

E-bronnen en online media

E-Book / boek op CD-rom

Austen, Jane. Pride and Prejudice. Londen: T. Egerton, 1813. Herdruk, New York: Penguin Classics, 2008. PDF e-book.

Hicks, Rodney J. Nuclear Medicine: From the Center of Our Universe. Victoria, Austral.: ICE T Multimedia, 1996. CD-ROM.

Website

Saikō Saibansho, Sanshōhōtei 最高裁判所、三小法廷. "Kokuyū keidaichi jōyo shinsei fukyoka shobun torikeshi seikyū jiken" 国有境内地譲与申請不許可処分取消請求事件. Geplaatst op LEX/DB-internetsite, http://www.tkclex.ne.jp. Geraadpleegd op 19 mei 2003.

Youtube

"HOROWITZ AT CARNEGIE HALL 2-Chopin Nocturne in Fm Op.55," YouTube-video, 5:53, van een door CBS op 22 september 1968 op tv uitgezonden concert, geplaatst door “hubanj,” 9 januari 2009, http://www.youtube.com/watch?v=cDVBtuWkMS8.

Twitter (voetnoot-format)

Garrett Kiely, Twitter-bericht, 14 september 2011, 8:50 a.m., http://twitter.com/gkiely.

Facebook-pagina

Barack Obama’s Facebook-pagina, geraadpleegd op 19 juli 2008, http://www.facebook.com/barackobama.

Meer achtergrond en voorbeelden:

http://www.chicagomanualofstyle.org/16/ch14/

Blogopdracht informatiekunde 2

Schrijf een blogreeks over een onderwerp waarover je eerder bronnen hebt verzameld (cfr. opdrachten bij de module 'Omgaan met data'). Showcase met deze blogs je verworven html & css vaardigheden.

Waarom bloggen

  • "reflective practice"
  • leren al doende
  • leren schrijven in moderne formaten
  • angst voor code aanpakken

Wat bloggen

  • concepten becommentariëren
  • je iets afvragen
  • bespreken gevonden bronnen
  • doorlinken/denken vanuit gedane research
  • technische tips
  • tutorial / handleiding
  • wat is een 'reeks'?

Vereisten van het blog formaat

Inhoudelijk

  1. Verzorg je taalgebruik
  2. Wie is je publiek? Medestudenten? Vulgariserend? ... beslis zelf, maar wees consequent
  3. Bronvermeldingen bij voorkeur in de vorm van hyperlinks in de tekst
  4. Gebruik witruimte (belangrijk voor de leesbaarheid)
  5. Why You Shouldn’t Write Your Posts Using Word. Geldt a fortiori voor het plakken van html-code.
  6. Kies goeie titels (tenminste als je gelezen wil worden)
  7. Kies je onderwerp niet te breed. We zullen hier voornamelijk redelijk technische blogs hebben, of minstens met een technische component. Focus per blog op één vraag die je wil oplossen.
  8. Link! Een blog is een internetformaat, daar horen hyperlinks bij.
  9. Probeer een teaser aan je blog toe te voegen: catchy titel, filmpje, beeld, citaat ...

Bekijk ter inspiratie alvast de voorbeelden op de publicateruimte van informatiekunde.

Technisch

Hoe evalueren we html en css vaardigheden?

HTML

Toon met je blogberichten dat je weet hoe in html de volgende types tags te gebruiken (voorbeelden zijn niet exhaustief):

  1. Tekst tags ( pre, h1-5, em )
  2. Link tags (hyperlinks, image-links, a tag)
  3. Structuur (paragraaf, nieuwe lijn, citaat, lijsten, lijn)
  4. Beelden en video (img, iframe)
  5. Formulieren ( form, input )

CSS

Toon in je blogberichten aan dat je de weergave van een html-bestand kan controleren met css-regels. Maak minimaal gebruik van volgende css-elementen en -eigenschappen:

  • CSS meeteenheden (absolute zowel als relatieve)
  • 'class' en 'ID' css attributen
  • 'span' en 'div' elementen
  • font
  • color en background
  • text
  • box
  • width, height, float, clear
  • position, visibility, overflow, z-index

Tips (Feedback november)

Search & Research

Zoals in de inleiding al aangegeven veronderstellen we dat je dit onder de knie hebt:search matome geschiedenis van japan. Dat 'onder de knie hebben' moet ook blijken uit je individuele log.

Hierop bouwen we verder: van losse technieken naar een gestroomlijnde zoekstrategie in functie van een onderzoeksproject.

Elementen van een zoekstrategie

Trefwoorden

Trefwoorden verdienen speciale aandacht, die bepalen namelijk voor een groot stuk de kwaliteit van je zoekresultaten. - visualiseer ze in een mindmap - documenteer de evolutie in de loop van je onderzoek - gebruik databanken en sociale media om trefwoorden te vinden (jacar, cinii, pinterest, twitter)

Leesfiches

  • een noteer-strategie hoort daar ook bij, je verzamelt geen bronnen, maar nota's
  • maak daarom zo snel mogelijk een outline van je werkstuk zodat je notas kan kaderen
  • hoe je veel informatie kan verwerken zonder alles te lezen behandelen we volgende week

Begin

  • doe eerst een rechtlijnige search via zoekmachines en databanken
  • dan verder zoeken via de literatuurlijst van gevonden bronnen
  • vergeet niet in de toekomst te zoeken
  • identificeer sleutelbronnen en auteurs

Opdrachten

  • trefwoorden: welke en waarom die, begin een mindmap
  • maak een lijst van de search-engines en databases die je zal gebruiken, motiveer

Windows en de commandolijn

De commandolijn is nog steeds de snelste manier om met een computer te interageren. En voor de pandoc tekstconversie tool uit de eerdere sessie "duurzaam auteurschap" is die zelfs noodzakelijk.

Recente versies van het Windows OS komen met twee CLI applicaties uit de doos: Powershell en Command Prompt. Die zijn bruikbaar, maar qua mogelijkheden en look & feel toch redelijk beperkt, vergeleken met wat bij een unix-gebaseerd OS in de doos zit.

Om dat te remediëren kan je volledige omgevingen installeren die de unix commandolijn en shell emuleren op windows. Dat gaan we niet doen.

Maar misschien wel iets tussen de twee: de Git Bash applicatie, een onderdeel van Git voor windows, emuleert een volledige unix-stijl shell/commandolijn op Windows, met dezelfde commando's die je terugvindt op Linux of Mac OSX.

Commando's? Met een handvol kan je volstaan en de rest kan je makkelijk opzoeken. Hieronder een niet-exhaustief lijstje om je op weg te helpen, er zijn veel plaatsen waar je een vollediger cheatsheet kan vinden (op cheatography.com of cheat-sheets.org bijvoorbeeld).

Info over het gebruik van onderstaande commando's krijg je via een ander commando: man. Dus informatie over het commando head krijg je via $ man head.

  • bewegen tussen bestanden en folders: pwd, cd, ls
  • bestanden bekijken: cat, less, head, tail, diff
  • werken met bestanden: wc, tr, sort, uniq, cp, mv, rm, mkdir
  • zoeken: grep, find
  • history geeft een overzicht van de commando's die je hebt ingevoerd
  • gebruik tab completion om efficiënter te werken

Dezelfde commandolijn komt overigens terug tegen in sessie 10 (data- en tekst-analyse).

O ja, nog twee kleine tips: applicaties bestemd voor de commandolijn open je niet door er op te klikken - zoals gewend, maar wel vanaf ... de commandolijn. En het $ teken staat voor de commandoprompt, dat typ je zelf niet in.