Iedereen gebruikt het, elke computer of elk besturingssysteem kan het weergeven, en het is gemakkelijk per e-mail te versturen zonder de inbox van je ontvanger vol te proppen. We hebben het over pdf, een bestandsformaat dat zo populair is dat het in de huidige digitale wereld moeilijk te vermijden is. Waarom zijn vertalers dan geen grote fan van het pdf-formaat?

Dtp-specialisten werken graag met pdf, omdat ze er bestanden van hoge kwaliteit mee kunnen comprimeren tot een relatief klein formaat. Salesmensen zijn er zeker van dat pdf hun contracten of offertes precies zo toont zoals ze bedoeld zijn voor de ontvanger. En juristen gebruiken pdf als een veilig platform om vertrouwelijke informatie uit te wisselen.

Maar vertalers? Geen grote pdf-fans.

Wat doen vertalers met een pdf?

Bij Yamagata importeren we editeerbare bestanden zoals MS Excel, MS Word of idml (Adobe InDesign) in onze vertaalsoftware. Met die software kunnen we vertaalde tekst invoegen in de originele lay-out op exact dezelfde plaats als in de brontekst. Zo vermijden we manueel copy-paste werk en beperken we het dtp-werk na de vertaling tot een minimum. Een pdf kunnen we echter niet importeren, omdat het een statisch, niet editeerbaar formaat is.

Er zijn wel workarounds die ons toegang geven tot de tekst in een pdf. Maar die methodes vergen altijd extra inspanning, tijd en geld, afhankelijk van hoe de pdf is gemaakt.

Zo kunnen we pdf-documenten voorbereiden voor vertaling:

  • Copy-paste: Als het brondocument niet is gescand en als het geen of weinig afbeeldingen of tabellen bevat, dan is het relatief eenvoudig om de tekst te selecteren en te copy-pasten in een editeerbaar formaat. Het is wel mogelijk dat je het document hier en daar manueel moet bijwerken om er zeker van te zijn dat de lay-out overeenkomt met het origineel.
  • Converteren vanuit de pdf-editor: Afhankelijk van de pdf-editor die je gebruikt, is het mogelijk om sommige pdf-bestanden te converteren naar .txt of .docx. Een pdf gemaakt van een Adobe InDesign of Word-document is gemakkelijker te converteren naar iets dat editeerbaar is dan bijvoorbeeld een gescande schriftelijke brief. Maar ook hier kunnen complexe lay-outs, inclusief afbeeldingen of tabellen, het resultaat beïnvloeden of zelfs bepaalde tekstdelen ongeconverteerd laten. Daarom zal er extra werk van een dtp-specialist nodig zijn om de lay-out op punt te zetten.
  • Optical Character Recognition (OCR): Als je documenten hebt gescand, kan de OCR-software alle informatie uit de afbeelding halen en in een gemakkelijk bewerkbaar tekstformaat omzetten. Let wel dat de kwaliteit van de conversie afhankelijk is van de kwaliteit en resolutie van het gescande document.

Een pdf laten vertalen? Ja, maar liever niet.

Kortom, pdf’s zijn niet editeerbaar en afhankelijk van hoe ze zijn gemaakt, zal het extraheren van de tekst uit een pdf-document enige tijd en moeite kosten. Indien mogelijk vragen wij onze klanten altijd om het bronbestand samen met de pdf mee te sturen. Bekijk alvast eens deze blogpost om te weten welk bestandsformaat het meest geschikt is voor jouw vertaler. Als je het bronbestand niet hebt, laat dan je vertaler weten hoe de pdf is gemaakt. Dat helpt om de beste manier te vinden om de te vertalen content te extraheren.

Vragen over vertalen van pdf-bestanden? Laat het ons weten: we helpen je zoeken naar de meest tijd- en kostenefficiënte oplossing.