woensdag 2 december 2009

Een tekst in PDF omzetten en vertalen

Afbeelding van logo website ScannedPDFtoWordHet gebeurt mij nogal eens dat ik een pdf-document dat ik heb moet omzetten naar Word. Soms omdat ik een document van iemand anders heb waarvan ik delen wil gebruiken in een ander document en soms ook omdat een document zelf heb opgeslagen als pdf en vervolgens het originele Word-document ben kwijt geraakt. Stom natuurlijk, maar ja: ook oud-bibliothecarissen verliezen wel eens wat ;-)

Als je programma's als Acrobat writer of PDF converter op je p.c. hebt staan zijn dit soort documenten met één druk op de knop om te zetten naar Word. Maar die software is behoorlijk kostbaar, zeker als je er niet zo heel veel gebruik van maakt. Gelukkig zijn er ook minder kostbare alternatieven. Ik maak zelf gebruik van de website ScannedPDFtoWord. Ik ben er erg enthousiast over: je upload het pdf-bestand en je geeft aan op welk e-mailadres je een berichtje wilt krijgen als het bestand geconverteerd is. Het uploaden duurt meestal (aanzienlijk) langer dan het omzetten: als het bestand binnen is gehaald heb je binnen no time een berichtje in je mailbox waar je het geconverteerde bestand kunt downloaden. Het bestand blijft 24 uur online staan, dus je moet het wel direct ophalen en de vormgeving van het oorspronkelijke document blijft over het algemeen prima behouden. Erg handig.

Ook handig voor leerlingen/studenten die moeite hebben om teksten in een vreemde taal te lezen: als je het pdf-bestand hebt omgezet naar Word, kan je het vervolgens inladen in de Google Translate Toolkit. Je hebt voor het gebruik van die toolkit wel een Google account nodig. Je kunt de tekst dan laten vertalen in de taal die je wilt (van Afrikaans tot Zweeds, en - gelukkig - ook Nederlands). Het resultaat wordt direct in je directory van Google Docs gezet: op de linkerkant van het scherm zie je dan de originele tekst; rechts zie je het vertaalde document waarin je kunt aanpassen wat je wilt. Dat is wel nodig want de Google Translate Toolkit geeft een machine-vertaling en die is verre van perfect. Maar het geeft wel een globale indruk van wat er staat en het is een lekker steuntje in de rug voor als je een tekst wilt lezen maar de taal net niet voldoende beheerst.

Met de combinatie van deze tools (ScannedPDFtoWord en Google Translate Toolkit) heb ik al vaak iemand een steuntje in de rug kunnen bieden!

7 opmerkingen:

Henk Heurter zei

Dag Margreet,

Ik zet tekst vanuit een pdf meestal om met kopiëren - plakken. Gaat heel snel. Enige nadeel is dat je de harde regeleinden moet verwijderen, maar met een niet te lange tekst is dat geen probleem. Ik gebruikte laatst www.pdftoword.com en kreeg twee dagen! later een mailtje dat mijn bestand was omgezet naar Word.

Hartelijke groet,
Henk Heurter

m2cm zei

@Henk,
Kopiëren en plakken lukt inderdaad wel, maar voor lange teksten (en dan heb ik het over artikelen van 10 - 20 pagina's, is het heel vervelend. Met de tool die ik gebruik, Scannedpdftoword kost het omzetten van zo'n artikel me hooguit een paar minuten; aanzienlijk minder dan het verwijderen van regeleinden, weer aanmaken van bullets, het weer knippen en plakken van plaatjes, enz. Maar als dit voor jou de handigste manier is dan moet je het zeker zo houden. Dat is het fijne van computers: er zijn veel weten die naar Rome leiden ;-)

Wilma van den Brink zei

Wat een handige tip: http://www.scannedpdftoword.com/
Heb de site snel bij mijn favorieten op Mypip.nl gezet en doorgetwitterd via JeBibliotheek. Bedankt Margreet!

Groeten van Wilma

m2cm zei

@Wilma,
Graag gedaan!

André zei

Ik heb het begin van je tweede alinea naar het Frans laten vertalen. resultaat:
Si votre programme comme Acrobat Writer ou PDF Converter sur votre PC, vous serez inspirés ces documents avec la pression d'un bouton pour convertir vers Word.

Knappe Fransman die hier iets van kan maken. Ondanks dat je merkt dat er langzaam voortgang wordt geboekt op het terrein van automatisch vertalen, blijft het toch nog mensenwerk om er echt betekenis aan te geven. Het is zo jammer dat Google (en anderen)bij dit soort functionaliteiten ('tools') de indruk wekken dat het al volledig correct werkt. Met name scholieren denken dat ben ik bang. "Als het van Google is, is het goed" denken ze waarschijnlijk. Kortom, je le prends provisoirement avec une graine de sel et attends calmement que Google me apporte. ;-)

André zei

ook een ardige site voor diverse conversies: zamzar.com

m2cm zei

@André,
Ik ben het met je eens dat de vertaling van deze alinea niet echt iets oplevert. De tekst is daarvoor te kort. Als je een heel artikel vertaalt heb je er wel wat aan: je kunt dan de grote lijnen er als regel goed uithalen. Voor als je een taal niet of bijna niet beheerst erg makkelijk. Maar het blijft inderdaad nog altijd behelpen. Het leuke van Google is dan weer wel dat als je een betere vertaling weet, je die kunt toevoegen aan de database. Daar wordt de vertaalmachine van Google natuurlijk beter van maar dat is voor de gebruikers natuurlijk ook prettig.

Wat betreft Zamzar: ik gebruikte die site al heel vaak voor het omzetten van films. Ik heb me nooit gerealiseerd dat je daarmee ook pdf'jes kunt omzetten. Ga ik gauw eens proberen. Dank voor de tip! Of moet ik zeggen: merci pour l'astuce? ;-)