Le format PDF, ce n'est que du papier à l'écran. Et, donc, très difficile à manipuler. Sous Linux, si l'application XPDF est installée (urpmi xpdf), vous pouvez très facilement convertir vos fichiers PDF en format TXT. Il suffit, en ligne de commande, de lancer : pdftotext FichierOrigine.pdf FichierSortie.txt, et le tour est joué. N'oubliez pas pdftotext --help pour quelques options intéressantes.
Exercice : Essayez la commande sur le PDF du MELS !