Wydobywanie tekstu z zabezpieczonego PDFa
Dzisiaj musiałem z pewnego PDFa wyciągnąć tekst, który był mi potrzebny. Normalnie to wystarczy, że w KPDF zaznaczę tekst i wybieram "kopiuj tekst do schowka" i po sprawie. Jednak skoro dokument jest zabezpieczony, a ja nie mogę kopiować jego zawartości to co zrobić ?
Sprawa jest całkiem prosta. Wystarczy, że otworzysz tego PDFa i wydrukujesz to pliku PDF (paczka "cups-pdf" pod Ubuntu). Ale zaraz, PDFa drukować do PDFa? Tak! Kawał polega na tym, że zostanie zapisana dokładna kopia dokumentu, z tą różnicą, że nie będzie już zabezpieczeń. Po tej malutkiej sztuczce mogłem moim KPDF kopiować tekst z "wydrukowanego" pliku. Jedynym problemem było to, że część materiału w oryginalnym dokumencie było już zapisane jako obrazek i tego już nie szło zapisać jako tekst ;-) (ok, dałoby radę gdybym użył jakiegoś OCR, ale nie o tym mowa ;p )
Komentarze
Disclaimer
Jakkolwiek jestem właścicielem tego bloga, nie ponoszę odpowiedzialności za kometarze napisane przez innych obywateli tego wolnego kraju.
Zastrzegam sobie prawo do kasowania/modyfikowania komentarzy (jeśli uznam to za stosowne).
#1
To już kiedyś było… http://ja-joanna.jogger.pl/2006/11/01/zabezpieczenia-pliku-pdf-i-drukowanie-kilku-stron-na-jednej/
Michał Górny | #
#2
ech.. i jak zwykle dowiaduję się, że coś takiego już było.. :/
radmen | #
#3
Drukowanie przez CUPSa ma taką wadę, że pójdzie poprzez PostScript i potem spowrotem przez Ghostscripta do PDF. Często powoduje to przyrost objętości x10.
btw. Zabezpieczanie PDF-ów jest głupie, ale to już wiemy, nie? ;]
jpc | #
#4
Radek, szmato, w koncu mozna komentowac bez logowania :D
macholl | #
#5
Macholl, cipqo można już od dawna, ale te Twoje głupoty będę po prostu kasować :]
radmen | #
#6
Witam, a czy jest mozliwe wydobycie obrazkow z zabezpieczonego pdf’a ?!
Jedras | #