Trên thực tế, File PDF là một trong những phương tiện truyền thông kỹ thuật số quan trọng nhất và được sử dụng rộng rãi. PDF là viết tắt của Portable Document Format… Trong bài viết này, hãy cùng UniTrain thực hiện 2 chức năng tách PDF và thêm hình nền mờ vào trang PDF bằng cách sử dụng Python đơn giản!
1. Tách tệp PDF
Output sẽ là ba tệp PDF mới với split 1 (page 0,1), split 2(page 2,3), split 3(page 4-end).
Không có chức năng hoặc lớp mới nào được sử dụng trong chương trình python trên. Sử dụng logic đơn giản và lặp đi lặp lại để tạo ra các phân tách pdf theo phân chia danh sách được thông qua.
2. Thêm hình nền mờ vào trang PDF
Dưới đây là trang đầu tiên của file pdf gốc (trái) và mờ (phải) trông như thế nào:
- Đối tượng trang được chuyển đổi thành đối tượng trang mờ bằng hàm add_watermark().
- Chức năng add_watermark():
wmFileObj = open(wmFile, ‘rb’)
pdfReader = PyPDF2.PdfFileReader(wmFileObj)
pageObj.mergePage(pdfReader.getPage(0))
wmFileObj.close() return pageObj
- Trước hết, tạo ra một pdf của watermark.pdf. Sử dụng hàm mergePage() . Điều này sẽ phủ lên hình mờ trên đối tượng trang đã qua.