Инструменты для захвата и конвертирования Интернета

Преобразование веб-страниц и HTML в PDF

Python API

При конвертации веб-страниц и HTML в PDF GrabzIt Python API предоставляет следующие функции, которые помогают intEgrate GrabzIt intо вашей системе как можно проще. Однако, прежде чем начать, помните, что после вызова URLToPDF, HTMLToPDF or FileToPDF методы Save or SaveTo метод должен быть вызван, чтобы сделать снимок экрана PDF.

Основные параметры

Часто при конвертации веб-страницы into В документе PDF будет создано много страниц для представления всей веб-страницы. Для преобразования веб-страницы требуется только один параметр into документ PDF или конвертировать HTML в PDF как показано в приведенных ниже примерах.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

Пользовательский идентификатор

Вы можете передать пользовательский идентификатор PDF методами, как показано ниже, это значение затем возвращается в ваш обработчик GrabzIt Python. Например, этот пользовательский идентификатор может быть идентификатором базы данных, что позволяет связать снимок экрана с определенной записью базы данных.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

Верхние и нижние колонтитулы

При создании снимка экрана в формате PDF вы можете запросить, чтобы вы шаблон в сгенерированный PDF. Этот шаблон должен быть saved заранее и определит содержимое верхнего и нижнего колонтитула вместе с любыми специальными переменными. В приведенном ниже примере кода пользователь использует свой шаблон под названием «мой шаблон».

Если для верхнего или нижнего колонтитула недостаточно велико верхнее или нижнее поле, оно не будет отображаться в PDF. В приведенном ниже примере мы установили верхнее и нижнее поля для 20, чтобы обеспечить достаточно места.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Конвертировать HTML элемент в PDF

Если вы хотите просто конвертировать HTML-элемент, такой как div или span напрямую intДокумент в формате PDF вы можете использовать в библиотеке Python GrabzIt. Вы должны пройти CSS селектор элемента HTML, который вы хотите преобразовать в targetElement Параметр.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

В этом примере мы хотим захватить весь контент в диапазоне, который имеет идентификатор Articleпоэтому мы передаем это GrabzIt, как показано ниже.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Каким образом обрезается PDF при нацеливании на элемент HTML контролируется с помощью этих методов.