Инструменты для захвата и конвертирования Интернета

Конвертировать URL и HTML в DOCX

PHP API

Добавление возможности конвертировать HTML или веб-страницы into Документы Word для вашего приложения никогда не были проще с PHP API GrabzIt, Однако, прежде чем начать, помните, что после вызова URLToDOCX, HTMLToDOCX or FileToDOCX методы. Save or SaveTo метод должен быть вызван для создания DOCX.

Основные параметры

Захват веб-страниц как DOCX преобразует всю веб-страницу intДокумент Word, который может состоять из множества страниц. В приведенных ниже примерах PHP конвертирует HTML в DOCX и веб-страница intДокумент Word, только с одним обязательным параметром.

$grabzIt->URLToDOCX("https://www.tesla.com");
//Then call the Save or SaveTo method
$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>");
//Then call the Save or SaveTo method
$grabzIt->FileToDOCX("example.html");
//Then call the Save or SaveTo method

Пользовательский идентификатор

Вы можете передать пользовательский идентификатор DOCX методами, как показано ниже, это значение затем возвращается в ваш обработчик GrabzIt PHP. Например, этот пользовательский идентификатор может быть идентификатором базы данных, позволяя связать документ DOCX с определенной записью базы данных.

$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setCustomId(123456);

$grabzIt->URLToDOCX("https://www.tesla.com", $options);
//Then call the Save method
$grabzIt->Save("http://www.example.com/handler.php");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setCustomId(123456);

$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", $options);
//Then call the Save method
$grabzIt->Save("http://www.example.com/handler.php");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setCustomId(123456);

$grabzIt->FileToDOCX("example.html", $options);
//Then call the Save method
$grabzIt->Save("http://www.example.com/handler.php");

Верхние и нижние колонтитулы

Хотя GrabzIt не поддерживает традиционный шаблон Word. Добавляя верхние или нижние колонтитулы в документ Word, вы можете запросить, что вы хотите применить шаблон в DOCX генерируется. Этот шаблон должен быть saved заранее и определит содержимое верхнего и нижнего колонтитула вместе с любыми специальными переменными. В приведенном ниже примере кода пользователь использует созданный им шаблон, который называется «мой шаблон».

$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTemplateId("my template");

$grabzIt->URLToDOCX("https://www.tesla.com", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTemplateId("my template");

$grabzIt->HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");
$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTemplateId("my template");

$grabzIt->FileToDOCX("example.html", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");

Конвертировать HTML элемент в DOCX

Если вы хотите просто конвертировать HTML-элемент, такой как div или span напрямую intДокумент Word, который вы можете использовать с библиотекой PHP GrabzIt. Вы должны пройти CSS селектор элемента HTML, который вы хотите преобразовать в setTargetElement метод ГрабзитDOCXOptions класса.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

В этом примере мы хотим захватить весь контент в диапазоне, который имеет идентификатор Article, Передав это GrabzIt, как показано ниже.

$grabzIt = new \GrabzIt\GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

$options = new \GrabzIt\GrabzItDOCXOptions();
$options->setTargetElement("#Article");

$grabzIt->URLToDOCX("http://www.bbc.co.uk/news", $options);
//Then call the Save or SaveTo method
$grabzIt->SaveTo("result.docx");

Не имеет значения, конвертируете ли вы URL в Word, как показано в примере, или HTML в Word. Оба целевых элемента HTML точно так же.