Инструменты для захвата и конвертирования Интернета

Советы по написанию HTML для конвертации

API GrabzIt позволяет конвертировать любой HTML into PDF, DOCX, изображения и многое другое. Для этого вам нужно передать обычный HTML в наш API. Например, что-то вроде HTML, показанного в следующем примере.

<html>
<body>
<h1>Hello World</h1>
</body>
</html>

Обратите внимание, что этот пример HTML включает теги HTML и BODY, но это не требуется, если вы просто хотите преобразовать фрагмент HTML. Однако, если вы не добавите теги HTML и BODY, они будут автоматически добавлены для вас, как в обычном браузере. Чтобы противодействовать этому, вы можете указать некоторые CSS, чтобы удалить любые дополнительные отступы и поля в теге BODY, как показано ниже.

<style>
body{margin:0;padding:0}
</style>

Если вы хотите включить JavaScript, изображения или CSS в HTML, который вы собираетесь конвертировать, вы можете предоставить эти ресурсы в виде встроенного или ссылочного поместья. Например, приведенный ниже код показывает, как создавать ресурсы в HTML встроенным способом.

<html>
<head>
<script>
document.getElementsByTagName('H1')[0].innerText = 'Goodbye';
</script>
<style>
h1{
color:red;
}
</style>
</head>
<body>
<img width="16" height="16" alt="star" src="
SKudfOulrSOp3WOyDZu6QdvCchPGolfO0o/XBs/fNwfjZ0frl3/zy7////wAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAACH5BAkAABAALAAAAAAQABAAAAVVICSOZGlCQAosJ6mu7fiyZeKqNKToQGDsM8hBADgUXoGA
iqhSvp5QAnQKGIgUhwFUYLCVDFCrKUE1lBavAViFIDlTImbKC5Gm2hB0SlBCBMQiB0UjIQA7" />
<h1>Hello World</h1>
</body>
</html>

Как вы можете видеть в приведенном выше примере, JavaScript и CSS содержатся непосредственно в HTML-странице и как изображение было преобразовано. intО.А. URL данных.

Если бы мы вместо этого хотели сослаться на эти ресурсы, нам нужно будет обеспечить, чтобы все ссылки на эти файлы имели абсолютные URL-адреса, которые также являются общедоступными. Это означает, что URL содержит всю информацию, необходимую для поиска ресурса. Неиспользование абсолютных URL является основной причиной изображения, CSS и JavaScript не отображаются при конвертации HTML.

Для этого нужно поставить JavaScript, CSS и изображение into отдельные файлы, а затем ссылки в HTML, что будет выглядеть примерно так, как показано ниже.

<html>
<head>
<script src="http://www.example.com/myscript.js"></script>
<link rel="stylesheet" type="text/css" href="http://www.example.com/mystyle.css">
</head>
<body>
<h1>Hello World</h1>
<img width="16" height="16" alt="star" src="http://www.example.com/star.gif" />
</body>
</html>