Инструменты для захвата и конвертирования Интернета

Советы по написанию HTML для конвертации

API GrabzIt позволяет конвертировать любой HTML into PDF, DOCX, изображения и многое другое. Для этого вам необходимо передать в наш API обычный HTML. Например, что-то вроде HTML, показанного в следующем примере.

<html>
<body>
<h1>Hello World</h1>
</body>
</html>

Обратите внимание, что этот пример HTML включает теги HTML и BODY, но это не обязательно, если вы просто хотите преобразовать фрагмент HTML. Однако, если вы не добавите теги HTML и BODY, они будут добавлены автоматически, как и в обычном браузере. Чтобы противодействовать этому, вы можете указать CSS, чтобы удалить любые дополнительные отступы и поля в теге BODY, как показано ниже.

<style>
body{margin:0;padding:0}
</style>

Если вы хотите включить JavaScript, изображения или CSS в HTML, который собираетесь конвертировать, вы можете предоставить эти ресурсы в виде встроенных или ссылочных файлов. Например, приведенный ниже код показывает, как создавать ресурсы в HTML встроенным способом.

<html>
<head>
<script>
document.getElementsByTagName('H1')[0].innerText = 'Goodbye';
</script>
<style>
h1{
color:red;
}
</style>
</head>
<body>
<img width="16" height="16" alt="star" src="
SKudfOulrSOp3WOyDZu6QdvCchPGolfO0o/XBs/fNwfjZ0frl3/zy7////wAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAACH5BAkAABAALAAAAAAQABAAAAVVICSOZGlCQAosJ6mu7fiyZeKqNKToQGDsM8hBADgUXoGA
iqhSvp5QAnQKGIgUhwFUYLCVDFCrKUE1lBavAViFIDlTImbKC5Gm2hB0SlBCBMQiB0UjIQA7" />
<h1>Hello World</h1>
</body>
</html>

Как вы можете видеть в приведенном выше примере, JavaScript и CSS содержатся непосредственно на HTML-странице и как изображение было преобразовано. intО.А. URL данных.

Если вместо этого мы хотим ссылаться на эти ресурсы, нам необходимо убедиться, что все URL-адреса, ссылающиеся на эти файлы, используют абсолютные URL-адреса, которые также являются общедоступными. Это означает, что URL-адрес содержит всю информацию, необходимую для поиска ресурса. Неиспользование абсолютных URL-адресов является основной причиной изображения, CSS и JavaScript не отображаются при конвертации HTML.

Для этого необходимо разместить JavaScript, CSS и изображение. into отдельные файлы, а затем ссылки на них в HTML, что будет выглядеть примерно так, как показано в примере ниже.

<html>
<head>
<script src="http://www.example.com/myscript.js"></script>
<link rel="stylesheet" type="text/css" href="http://www.example.com/mystyle.css">
</head>
<body>
<h1>Hello World</h1>
<img width="16" height="16" alt="star" src="http://www.example.com/star.gif" />
</body>
</html>