Инструменты для захвата и конвертирования Интернета

Как GrabzIt конвертирует HTML в DOCX

HTML может представлять много сложных структур, таких как встроенные DIV или SPAN рядом. Элементы HTML перекрываются и границы применяются к различным элементам HTML. По большей части это не будет разумным подходом в DOCX, хотя можно было бы создать floatесли HTML-элементы содержат текстовые поля, это приведет к тому, что почти весь контент будет содержаться в текстовых полях, что приведет к очень уродливому и грязному документу Word.

Именно из-за этой проблемы мы игнорируем floatИспользование элементов HTML и границ большинства элементов HTML. Однако мы уважаем границы некоторых элементов HTML, таких как ячейки таблицы и выравнивание элементов изображения, например.

Означает ли это, что нельзя размещать контент бок о бок? Нет. Это все еще возможно, если использовать атрибуты CSS столбца, Таблицы HTML и позиции табуляции, как показано ниже.

Если вы хотите, чтобы документ HTML был записан точно так, как показано на экране, было бы лучше конвертировать HTML в PDF поскольку формат файла PDF использует абсолютное позиционирование.

Табуляторы

Табуляторы являются специальной функцией DOCX, которая активируется, если floatЭлементы HTML с выравниванием текста содержатся в элементе HTML со 100% шириной, который сам по себе не имеет специального выравнивания текста. Это важно, поскольку это означает, что нормальное выравнивание не должно применяться к дочерним элементам. Это делается с помощью text-align:start. Обратите внимание, что табуляторы не работают в таблице или списке.

Пример этого показан ниже.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>