Джон Мюллер в своем Twitter рассказал о разных типах контента и о том, как Google обрабатывает разные типы файлов, а также обсудил индексацию PDF-файлов в результатах поиска Google и как Google их обрабатывает.

Джон Мюллер отметил, что Google автоматически конвертирует PDF-файлы и аналогичные типы документов в формат HTML для индексирования и ранжирования.

Google конвертирует PDF, DOC, XLS-файлы в HTML для индексирования

Для тех, кто активно юзает SEO с PDF-файлами, это не станет сюрпризом. Google довольно давно уже конвертирует PDF-файлы в HTML и отображает ссылку на HTML-версию непосредственно в результатах поиска.

Обратите внимание, что большие файлы Google не будет конвертировать весь PDF-документ в HTML. Таким образом, какой-то важный контент в PDF, может просто не индексироваться из-за размера PDF. И хотя PDF-файлы могут хорошо ранжироватся, но чаще всего только по типам запросов, в которых чаще ищут что-то вроде PDF, например, при поиске руководства.

Если у вас есть большое количество важного контента в PDF-файлах, стоит подумать о том, является ли PDF-формат лучшим решением. Например, PDF-файлы трудно открыть и читать на большинстве мобильных устройствах. И размеры PDF-файлов часто намного больше, чем у HTML-версии страницы, что также является ограничением при медленном подключении интернета.

PDF-файлы не являются единственным типом файлов, который Google конвертирует в HTML для индексирования. Google также делает это для документов .doc, .xls и других подобных типов контента, отличных от HTML.