Что такое битая ссылка
Переход по гиперссылкам невозможен, а на экране браузера мы видим код 404. В чём проблема? Это битые ссылки сайта. Пользователь имеет возможность общаться с сервером, но последний не находит информацию по запросу. Например, нужный документ был перемещён по новому адресу или просто удалён. Чтобы было понятнее, объясним, что гиперссылка, это любой элемент, нажимая на который курсором мы переходим на другую web-страницу.
Степень опасности
Представьте себе, вы ищите в интернете определённую информацию и делаете переход по ссылке, которую выдаёт поисковая машина. И тут вас ждёт неприятность. Данной страницы не существует. Что делает дальше большинство пользователей? Просто закрывает сайт и начинает поиск другого ресурса. Таким образом, битые ссылки наносят ощутимый вред СЕО. Они негативно влияют на поведенческие факторы, мотивируют пользоваться другими сайтами. То есть уводят пользователя к конкурентам. Дополнительно, если пустые гиперссылки размещены для внутренней перелинковки, то они серьёзно вредят состоянию ссылочной массы.
Хотя, опасность битых ссылок чаще всего преувеличена. Например, бытует мнение, что ссылки, маркируемые кодом 404, отрицательно влияют на краулинг, а точнее, его бюджет. Считается, что ресурсы поискового робота, направленные на сканирование сайта и добавление его в очередь на индексацию, не бесконечны. Если проверяется большое количество битых гиперссылок, то их поочередный обход ПС занимает много времени и система может просто «не заметить» наиболее важные страницы. Но…
Д.Мюллера, специалист Гугл, сказал, что код 404, который может получить битая страница, ни каким образом не влияет на краулинг. Бот конечно просканирует все страницы, убедиться в их бесполезности. Но сделает он это не в ущерб остальным страницам сайта. Сколько бы ни было гиперссылок с кодом Not Found, рейтинг других страниц не будет снижен.
Прислушаться к мнению профессионала стоит. Однако и тут не всё просто. Тот же Google сообщает, что код 404 Soft характеризует «мягкие битые ссылки сайта». Именно они вредят бюджету кроулинга.
Код 404 Soft появляется в том случае, если сервер вместо чистой ошибки 404 выдаёт HTTR-ответ 200 ОК. Краулер не понимает, что гиперссылка пустая, изучает её обычным способом, действительно, расходуя на битую страницу свой бюджет.
Все вышеперечисленные факты позволяют сделать вывод. Несколько адресов, ведущих в никуда, не навредят сайту. А вот их большое количество может негативно сказаться на СЕО. Лучше проверить битые URL и избавиться от них.
Как найти битые ссылки
Если у вас небольшой сайт, то поиск гиперссылок, которые ни куда не ведут, можно сделать вручную. Большого труда не представляет проверить 1-2 десятка страниц и посмотреть, куда они ведут. Конечно, можно воспользоваться и специальными сервисами. Но они не так точны, как хотелось бы. Поэтому чтобы данная работа была качественной, рекомендуется пользоваться всеми доступными методами.
Проверка битых ссылок
В сети интернет размещено много сервисов, позволяющих проверять сайт на наличие адресов, ведущих в «никуда». Вот пять таких программ, пользующихся наибольшей популярностью.
-
Консоль поиска Google.
Чтобы начать пользоваться этим ресурсом, необходимо подтвердить своё право на веб-узел. Затем переходят к аналитической работе. Битые ссылки сайта отобразятся на вкладке «ошибки сканирования». Следует знать, что данная консоль укажет только на гиперссылки, оцениваемые поисковым роботом при последнем обходе страниц сайта. Онлайн сделать это не получится.
-
Яндекс.Вебмастер.
Данный сервис простой и понятный в использовании. Он отобразит битые ссылки на сайте в разделе «Внутренние ссылки». Искать нужно вкладку «Неработающие внутренние ссылки на сайте». Но и в этом случае, информация будет собрана после последнего исследования веб-страниц ботом Яндекса.
-
Online Broken Link Checker.
Это англоязычный инструмент. Но разобраться в его меню совсем не сложно. С его помощью можно проверить не более 3000 страниц, и только в HTML-документах. Поэтому, если ссылка заключена в любое мультимедиа, она не будет замечена.
-
Netpeak Spider.
Это, пожалуй, одна из лучших программ. Интерфейс на русском языке. Сервис эффективен для поиска всех типов гиперссылок, кодируемых, как 404. Версия платная. Есть и бесплатный вариант. Но он не позволяет сохранять отчёты. Работать можно с любым количеством URL.
-
Xenu’s Link Sleuth.
Меню на английском языке. Проверка начинается с корневой страницы с дальнейшим сканированием ссылочной массы. Имеется возможность настраивать различные фильтры сервиса. После завершения сбора информации автоматически генерируется HTML-отчёт. Единственный недостаток, для проверки сайтов с большим количеством страниц требуется много времени. Большой плюс, бесплатный сервис.
Что делать с ошибкой 404 Not Found
Итак, проверка сайта на битые ссылки завершена. Какие наши действия дальше? Всё будет зависеть от вида гиперссылки, которую «забраковал» сервис.
А) Внешние URL.
Ссылка с вашей интернет-платформы ведёт на веб-узел партнёра. Но переход почему-то блокируется. Если вы нашли такой указатель ресурса, его нужно удалить или поменять на рабочую гиперссылку. В тех случаях, когда обнаружены коммерческие битые ссылки сайта, рекомендуется связаться с партнёром и заявить о проблеме.
Есть хороший вариант приобретения обратных ссылок, основанный на поиске несуществующих страниц на сторонних сайтах. Веб-мастер просто отслеживает в трафике материалы со ссылками Not Found, пишет свой текст по теме адреса ресурса и предлагает владельцу блога отредактировать битую страницу. Здесь выигрывают все. Web-мастер размещает ссылку на своей платформе, а владелец блога избавляется от пустой страницы с помощью актуального материала.
Б) Внутренние URL.
В тех случаях, когда вы нашли битые ссылки на своём сайте, следует поступить так:
- восстановить страницу, если она была удалена случайно;
- перелинковать страницу с рабочей гиперссылкой;
- настроить 301 редирект (работает, если URL был изменён);
- удалить ссылку.
Удалив все несуществующие страницы, остаётся высокая вероятность того, что они будут появляться. Поэтому после чистки сайта рекомендуется сделать его настройку.
Посмотрите, чтобы битый адрес не давал ответ 220 ОК. Переход должен указывать ошибку 404 (недоступно). Как вариант, подойдёт и код 410 (удалено). Немного расшифруем данные коды. Ошибка 404 означает, что удалённый ресурс подлежит восстановлению, а 410 указывает, что после удаления ресурса расположение его копии неизвестно.
В стандартном варианте страница, выдающая код 404, побуждает пользователя покинуть сайт. Поэтому её нужно настроить так, чтобы клиент не уходил с ресурса, а был перенаправлен на целевую страницу.
Таким образом, вы теперь знаете, как найти битые ссылки на сайте и что с ними делать. Остаётся немного поработать с интернет-ресурсом и улучшить его СЕО.