Как защитить контент от копирования на сайте (оригинальный текст)

Оглавление:

Способы защиты контента
Защита контента на уровне сервера
Sitemap.xml
Защита контента в Yandex
Защита контента в Google
Как узнать о существовании копий на текст и вовремя получать уведомление о появлении новых?
Вывод

Одним из важнейших факторов влияния на позиции сайта в выдаче является его контентное наполнение. Естественно, что как SEO-оптимизаторы, так и сами владельцы сайтов, стремятся к тому, чтоб наполнить веб-ресурс уникальным, качественным, интересным контентом. Но существуют и такие недоброжелатели, которые просто «воруют» информацию из других ресурсов и выдают ее как свою. Несправедливость заключается в том, что после индексации данные страницы могут подняться в выдаче даже выше, нежели страницы с оригинальным текстом. Но существует и ряд манипуляций, способных защитить контент от копирования со стороны конкурентов и профессиональных монетизаторов. В данной статье рассмотрим несколько самых популярных шагов.

Способы защиты контента

1. Защита контента на уровне сервера.

Самым известным инструментом для копирования контента является система парсинга. Это автоматизированная система, поведение которой существенным образом отличается от поведения реальных пользователей. Для защиты необходимо обнаружить среди посетителей автоматический парсер и заблокировать его на уровне сервера.
Тут предлагается два способа:

проверка на JavaScript;
проверка на действие.

Проверка на JavaScript. Системы парсинга очень просто распознать при помощи проверки на использование JavaScript. Если же скрипт не выполняется, то высока вероятность того, что Ваш ресурс посещает робот. В том случае, если Вы рассчитываете, что все-таки существует вероятность того, что сайт будет посещать юзер с полностью отключенным JavaScript, то логичным становится подключение к сайту инструмента прохождения капчи.

Также стоит принять во внимание и краулеров поисковых систем, и исключить их из блокировки. Списки краулеров представлены на официальных сайтах поисковых систем.

Проверка на действие. Современные разработчики систем парсинга научились создавать инструменты, имитирующие включенный JavaScript. В таких случаях, вышеописанные способы не смогут идентифицировать робота. Для того, чтоб заблокировать такие системы парсинга, стоит определить главные цели его работы. А это – сканирование и копирование ценного контента. Путем анализа логов сервера происходит сбор IP-адресов парсеров. Следующий шаг – блокировка доступа к сайту. Для этого используется файл директив сервера .htaccess.

Помимо описанных выше способов можно еще воспользоваться алгоритмами, анализирующими скорость клика, провести «тест на клик», анализ движения курсора.

2. Sitemap.xml.

Большинство современных сайтов имеют установленную генерацию карты сайта sitemap.xml, куда вносится список ссылок на страницы, подлежащие индексации. Основная задача карты сайта – оповещение ПС, о появлении новых страниц.

Но случаются ситуации, что автоматизированные системы парсинга узнают, о появлении новой страницы раньше, нежели роботы поисковых систем. Это позволяет скопировать новый контент и опубликовать его на сайте с копиями. Далее проводится ускоренная индексация страниц (например при помощи инструмента GetSocial) и поисковые роботы определяют копию, как оригинал.

К счастью, поисковым системам давно известны данные схемы работы парсеров и они предлагаются воспользоваться социальными инструментами – Google Search Console Sitemaps и Yandex Webmaster.

3. Защита контента в Yandex

Поисковая система Яндекс предлагает воспользоваться специальным инструментом для уведомления о появлении нового оригинального текста на сайте. Он так и называется «Оригинальные тексты». Перед тем, как загрузить текст на сам сайт, загружаем его в систему, для того, чтоб при ранжировании результатов учитывался именно источник оригинального контента.

4. Защита контента в Google

К сожалению, ПС Google не предлагает подобных инструментов, но зато предусмотрена возможность удаления страниц конкурентов, на которых размещен скопированный текст. Для этого в сфере Интернет-маркетинга существует такое понятие, как DMCA (THE DIGITAL MILLENNIUM COPYRIGHT ACT Summary). Закон, принятый в США в области авторского права для защиты контента на цифровых носителях, в том числе и в Интернете. Согласно закону каждый пользователь имеет полное право обратиться в Google и подать запрос на удаление страницы с неоригинальным контентом.

Как узнать о существовании копий на текст и вовремя получать уведомление о появлении новых?

Проверить текст на уже существующие копии можно, воспользовавшись специальным бесплатным сервисом MegaIndex. Также предусмотрена возможность, позволяющая отслеживать появление новых копий контента по мониторингу воспоминаний. Но для этого потребуется указывать, например, название компании или бренда в каждой статье, которая публикуется на сайте. В дальнейшем для отслеживания репутации сайта в Интернете можно отслеживать упоминания о компании, таким образом, идентифицируя появление новых копий Вашего контента. Тут задействуется сервис MegaIndex Search Engine Reputation Management.

Вывод

Уникальный, оригинальный контент на сайте поможет не просто улучшить ранжирование ресурса и повысить его позиции в выдаче. Это также отличный инструмент привлечения целевой аудитории, которая в дальнейшем превращается в потенциального клиента. Одним из важнейших этапов продвижения от компании «PROject SEO» является наполнение ресурса уникальным контентом и комплекс мер по защите от копирования конкурентами.