Главный инженер Google Мэтт Каттс (Matt Cutts) написал в своем блоге, что поисковик усилил работу по избавлению пользователей от поискового спама, который создают так называемые "контентные фермы" ("Контентные фермы" (англ. content farms) - это сайты, наполненные неоригинальным, либо автоматически сгенерированным содержимым). Каттс отметил, что несмотря на активную борьбу команды Google со спамом, за последний месяц его количество заметно увеличилось. Ну а так как доля "чистого веб-спама" со временем уменьшается, Google решил сосредоточиться на борьбе с "контентными фермами". "В 2010 году, мы внесли два значительных изменения в алгоритмы, сфокусированные на низкосортных сайтах, - пишет Каттс. - Тем не менее, мы до сих пор слышим громкие просьбы усилить противодействие сайтам, содержащим преимущественно спам и низкокачественный контент". В Google вновь изменили алгоритм поиска, в результате чего понизилось ранжирование сайтов, копирующих чужой контент. Позднее в своем блоге Каттс написал, что изменения в алгоритме коснутся не более 2% запросов. "Общий эффект состоит в том, что пользователи с большей вероятностью увидят сайты с оригинальным контентом, а не сайты, собирающие или копирующие контент с сайтов-оригиналов", - отметил он.
К сожалению, главный инженер Google не стал уточнять, каким образом поисковик будет определять уникальность контента, как отнесется к "зеркалам" с сайтов и что будет с крупными трастовыми сайтами, если те копируют содержимое небольших блогов.
Изменения в поисковом алгоритме Google активно обсуждаются в Интернете. Например, на Хабрахабре рассказывают, что под новый фильтр попадают не только "контентные фермы", но и интернет-магазины, нарушающие правила поискового сервиса, а также "взломанные" нормальные сайты. В целом инициатива Google встречена положительно, так как сайты-пустышки и "контентные фермы" последнее время сильно засорили Интернет. С другой стороны, некоторые комментаторы считают, что борьба с "контентными фермами" заранее обречена на провал, так как любой может скопировать, например, содержание Википедии, убрать посторонние ссылки (которые в текстах Вики встречаются повсеместно) и выложить на свой сайт. По-идее, такая страница будет выглядеть для поискового робота лучше, чем оригинал. Кроме того, до сих пор непонятно, каким образом Google будет определять первоисточник информации, копирайтеры беспокоятся, что в случае, если крупный портал с высоким PR станет копировать информацию с небольших сайтов или блогов, то поисковик именно его будет считать сайтом с оригинальной информацией.
Напомним, у Google и ранее работали фильтры, призванные пресечь деятельность "контентных ферм".
Duplicate Content Filter накладывается на сайты, заподозренные в краже чужого контента. Как правило, подобные сайты находятся на низких позициях в выдаче, а их содержание относится к дополнительным результатам поиска (supplementary results).
Omitted Results Filter обращает внимание на страницы, содержание которых в точности (включая теги title, description и т.д.) совпадает с контентом страниц оригинального сайта. В принципе, эти страницы могут попасть в выдачу, если пользователь при запросе активирует опцию расширенного поиска "show omitted results".
Google для защиты интеллектуальной собственности объявил борьбу не только "контентным фермам", но и файлообменным сервисам и торрент-трекерам. Google удалил из саджестов и мгновенных результатов поиска Instant Search термины, которые напрямую ассоциируются с торрентами, в первую очередь это словосочетания, содержащие слова “torrent”, “BitTorrent”, “RapidShare” и их производные.
Нововведение вызвало неоднозначную реакцию в Интернете: с одной стороны, борьба за авторские права только приветствуется, а удаление из саджестов словосочетаний, связанных с торрентами, можно считать реверансом Google в сторону правообладателей. С другой стороны, пока непонятно, будет ли какая-нибудь польза от нововведения поисковика. Дело в том, что с введением запрета из мгновенных результатов поиска исчезли и вполне легальные сайты, имеющие в своих названиях "torrent", в то время как названия множества нелегальных торрент-трекеров продолжают открываться в саджестах. Кроме того, хотя ряд сайтов исчез из подсказок, это вряд ли помешает желающим что-то скачать, так как результаты поиска по вышеназванным словосочетаниям ничуть не изменились.
|