mailinfo.ru - Новости

Google поперхнулся невиданным количеством спама...»

26 июня 2006

На прошлой неделе в Сети появилась информация о том, что какому-то удачливому молдавскому спамеру удалось «скормить» Google 5 миллиардов бессмысленных страниц. Столь масштабная спам-атака на поисковик привела к техническим сбоям, в итоге в работе Google можно было заметить некоторые странности.

Вообще, как утверждают SEO-специалисты, существует немало способов «заспамить» лидера поискового рынка. Этот случай примечателен своими масштабами – 5 миллиардов страниц, как утверждается в блоге Джона Бэтла, было проиндексировано поисковиком в течение всего трех недель. Количество страниц действительно огромно, ведь два года назад вся база Google насчитывала меньше документов.

Спамер воспользовался особым отношением поисковика к субдоменам. Каждый из них рассматривается Google как отдельный сайт, поэтому для скорейшего индексирования понадобилось лишь создать внушительное количество субдоменов. Они оказались в базе Google намного быстрее, чем обычные страницы одного-единственного сайта.

К чести поисковика, он довольно быстро справился с проблемой, освободившись от «мусора». Как утверждает в комментариях к скандальному сообщению один из разработчиков Google, речь идет о сбое, в результате которого в выдаче оказалось большое количество субдоменов.

Между тем, можно встретить предположения о связи описанной проблемы с некорректной работой оператора site. Как известно, с помощью этого оператора можно получить представление о количестве страниц того или иного сайта, хранящихся в базе Google. Некоторые пользователи считают, что в последнее время запросы с оператором site выдают нереалистичные, завышенные цифры.

«Вебпланета» обратилась за комментариями к отечественным экспертам в области интернет-поиска.

Игорь Гуров, один из авторов рассылки «Продвижение сайтов. Профессиональные советы экспертов», которую выпускает компания «Ашманов и Партнеры», признает этот случай исключительным по своим масштабам. «Заспамить Google можно, это бесспорно. Для этого даже не обязательно использовать субдомены, хотя с ними, возможно, будет эффективнее и быстрее. Но 5 миллиардов страниц... В первый раз такое встречаю», - заметил он. - Еще несколько месяцев назад многие начали замечать, что Google показывает больше страниц, нежели действительно есть на сайте (даже если это статика), особенно когда речь идет о тысячах и десятках тысяч страниц (Google мог показывать в разы, а то и на порядок большее число по оператору site)».

Сергей Петренко, руководитель проекта Searchengines.ru и директор компании «Яндекс.Украина», считает, что масштабы этой спам-атаки могут быть преувеличены: «Исходя из отзывов, которые я видел в обсуждениях этого случая, речь здесь, скорее, о сбое - робот Google запутался в индексируемых данных и при обновлении базы все это попало в основной поиск. Сейчас сложно судить, что именно сделал спамер и как это увидел робот, разумеется. Вряд ли там действительно есть или было 5 миллиардов страниц».