Как поисковая машина решает, когда показывать новости в ответ на поисковый запрос, а когда не показывать?
Если вы живете в Билтоне, штат Вирджиния, есть вероятность того, что вас вряд ли заинтересуют новости об аварии в Бруклине, когда вы ищете информацию о Бруклине. Если вы проживаете в Бруклине и хотите найти туристическую информацию о парках Висконсина, вас, скорее всего, не интересуют результаты последнего розыгрыша висконсинской лотереи. Однако, когда кто-то сейчас ищет информацию о штатах, граничащих с Мексиканским заливом, его могут заинтересовать новости об утечке нефти в регионе.
Сегодня, в официальном релизе Яндекс сообщил о внедрении новой поисковой технологии, которая позволяет находить совсем свежие документы, буквально через минуты после их появления в интернете.
Последние несколько лет в Яндексе существовал так называемый «быстрый робот». В его задачу входила быстрая индексация и выкладывание на поиск наиболее ценных свежепоявившихся документов. Построенный по «пакетному» принципу, быстроробот какое-то время готовил версию индекса с новыми документами, потом выкладывал ее на поиск. Это вносило задержку на время обработки, которую можно было сократить с помощью разных ухищрений для части документов до 20 минут, но нельзя было устранить полностью.
Чтобы окончательно сделать из поискового индекса отражение (реального веба, прим. автора блога), мы создали и запустили новые технологии — робот «Orange Crawler» и «Real-Time поиск». Основная разработка была сделана калифорнийским отделением Яндекса — Yandex Labs в сотрудничестве с программистами московского офиса.
Новый апельсиновый робот не прокачивает все страницы интернета, а извлекает из него свежий и сочный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией.
Доля "Яндекса" на поисковом рынке рунета впервые за последние четыре года превысила 60%. С нового года "Яндекс" прибавил 9,7% - и на июнь 2010 года контролировал 64,6% поиска, в то время как доли его основных конкурентов снижались. Больше всего пострадал портал Mail.ru, доля которого с декабря прошлого года сократилась на 27%, Rambler потерял 11,8% поиска, а Google - 6%.
Количество запросов к поисковым системам с мобильных устройств может за два года вырасти с 9% до 20%, - прогнозирует аналитик американской компании RBC Росс Сандлер. На данный момент, по статистике ComScore, половина владельцев смартфонов пользуется поиском как минимум 1 раз в месяц, 20% - раз в неделю, 11% - почти ежедневно.
Методами борьбы с покупными ссылками и сайтами, продающими их, служат как ручные санкции так и фильтрация алгоритмами, что может привести к существенному ухудшению позиций сайтов, использующих покупные ссылки. Естественно, такая ситуация привела многих оптимизаторов, веб мастеров и компании, занимающиеся раскруткой, к тактике скрытой покупки ссылок. И хотя биржи ссылок по-прежнему процветают, они приобретают все более нелегальный формат, их использование становится все более рискованным.
Яндекс опубликовал информационный бюллетень о том, как пользуются поиском жители десяти крупных городов России - Хабаровска, Новосибирска, Омска, Екатеринбурга, Самары, Нижнего Новгорода, Ростова-на-Дону, Воронежа, Санкт-Петербурга и Москвы.
Компания Google продолжает развивать ряд своих музыкальных сервисов и, по сообщению источников из музыкальной индустрии, может запустить собственный магазин музыки уже этой осенью.
Разрабатываемая Google операционная система Chrome OS будет не только платформой для работы в Интернете, как обещала ранее эта компания. Благодаря таинственной функции Chromoting она позволит запускать привычные компьютерные приложения прямо в браузере.
Яндекс изучил поисковые запросы про Единый государственный экзамен и выяснил, что старшеклассники ищут в интернете.
Рост запросов про ЕГЭ начинается ещё в апреле – вместе с досрочными экзаменами. В 2010 году они проходили с 20 по 26 апреля. За эту неделю запросы со словом «ЕГЭ» Яндексу задали около 120 тысяч человек. Для анализа были взяты все запросы от пользователей, искавших ЕГЭ, за две недели - с 20 по 26 апреля, во время сдачи экзаменов, и с 27 апреля по 3 мая - когда экзамены уже кончились.