Google может использовать информацию о вас из социальных сетей для
создания поискового предположения и автоматического завершения ввода
запроса?
Когда вы вводите поисковый запрос а строку поиска Google, Yahoo или
Bing со своего домашнего компьютера, то скорее всего вы увидите
выпадающий список с предполагаемыми ключевыми словами.
Если вы используете смартфон и начинаете вводить символы в текстовое
поле с телефона, то вам будет предложено автоматическое завершение
запроса, который вы набираете.
В случае с телефонами, на которых буквы вводятся многократным
нажатием на цифровые клавиши, подобные завершения и предположения могут
сэкономить вам множество нажатий. Телефон обычно предлагает вам
завершить строку словами из словаря, который хранится в памяти самого
аппарата.
Недавно одобренный патент Google описывает то, как поисковая машина
может добавлять слова в подобный словарь, причем браться слова будут из
социальных сетей членом которых вы состоите. Что особенно интересно,
так это то, сколько информации собирает поисковая машина о том, какие
слова вы используете в сети и какие слова используют люди, с которыми
вы можете быть связаны.
Почему Google обращается за подобной информацией к социальным сетям?
В патенте говорится:
Теоретически, пользователь с большей вероятностью будет использовать
слова, которые часто используют его друзья. Например, если тинэйджер
идентифицировал различных пользователей как друзей на сайте социальной
сети, то содержимое страниц этих друзей и другой похожий контент может
быть проанализирован для определения популярности ключевых слов для
пользователя.
Такой пользователь, например, может с гораздо большей вероятность
использовать определенные формы сленга в общении - что-то, что нельзя
найти в словарях с более общим словарным запасом, рассчитанным на
широкую аудиторию.
Патент:
Текстуальное устранение неоднозначности при помощи социальных связей
Изобретатели: David P. Conway, Andy Rubin
Принадлежит Google
US Patent Application 20100114887
Опубликовано 6 мая 2010
Подано на рассмотрение 17 октября 2008
Отрывок
Содержание этой спецификации может быть воплощено, кроме всего
прочего, в методе, применяемом компьютером, который включает получение
запроса на предоставление словаря для вычислительного устройства,
связанного с пользователем; идентификацию информации использования слов
членами социальной сети пользователя; и генерацию, с учетом информации
использования слов членами социальной сети пользователя, словаря для
пользователя.
Текст, связанный с членом социальной сети может включать такой контент как:
• Страницы, на которых он оставлял информацию,
• Страницы профилей с сайтов вроде Orkut, Facebook или Myspace
• Страницы форумов или история текстовых сообщений между членами социальной сети.
В патенте приводятся некоторые подробности о том, как могут
оцениваться различные слова, используемые членами социальной сети, с
целью принятия решения о включении определенных слов в словарь. Эти
оценки используются для предположения слов, которые будут
использоваться в будущем.
В патенте приводится следующий пример:
Если пользователи тинэйджеры, то анализ может определить множество
фраз, которые обычно в языке не встречаются, вроде OMG, "типа”,
"конкретно”, "клево” и другие подобные сленговые выражения.
В дополнение к помощи пользователям смартфонов в виде
автоматического завершения слов из словаря, в патенте описывается и
возможность использования информации из социальной сети пользователя
для формирования поискового предположения при обычном поиске.
Этот метод определения слов для поисковых предположений может также
включать поиск информации в компьютере пользователя, в текстовых
документах, записях календаря, контактах, истории браузера и т.д. Так
что если кто-то часто посещает страничку бейсбола на ESPN и эти файлы
хранятся в кэше его браузера, то при начале набора "b-a-s” поисковая
машина скорее всего предложит "baseball” в качестве поискового
предположения.
Информация, обнаруженная в сети пользователя, вроде учетных записей
электронной почты, также может послужить источником данных для помощи в
заполнении текстовых полей в телефоне или в поисковом запросе с
домашнего ПК.
Выводы
Ранее я уже писал о патентах поисковых машин, связанных с поисковыми
предположениями, и как минимум однажды обращал внимание на то, что
слова в них могут браться из групп, членом которых является
пользователь, но тогда было гораздо меньше деталей.
Любопытно то, что патент больше фокусируется на автоматическом
завершении слов в телефоне, а не на предоставлении поисковых
предположений пользователям ПК. Учитывая выход Google на рынок
смартфонов и программного обеспечения для них, сейчас это выглядит
логично. Также в патенте можно найти некоторые детали о программном и
аппаратном обеспечении телефона, который мог бы использовать описанный
выше словарь, и изображения в документе демонстрируют подробности о
телефоне под управлением операционной системы Android от Google.
Но что я нахожу самым интересным в этом патенте, это то, как много
внимания Google уделяет словам, которые мы используем в нашем общении в
сети.
|