Для того что бы цитата с поискового запроса была показана исходя из слов запроса, поисковым машинам приходится хранить все тексты всех проиндексированных страниц. В таком случае поисковые системы хранят у себя на серверах копии всего Интернета, который собрал их поисковый паук. Так Гугл имеет у себя текстовые копии всего мирового Интернета в том объеме, что проиндексировал «паук», а Яндекс имеет копии всего Рунета. Для хранения текстовых копий страниц, так называемый инверсный индекс не подходит, так как очень затратно по времени каждый раз восстанавливать порядок слов в исходный текст. Намного проще хранить второй индекс, который и называется ПРЯМЫМ, на жаргоне разработчиков. Прямой индекс представляет из себя тексты веб страниц полностью очищенные от всех элементов, кроме текстовых – сжатых и упакованных. И ЭТО является копией всего Интернета. Именно эта функция дает возможность поисковым системам показывать не только цитаты и фразы, но и восстанавливать веб страницы, даже если они уже не существуют, данная страница у Яндекса называется «Сохраненной копией» а у Гугла «Сохроненное в кэше» Большинство поисковых систем сохраняют копии страниц в чистом текстовом виде без кодовых разметок, а Яндекс с 2006 года сохраняет полную копию, которую можно лицезреть в полном объеме со всеми фото, так же поступают и поисковые роботы компании Гугл.