В статье о том, как искать mp3 в сети я показал пример использования не совсем обычного поиска в Гугле. Способ настолько интересен, что я часто использую его для поиска определенного файла, или например для поиска бэкапов сайтов или просто хранилищ «ушастых» пользователей. Дополнительные параметры чаще всего используются в SEO и хакерами. Просто так, для себя я использовал только фильтр по региону — которого, как ни странно, нет в качестве дополнительного параметра.
Так например, этот способ частично находит проблему переноса исходников SVN на публичный сервер. Как находит их сам Гугл, это уже другой вопрос 🙂
Остаток поста был скопирован с блога SeoNinja. И так, Данный список содержит популярные операторы поисковой системы Google, а также полезные параметры адресной строки.
Операторы строки запроса
Оператор | Пример запроса | Описание |
---|---|---|
filetype: | продвижение оптимизация filetype:doc | Искать файлы только указанного типа (по расширению файла) |
site: | черный список site:searchengines.ru | Искать в пределах сайта или домена (с поддоменами) |
inurl: | inurl:продвижение | Искать страницы со словом в адресе (URL), с русским языком работает нормально |
allinurl: | allinurl: продвижение сайтов | Искать несколько слов в URL страницы |
intext: | intext:раскрутка | Искать слово в тексте (<body>) страницы |
allintext: | allintext: раскрутка бесплатно | Искать несколько слов в тексте (<body>) страницы |
intitle: | intitle:»Бесплатное продвижение» | Искать слово или фразу (в кавычках) в заголовке (<title>) страницы |
allintitle: | allintitle: Продвижение гарантии | Искать несколько слов в заголовке страницы (<title> в html и его аналоги в других типах документов) |
inanchor: | inanchor:»SEO анализ» | Искать несколько слово или фразу в текстах ссылок (<a>) |
allinanchor: | allinanchor: SEO продвижение | Искать несколько слов в анкорах (<a>) |
daterange: | ePassporte daterange:2454833-2454863 | Искать в страницах, проиндексированных в указанный промежуток дней (указывать необходимо Юлианские даты) |
related: | related:seo.ru | Найти похожие (по мнению Google) страницы |
info: | info:seoninja.ru | Показать информацию о странице (если она проиндексирована) |
link: | link:domain.com | Показать список страниц, ссылающихся на указанный документ (URL) |
cache: | cache:domain.com/page.html | Показать версию документа, сохраненного в Google Cache |
define: | define:идиосинкразия | Определение (значение) фразы или слова. |
Пояснения и комментарии
filetype:
Вы можете ограничить тип искомого документа, например filetype:doc для Word, filetype:xls для Excel, filetype:pdf для PDF, filetype:ppt для PowerPoint.
Удобный оператор, если вы хотите найти образец какого-либо договора или презентации, чек-лист, заготовку для документа. Наоборот, если не хотите делиться со всем человечеством своими материалами — не вставляйте ссылки на свои документы, иначе они будут проиндексированы и доступны для поиска. Как вариант, закрывайте критичные типы файлов с помощью robots.txt (Disallow: /*.doc$).
Google ничего не знает о реальном типе документа, он ориентируется только на расширение файла/документа. У оператора есть синоним ext, то есть filetype:pdf и ext:pdf делают одно и то же. Важно: не ставьте пробел между двоеточием и расширением!
site:
С помощью этого оператора можно найти что-либо в пределах одного сайта, либо раздела сайта (google site:seoninja.ru/tag/). Если не указывать сам запрос, то Google покажет список всех проиндексированных страниц на сайте, либо домене с под доменами, либо в разделе сайта — что укажете в параметре site. В качестве области поиска можно использовать даже доменную зону (.ru, .co.uk, .gov и так далее). Пробел после двоеточия ставить тоже не надо.
inurl:
Поиск определенного слова в адресе страницы. Пригодно, например, для розыска однотипных приложений, например каталогов (inurl:addurl.pl) по заранее известному названию скрипта. Пробела тоже не надо.
allinurl:
Похоже на оператор inurl, но ищет страницы с несколькими словами в адресе. Как и предыдущий оператор, для осмысленного поиска по словам в рунете менее пригоден, чем для англоязычного сегмента — русский язык в адресах используется мало, а способов perevoda v latinicu больше, чем один, особенно для сложных слов.
intext:
Поиск слова в тексте документа, внутри тега body. Любопытен в комбинации с другими операторами, например intitle:seo -inbody:seo выдаст список страниц с плохой оптимизацией, по крайней мере по слову SEO.
allintext:
Поиск нескольких слов в текстах проиндексированных Гуглом страниц. Принцип тот же, что у allinurl, только область поиска иная.
intitle:
Поиск по заголовкам страниц. Принцип действия, полагаю, уже понятен. Любопытна возможность искать не только html по тегу title, но и по заголовку вордовского файла (intitle:bomb filetype:doc), который находится в свойствах документа (Файл — Свойства).
allintitle:
То же, что intitle, но ищет несколько слов. Например: allintitle:seo dumbest mistake.
inanchor:
Еще одна область для обнаружения искомого слова (или фразы, если в кавычках) — текст ссылки, он же якорь, он же анкор. Учитываются как исходящие ссылки, так и ссылки, ведущие на страницу.
allinanchor:
Тот же inanchor, только для нескольких слов. Поиск wordpress theme allinanchor: free download, теоретически, найдет нам страницу с бесплатными темами для WordPress.
daterange:
Оператор ограничивает область поиска только теми документами, которые были изменены или добавлены в индекс Google в течение указанного промежутка времени. Проблема в том, что промежуток надо указывать в Юлианских датах, например daterange:2455440-2455445 — это поиск с 1го по 6е сентября 2010 года. Перевести Грегорианские даты в Юлианские «дни с начала времен» можно здесь. Менее экзотический способ указать диапазон дат — выбрать ссылку ‘More search tools’ в результатах поиска, там есть набор популярных диапазонов, а также возможность указать свой.
related:
Поиск похожих страниц. Параметром к этому оператору будет адрес (URL) интересующей вас страницы, присутствующей в индексе. Результатом — список похожих страниц в индексе Google.
info:
Запрос info:site.com/path/page покажет, есть ли это страница в индексе, поможет узнать присутствует ли она в кеше Google, посмотреть список ссылающихся страниц и упоминаний — короче, это неплохой стартовый запрос, который несколько обесценивает операторы related, link, cache.
link:
Оператор link позволяет получить список страниц, ссылающихся на интересующую нас страницу, адрес которой необходимо указать после двоеточия. Проблема в том, что Google не позволяет отфильтровать ссылки с какого либо сайта, то есть link:seoninja.ru -site:seoninja.ru работать не будет, равно как и наоборот — нельзя посмотреть ссылки с какого-либо определенного сайта. Кроме этого, этот оператор показывает далеко не все проиндексированные ссылки.
cache:
Оператор cache показывает последнюю сохраненную в кеше Google копию страницы, а также показывает дату сохранения страницы.
define:
Учебно-развлекательный оператор, ищет значение, толкование, определение указанного в запросе слова или выражения. Полезно для устранения пробелов в эрудиции и образовании: define:smite
Параметры в строке запроса
Операторы можно использовать для создания эффективных запросов, но есть вещи, которые можно получить проще (или исключительно) путем подстановки параметров в строку с адресом выдачи Google.
Параметры передаются в виде пар переменная=значение, разделяются амперсандом (&) и начинаются после адреса страницы поиска, после знака вопроса. Порядок следования параметров не важен. Базовый адрес для поиска будет http://google.com/search или http://google.ru/search для рунета.
Параметр в URL | Пример | Описание |
---|---|---|
q | http://google.com/search?q=путин+калина | Самый простой запрос, искомые слова перечислены через +. Это единственный необходимый параметр. |
num | http://google.com/search?q=калина&num=100 | Установить количество результатов на страницу. По-умолчанию Google выдает только 10 результатов, то откровенно мало. |
start | http://google.com/search?q=сухой&start=990 | Показать выдачу, начиная с указанной в параметре позиции |
filter | http://google.com/search?q=мокрый&filter=0 | Включить отображение результатов поиска, которые Google по-умолчанию исключает, ввиду их сильной, по его мнению, похожести. Аналогично нажатию ссылки «repeat the search with the omitted results included» на последней странице выдачи. |
pws | http://google.com/search?q=синий&pws=0 | Выключить «персонализированный поиск». Запрос с добавлением &pws=0 выключает всякую персонализацию и ищет одинаково для всех пользователей, без учета «шлейфа» посещенных сайтов, предыдущих запросов и т.п. |
safe | http://google.com?q=зеленый&safe=off | Выключает (off) или включает (on) безопасный поиск Google. Фильтр убирает из результатов поиска «взрослые» страницы. Бывает любопытно, не попал ли сайт под него. |
strip | http://google.com/search?q=cache:www.amazon.com&strip=1 | Параметр специфичен для запросов к Google Cache. Добавление &strip=1 убирает из отображения картинки, стили, скрипты, которые кеш не хранит, то есть без этого параметра браузер заново обращается за ничи непосредственно на сайт. |
imgtype | http://google.com/images?q=cheese&imgtype=face | Работает только для поска картинок в Google Images. Варианты: face, photo, clipart, lineart, news. |
Метки:справочник, интернет
Похожие статьи
- 16 сентября 2009 -- Где скачать MP3 (11)
- 13 ноября 2008 -- Полная информация о сайте. (29)
- 20 декабря 2008 -- MP3/MP4 плееры из Китая с большим объемом памяти. (27)
- 15 февраля 2011 -- Поиск тематических сайтов на примере Mp3 порталов (4)
- 6 августа 2008 -- Сканеры трафика HTTP. (0)
6 февраля, 2012 at 22:19
Как посмотреть список страниц проиндексированных Гуглом с домена БЕЗ учета страниц на поддоменах?