По данным Яндекса, запрос "порно" поступает в поисковую систему примерно шесть миллионов раз в месяц. Та же цифра в иной размерности: 200 тысяч в сутки, 8300 раз в час, 140 раз в минуту, 2-3 раза в секунду. Важный запрос.
Аудитория Рунета 30 миллионов человек. Шесть миллионов от тридцати - это каждый пятый. Люди задают поисковику сотни миллионов разных запросов в месяц, но мнение пользователя о качестве поиска складывается из оценки ответов на запросы, сделанные лично им. Среднее же количество запросов одного человека невелико. Получается забавная математика: значение выдачи по одному запросу из сотен миллионов, казалось бы, мизерно, но, минимум, 20% аудитории Рунета оценивают поисковик всего по одной формулировке, и роль этой оценки в мнении каждого человека уже вполне значима. Вопрос: стоит ли отдельно задуматься над выдачей по столь важному запросу, или и дальше рассматривать его на общих основаниях - столько-то слов, столько-то внешних ссылок и т.д?..
Опыт практических размышлений об идеальной выдаче у нас есть. Напомню, что по-настоящему хорошая выдача в ответ на запрос "рассказы" была сформирована на основании идеи, что жанр литературного рассказа немыслим без признанных авторов. Сначала - идея, потом - поиск нужной информации и формирование результатов. Я далек от мысли, что самостоятельно смогу придумать единственно верную модель выдачи по запросу "порнография", но, глядя на то беспомощное, что предлагают сегодня Яндекс и Google, кое-какие очевидные шаги хочется предпринять.
Продавцы порнографии не устают повторять, что все пользователи с таким запросом хотят получить порно. Нашел, купил, употребил. Такова железная логика любой торговли: пользователи с запросом "автомобили" хотят приобрести автомобиль, "Египет" означает, что человек собрался провести там отпуск, а спросившему "героин" не терпится ширнуться.
Безусловно, желающие употребить имеются. Но это не "все" пользователи, только часть. Альтернативу торговому мейнстриму, рассматривающему интернет-аудиторию исключительно как сообщество покупателей, можно найти для любого информационного запроса. Слова те же, цели поиска - другие. С запросом "порнография" несложно представить родителей, озабоченных не этим самым, а проблемами своего ребенка, впервые столкнувшегося с порно-феноменом в Сети. В поисках аргументов родители зайдут на сайт поисковой системы и...
Согласно современным представлениям о качестве поиска, в ответ на запрос поисковик должен найти все соответствующие запросу страницы и сформировать выдачу по убыванию меры соответствия (по релевантности). Для запроса "порнография" Яндекс знает не менее 10 миллионов страниц. В результатах поиска можно просмотреть всего тысячу, самых-самых соответствующих.
В рамках родительского интереса нам нужно найти не порно, а статьи о нем. Явлению не одна тысяча лет, порнографию изучали медики, психологи, юристы, политологи, литераторы, кинематографисты и др., тема очень популярна в журналистике. Казалось бы, информации должно быть много.
Просмотрел всю тысячу результатов поиска, отобрать и проаннотировать удалось всего лишь 75 ссылок, см. выдачу Нейрона по запросу статьи о порнографии. Субъективные комментарии к процессу отбора (это впечатления, а не доказательства с цифрами).
- Ссылки на интересные статьи более-менее равномерно встречаются в диапазоне 1-1000 результатов поиска.
- Статьи условно делятся на две группы: а) много раз скопированные, б) мало. Дубликаты по результатам поиска "размазаны" неравномерно. Чем больше копий одной и той же статьи, тем чаще встречаются ссылки на нее в топовом диапазоне. Интересные статьи, для которых копий не заметил, начали попадаться, начиная от 400-500 позиций.
- Результаты поиска представляют собой хорошо перемешанную смесь из разных типов ресурсов: энциклопедия - статья - дорвей - новость - упоминание о фильме - форум - порносайт - дорвей - энциклопедия - упоминание - форум - новость - копия статьи - порносайт и т.д. Выглядят достаточно разнообразно, но, преследуя какую-то одну цель поиска, ориентироваться в таком наборе ссылок не очень удобно.
- В Тор1000 хорошо представлены результаты усилий по "статейному продвижению" порносайтов с помощью бирж. Объем можно оценить по запросу "Одним из жанров порнографического искусства является". 7229 найденных копий, в сниппетах фраза о порнографическом искусстве особенно хорошо смотрится под заголовками страниц "Такси и аренда автомобиля", "Евроремонт своими руками", "Туризм в Объединённых Арабских Эмиратах" и т.п. Многое из этого евроремонта такси в эмиратах попало в выдачу по запросу "порнография".
- Информативность сниппетов оставляет желать лучшего, безошибочно видны только ссылки на порносайты.
- В некоторых случаях найденный интересный документ был явно вторичного происхождения, приходилось искать первоисточник.
- Время работы (просмотр SERP Яндекса, отбор, аннотирование ссылок в Нейроне) - примерно 10 часов.
Итого: за два дня 70-80 ссылок. Подборка неплохо отражает взгляды общества на это явление: дается оценка бизнеса, статистика; есть мнения ученых, педагогов, медиков, представителей религии и культуры, государства; эмоциональные материалы о том, что порно вредно, и не менее эмоциональные о его если не пользе, то "безобидности"; юмор; исторический экскурс в древнегреческую "игривую" культуру; особенности порно в японском, американском, венгерском, русском и даже арктическом вариантах; холивар о разнице между порно и эротикой; примеры экспертизы и др.
70-80 ссылок - много или мало, если мы рассматриваем порнографию как тему именно информационного спроса, а не ищем голый видеоряд? Прочтя или даже бегло просмотрев отобранные материалы, представление получишь неплохое. Но все ли смогут и захотят посвятить несколько часов поиску? За привычные 10-15 минут найдутся 2-3 ссылки, зато вдоволь насмотришься предложений в стиле "Если вам уже есть 18+ лет". В результате и "тема сисек не раскрыта", и от поиска впечатления не самые лучшие.
Я часто пишу, что однотипная выдача в ответ на информационный запрос, который невозможно понять однозначно, - не очень удачное предложение поисковиков пользователям. Для оценки этого показателя даже есть специальный анализатор. В разобранном сегодня примере мы видим противоположную сторону медали: результаты поиска представляют неструктурированную смесь ссылок на разные типы ресурсов, но к идеалу мы не приблизились. Монотонная выдача приводит к тому, что только часть пользователей вообще не получает релевантных результатов. Ассорти в результатах поиска заставляет уже всех пользователей тратить лишнее время на сортировку. Где разумный баланс?
Выходом может быть такой подход: если запрос предполагает несколько целей поиска пользователям нужно предлагать не отдельные ссылки, а группы родственных ссылок, своего рода, "каталог" соответствующих запросу возможных направлений поиска. Как видим, добавление даже одной группы к рассмотренному запросу четко делит поток пользователей на желающих потреблять и желающих изучать порнографию.
Конечно, создание таких вот "каталогов" для сотен тысяч информационных запросов - дело не самое простое. Но и сегодняшний запрос выбран с умыслом. Приведенный пример хорошо иллюстрирует, как не слишком уж сложный ручной труд может привести к результату, который изменит представление о поиске примерно у шести миллионов человек в месяц.