Эволюция информационного поиска

Посмотрим на прошлое, настоящее и будущее информационного пространства. Эта часть отвечает на вопросы: почему и зачем делать новую информационно-поисковую систему? В чём проблема существующей парадигмы поиска и что даст людям переход на новую?

Смысл в том, что сейчас поставщики информации создают свои сайты и забрасывают их в информационное пространство, а поисковики потом это кое-как разбирают. А должно быть наоборот, сначала — структура, потом — заполнение информацией по ячейкам.

Чуть ниже — тезисы.

Прошлое:

  • поисковики родились из научной среды и заточены под неё
  • интернет начал обретать массовость
  • появилось много частных разрозненных сайтов
  • если нет структуры, то нужен полнотекстовый поиск и выдача списком

Настоящее:

  • появляются крупные проекты и агрегаторы
  • интернет обретает структуру
  • проще встроиться в систему (авито, купонаторы), чем создавать свой сайт
  • жесткая конкуренция за внимание пользователя
  • для решения своих проблем люди в основном пользуются крупными проектами, адреса которых знают наизусть
  • полнотекстовый поиск устаревает, повышается процент навигационных запросов
  • программистская среда немного опережает время, можно сравнить с ней и понять тенденции
  • неприменимость модели прошлого для массового рынка
    • сравнение несравнимого
    • рыночная ориентация
    • низкая компетентность пользователей

Будущее:

  • абсолютная структурированность
  • единая точка входа
  • невыгодно делать частные мелкие сайты
  • реклама станет сильно дорогой по сравнению с простым встраиванием в систему
  • семантический веб

Прошлое

Интернет родился из академической среды, его создавали люди, близкие к науке. В частности Google и алгоритм PageRank. Он изначально был предназначен для сортировки научных публикаций. Смысл простой — если на некоторую научную статью ссылается много других, то она имеет важность, из неё много полезных и интересных научному миру следствий и она по определению проверена на достоверность. Потом интернет начал выходить в массы. А там, где массы — там возможность покупать и продавать, конкурировать и сотрудничать. Интернет стал коммерческим. Появилось много частных сайтов, но в целом не было никакой структуры. Но при этом инструменты поиска не изменились, но появилось много различного рода костылей для борьбы с злоупотреблением. Война между поисковиками и SEO была долгой и захватывающей, но все проиграли, а конечные пользователи всё это оплатили, но ничего не выиграли. Подробно писать об этом не буду, думаю каждый близкий к этой сфере поймёт, о чём я. Причина этой войны в том, что изначальные правила были неверные, не приспособленные для рынка.

Почему так:

1) В научном мире заранее оговоренные правила игры и высокие требования к участникам. К тому же это не конкурентная среда в плохом смысле этого слова. В научном мире всё же люди идейные и больше настроены на сотрудничество ради поиска истины. Нельзя рассчитывать на то, что игроки на коммерческом рынке будут частными, можно разве что создать условия, при которых честность создаёт конкурентное преимущество.

2) Статьи — это текст. Полнотекстовый поиск здесь вполне уместен. А рынок товаров и услуг описывается не текстом, а числами.

3) Если построить для научного мира информационную модель, то в ней будет 2 оси: онтологии и вопросов (об этом я рассказываю в основной статье. При этом ось онтологии — это научные дисциплины, они присутствуют всегда как нечто само собой разумеющееся. В таком информационном пространстве результат в виде списка тоже уместен.

4) Информационные единицы в научном мире — это статьи. Они маленькие и их много. Вот и сайты тоже стали делать маленькие и много, по инерции, потому что такова выстроенная система. Люди начали клепать сайты-визитки, блоги, интернет-магазины и всё остальное, что пользуется спросом на фрилансе.

Следствие: Полнотекстовый поиск применим к научному миру и решает его задачи. Но нельзя взять решение, которое было получено для одной модели и применить к другой, в которой среда намного агрессивнее и по-другому устроена.

Настоящее

На схеме справа я изобразила пример сегодняшней картины. Раньше были только мелкие сайты, они изображены синим, потом начали появляться крупные проекты и агрегаторы. Они могут охватывать много онтологий и служить какой-то цели, типа авито или яндекс.маркета, тогда они растянуты по горизонтали. А могут охватывать какую-то онтологию и давать информацию разного типа обо всём, с ней связанным, типа тематических форумов или других проектов, например про беременность и роды: там можно и продавать, и покупать, и получать информацию, и общаться.

К тому же зачастую выгоднее создать агрегатор, чем заморачивачиваться с оффлайновыми бизнес-процессами. Ведь для поисковика важен текст, и ему всё равно, кто реально предоставляет услуги, а кто просто посредник. Благодаря этому интернет начал обретать структуру, потому что каждый успешный агрегатор разрешал запросы пользователей хорошо (лучше поисковика), потому как был заточен как раз под свою сферу.

Человек, который хочет продать б/у вещь, просто не будет создавать для этой цели сайт, не будет ходить на курсы по рекламе и так далее. Выгоднее просто выбросить эту вещь. В сфере мелких заработков это очевидно. Поэтому авито и стал популярным. Однако при увеличении объёмов это престаёт быть настолько очевидным. И этот порог (когда становится неочевидно) имеет тенденцию увеличиваться. Порог вхождения в предпринимательство — уменьшаться. Если раньше для своей какой-нибудь небольшой деятельности человек создавал сайт, то сейчас ему уже может хватить группы вконтакте или в инстаграмме. Сейчас становится всё проще встроиться в рыночную систему. Спрос на рынке создания сайтов уменьшается, как и на рынке SEO услуг.

Кроме того, нельзя сравнивать то, что служит разным целям. Нельзя сравнивать ВАЗ и ферарри. Или машину с колесом. Но вот поисковики бессовестно сравнивают несравнимые вещи, и представляют их в одном списке, и неважно, что эти объекты могут находиться в отношении «целое-часть» или «общее-частное». По запросу «Герберт Спенсер» выйдет и википедия, и интернет-магазин книг, и pdfки, и его биография, и группа вконтакте, и N философских блогов, и «скачать реферат онлайн бесплатно». А какой критерий сравнения? Частота встречаемости слов в тексте? А как насчёт коммерческих запросов?

Что делают люди? Они вводят «Герберт Спенсер википедия». Это называется навигационный запрос, в нём уже фигурирует сайт, где нужно искать. И поисковики адаптируются под такое поведение пользователей и начинают выстраивать очередные костыли. Если набрать в яндексе «hh python», то выйдет страница с сайтом hh, где в поисковой строке будет уже вбито «программист python» и выбран ваш город. Кажется, это удобно. Конечно. Но чувствуете ли вы в этой тенденции дыхание смерти полнотекстового поиска? Ведь остальные 363 тысяч результатов никому не нужны. Вообще. Яндекс в этой схеме используется только потому, что он на стартовой странице, это не более чем привычка и чуть-чуть лени. Сейчас доля навигационных запросов составляет примерно 40%, в основном ищут по вконтакте. До агрегаторов и социальных сетей, конечно, эта доля была меньше. Тенденция налицо.

К тому же в некоторых сферах полнотекстовый поиск уже проиграл и о нём забыли, например, вряд ли человек полезет в яндекс искать, как продать авто. Скорее всего он сразу пойдёт на авто.ру. Крупных агрегаторов не так много, они у потребителей на слуху. Поэтому люди заходят либо непосредственно туда, либо делают в поисковике навигационный запрос. Пример информационного агрегатора — википедия, услуг — купонаторы, Uber. Это пример того, когда люди в своих сферах начали просто делать своё дело, а не думать о том, где найти клиентов. Это разделения труда и вынос общих действий за скобки.

В остальных сферах царит жёсткая конкуренция и информационная война. Люди устают от информационного шума, ограждают себя, бизнесу становится к ним тяжелее пробиться, цены на рекламу увеличиваются, методы впаривания совершенствуются, порочный круг замыкается. А оплачивают это в конечном счёте всё те же люди, потому что в себестоимости товаров ВСЕХ участников рынка заложена «стоимость лида» (стоимость привлечения заинтересованного клиента). Ситуация довольно абсурдная, значит продержится недолго. Недаром в Яндекс.Толока одно и основных заданий — поиск информации. Какая ирония. А на фрилансе есть услуга «разгрести почтовый ящик», что как бы намекает на то, что с информацией, как исходящей, так и входящей, творится что-то нездоровое.

Хотелось бы ещё отметить ситуацию с полнотекстовым поиском в среде программистов. Она немного опережает время и по ней тоже можно понять тенденции. У программистов есть ряд таких проектов, которые по их запросам всегда на первых строчках. По факту, они ищут среди них. Программист знает, что если в поиск вылез сайт stackowerflow, то после перехода он получит информацию в формате вопрос-ответ. Если вылез readthedocs, то это документация, хабрахабр — статьи, github — исходный код, ещё есть пару известных форумов, ну и всё, это — 95% поискового поведения. Программист потому хорошо ищет, что он компетентен в том, что спрашивает, и заведомо знает, какого формата ответ ему нужен и где его найти. Чего нельзя сказать об обычном пользователе, которому понимание сначала нужно дать.

Ведь чтобы что-то понять, надо с чем-то сравнить. Слово «горячее» бессмысленно, если мы не знаем, что такое «холодное». Мы не можем узнать, хорош сайт или плох, если мы не видим альтернатив. Поэтому для разрозненной модели, где каждая единица информации существует сама по себе, такие понятия как «структурированность», «качество» и «смысл» просто отсутствуют (ибо не с чем сравнить). Если опять вернуться в научный мир, то это сообщество изначально высоко компетентных людей. У каждого из них все необходимые структуры и смыслы есть в голове. Как и у программистов, кстати. Интернет же должен для масс служить некоторым пространством, в котором эти структуры формируются, и ни в коем случае нельзя рассчитывать на компетентность пользователя.

Как я уже говорила, я рассматриваю только поиск по запросам, которые предназначены для решения каких-то задач, а не просто информацию. Такой поиск связывает двух субъектов — поставщиков и потребителей контента. Сейчас предполагается, что эта связь существует через ключевые слова. Но в реальном мире это не так, связь происходит не по ключевым словам, слова — это следствия. А причина — это решение конкретных задач. Потребители хотят решать свои задачи, а поставщики хотят зарабатывать деньги, создавая ценность для потребителей, т.е. решать их задачи. То есть именно задачи связывают бизнес и пользователей. Сегодняшняя модель поисковиков универсальна, но это идёт в ущерб качеству.

Например, «сдаю квартиру» и «сниму квартиру» — запросы, которые должны вести в одно и то же место, т.к. именно там встречаются искомые люди.Сейчас если человек хочет сдать квартиру (гипотетический пример), что ему писать в поисковик: «сдаю квартиру» или «сниму квартиру»? Если он на самом деле сдаёт, то ему нужны снимающие, следовательно, ему нужны те, кто где-то написали «сниму квартиру». Но он-то сдаёт. И наоборот. А если сдающий размещает где-то информацию, то с точки зрения SEO он должен употребить слова «сниму квартиру», т.к. по этому запросу его будут искать, поэтому он в объявлении должен написать что-то из серии «у меня вы можете снять квартиру». Неудивительно, что SEOшники вынуждены писать такие тексты, которые невозможно читать, и сайты их сделаны не для людей, а для того чтобы подняться в выдаче.

Надеюсь, мне удалось вас убедить в неприменимости такой поисковой модели для рынка. А теперь рассмотрим, как изменится наша реальность с введением новой модели.

Будущее

Рассмотрим подробнее преимущества данного проекта для потребителей и поставщиков информации.

Для производителя:

  • Иметь доступ к неудовлетворённому спросу и к тому, что сейчас в работе
  • Возможность представить свой товар и сразу выйти на потребителей
  • Полная информация о конкурентах, открытый рынок
  • Прогнозирование спроса на гипотетический товар с определёнными свойствами
  • Возможность продавать объединению людей без посредников
  • Лёгкий выход на рынок
  • Фокус на своей деятельности

Для потребителя:

  • Результат в зависимости от типа запроса
  • Различные способы решения задач (товары, услуги, информация)
  • База знаний и чёткое понимание рынка
  • Сортировки и фильтры по ключевым для пользователя показателям
  • Объединение потребителей для совместной закупки
  • Объединение потребителей для обмена информацией
  • Объективная информация о результативности предлагаемых благ
  • Возможность заявить об интересах, предзаказ
  • Вторичный рынок наряду с первичным

Получилась такая комбинация плановой и рыночной экономики, которая включает в себя преимущества той и другой. При этом не включает недостатки, ведь в такой системе нет ни дефицита, ни перепроизводства.

Рынок рекламы уменьшится во много раз и приобретёт другой вид, совершенно безобидный. Произойдёт это потому что выход на рынок станет дешёвым, намного дешевле чем внимание пользователей, которым это не нужно. Рекламу будут давать только те продукты, которые пользователи вряд ли будут искать просто потому что не знают в принципе об их существовании. Это новые продукты на рынке, для них нужно давать рекламу, но и конкуренции там не будет. Выходит честно. Можно встроиться в существующую систему практически бесплатно и конкурировать качеством, а можно попытаться создать новый рынок, это будет стоить денег, но может стать сверхприбыльным. Как в рулетке — ставим на красное или на ноль? В целом, всё станет намного справедливее.

Рынок мелкого фриланса сойдёт на нет, а поисковики сегодняшней модели канут в вечность. И дело не только в том, что за ними перестанут обращаться для решения жизненных (рыночных) задач, но также потому что и некоммерческая информация структурируется в онтологии и наступит семантический веб.

results matching ""

    No results matching ""