Про фильтры и информационный шум

Зайчатки разума

Записная книжка айтишника

Про фильтры и информационный шум

2019-01-31 16:08:55 — Evgeniy Shumilov

  Мой хороший друг написал статью о твиттере, социальных сетях и почте. В статье помимо прочего было замечено следующее:

  Соцсети, например, создают очень сильный информационный шум. И если не уметь его фильтровать и отсеивать, то пользы не будет никакой. Будут усталые глаза, затекшая шея и ощущение, что ты сделал что-то полезное (на самом деле нет). Самый эффективный и простой инструмент доставки полезной информации — это электронные письма. И пока ничего более удобного не придумали.


  Подумалось о том, что почта прошла очень долгий эволюционный путь развития. Если бы не спамфильтры, не сотни специальных организаций, поддерживающих блеклисты, не возможность фильтрации на стороне клиента, сворачивание писем в цепочки, снабжение тегами и древовидная структура через imap, то мы бы тонули в информационном шуме почты намного быстрее, чем в шуме соцсетей. Каждый день вне зависимости от вашего пола вам предлагали бы увеличить член на полметра, приобрести массу архинужных и полезных (но явно не для вас) товаров, получить очередной миллиард в наследство от вашего уже шестнадцатого за неделю почившего бездетного дядюшки где-нибудь в Африке, открыть чудесный "архив" с названием "голенькиефотки.exe" и научиться зарабатывать 100 тысяч рублей в день без лишних вложений и телодвижений.

  А ведь несколько лет тому назад всё так и было. Проходило какое-то количество времени после того, как ты заводил себе новый ящик - и вот опять у тебя "дядя в Африке умер", а твой член опять короче на полметра, чем должен быть по мнению британских учёных. Меня часто посещают мысли о чудовищной разнице в уровне сложности между тем, что нам показывают и тем, как это устроено. Сколько сотен тысяч людей работали годами и работают сейчас для того, чтобы вам легче жилось? Каждый наш шаг, каждое нажатие на кнопку, прикосновение к экрану - это миллионы чьих-то бессонных ночей, страниц документации, миллиарды нажатий других кнопок. Это длинные цепочки препятствий, "невозможностей" и тонны задач, которые были кем-то преодолены. Просто для того, чтобы мы могли засунуть ноги в любимые кроссовки, прокатиться на троллейбусе, сходить в кино, посмотреть фотографии котиков, написать фигню в твиттер или забыть о спаме.

  Вот прямо сейчас я зашёл в свой основной почтовый ящик в отдельную папку со спамом. Там чуть больше шести сотен сообщений. Из них около сотни - от сервера, который я настраивал лет шесть тому назад. Судя по содержимому, он всё ещё работает, но жалуется то на недостаток места на диске, то на повышение уровня ошибок на жёстком диске. Одним словом - жив курилка, но следят за ним примерно никак. Даже не удосужились сменить почту, куда он отправляет алерты. Остальное же стало крайне однообразным. 90% всего спама предлагает мне заработать от 130 тысяч до миллиона рублей за 2 минуты, за пять минут или нажатием нескольких кнопок. Всё это - реклама казино. Мне интересно, откуда только появляется столько идиотов, которые кормят все эти казино и позволяют им тратить столько денег на рекламу? Такое ощущение, что есть некое тайное общество владельцев казино, которое на самом деле и правит миром.

  Ладно. Главное - в основной почте мы не видим рекламы долбанных казино и это прекрасно! А вот в каналах телеграма - пожалуйста. На YouTube помимо вездесущей рекламы казино недавно прокатилась волна рекламы заработка на "аукционе брошенных сайтов". Такая дичь, что слов нет. Есть ещё статья с рекламным обзором - мол, случайно наткнулся на это чудо, а оно работает! Так статья выложена на том же домене, на котором крутится сам разводящий скрипт. Случайно, да. Рекламное видео появляется прямо в главной ленте ютьюба. Комментарии к нему, само-собою, закрыты. В видео показывают, как кто-то переводит деньги, что-то выделяет, нажимает кнопку "купить", потом "продать", продаёт в два раза дороже, чем купил и затем после вывода показывают некий телефон, на который с 4х значного номера приходит смс - мол, средства получены! Д - Доказательство! Казалось бы, как на такое можно клюнуть? Ан нет, на подобном гребут миллионы лопатой.

  Собственно, главный вопрос таков: почему у нас есть отличные средства фильтрации того же информационного шума в почте, но их нет в других сервисах? Или по крайней мере они слишком убоги, когда они есть. Тот же YouTube предлагает фильтрацию следующего вида:

  Никаких тебе пайплайнов, никакой дополнительной логики (либо я плохо искал, ткните меня носом). А где мне добавить какой-нибудь фильтр вида "(пёс*|собак*) & !(кот*|кош*)", я уж не говорю о регекспах, это не всем нужно. Но почему нет простого общего стандарта построения и фильтрации поисковых запросов, в соответствии с которым я мог бы набрать в поисковой строке любого сервиса запрос и получить то, что мне нужно? Точнее, такие вещи есть, но встречаются далеко не везде. В том же google есть возможность строить более сложные запросы. В яндексе, естественно, тоже. Но почему я не могу подобным способом отфильтровать долбанную ленту контакта или выборку ютуба? Почему за меня опять решили, что мне нужно и интересно? Когда в поисковой выдаче YouTube результат будет более релевантен трендам, чем нашим запросам, YouTube превратится в телевидение.

  Конечно, я понимаю, что далеко не все будут готовы пользоваться подобными возможностями. Это же нужно пару раз обратиться к документации и что-то запомнить, ради того, чтобы сэкономить массу времени на протяжении последующих многих лет! Неужели абсолютное количество тех, кто в нашей стране способен на такой подвиг настолько мало, а реализация настолько сложна, что "геморрой не стоит свеч"? Почему я не могу создать глобальный фильтр для групп телеграма и добавить в него хотя бы единственное слово - "казино"? Потому что кто-то станет меньше зарабатывать на рекламе? А в отношении почтового спама это почему-то никого не волнует.

  У меня есть один способ, как не утонуть в море информации, и отфильтровать шум, я этим способом пользуюсь довольно давно, но с демонстрацией на текущий момент есть ряд сложностей из-за переезда домена на Яндекс.Коннект. Я оставлю это для отдельной статьи.

  Ну и напоследок - заметил за собой одну интересную особенность. Иногда, когда я настраиваю что-то не очень сложное или паяю, я в фоновом режиме могу прослушивать какой-нибудь подкаст. И если я потом его переслушиваю, то понимаю, что те обсуждаемые темы, которые мне не были особо интересны, я слышу будто впервые, а те, которые представляли для меня некий интерес, я помню достаточно хорошо. Похоже, мозг постепенно адаптируется к общему уровню информационного шума и сам отбрасывает ненужное.

Теги: мысли-вслух

comments powered by Disqus