Узнавайте новости удобнее
О проекте

Findly является новостным сервисом и позволяет узнать за 10 секунд непредвзятую информацию о важных событиях.
Весь контент на сайте формируется полностью автоматически без участия человека.
На findly ежедневно публикуется подборка интересных событий, а также всегда доступен онлайн-анализ любого события.
Findly является полноценным продуктом: есть сайт, приложение под IOS и Android и Telegram-бот.
Мы сравниваем сотни публикаций на самых известных новостных ресурсах с помощью десятков алгоритмов и предлагаем пользователю:
- Факты и цитаты в интересном пользователю порядке
- Самую интересную нейтральную новость – новость, которая содержит в себе наибольшее количество информации из всех новостей
- Альтернативные точки зрения – ссылки на публикации, в которых информация подаётся не нейтрально
- Видео по теме
- Оценку популярности
- Подборку похожих событий
- Онлайн-анализ по любому событию
Цель проекта
В современном мире постоянно генерируется огромное количество информации, и людям достаточно трудно объективно её оценивать, не поддаваясь субъективному влиянию источника информации.
В сети Интернет все агрегаторы предлагают простой список ссылок на источники, однако порядок их формирования остаётся пользователю непонятным.
В связи с чем цель проекта – это создать агрегатор новостей, помогающий пользователю ориентироваться в обилии ссылок и быстро находить нужную информацию. Помимо всего прочего, он вычленяет из новостей факты, находит самую полную нейтральную новость и предупреждает пользователя, если какие-то статьи содержат предвзятое отношение к событию.
Этапы работы
- 01.02: Утверждение темы
Была утверждена тема проекта, сформирована команда - 03.02: Утверждение этапов
Были утверждены этапы работы, распределены роли, выбрана платформа для разработки и основной функционал - 09.02: Создание сайта
Был создан сайт со всем необходимым функционалом для работы, продуман дизайн и пользовательский интерфейс
- 16.02: Релиз прототипа
Был создан Python-скрипт, который на основе специальных алгоритмов ищет новости, анализирует их и отправляет результат на почту. На этапе прототипа основные алгоритмы анализа данных работают примитивно, а анализируемая новость указывается вручную. Была создана страница проекта на GitHub. - 04.03: Написание модуля автоматической публикации новостей
Был написан модуль, который преобразовывает данные в корректную разметку и отправляет их на сайт, почту и телеграмм-канал. - 12.03: Релиз бета-версии
Программа была разделена на модули. Также расширен основной функционал. Добавлены модули: поиска цитат и диалогов, поиска меток, поиска картинок, анализа популярности. Были серьезно улучшены и переработаны алгоритмы поиска фактов и наиболее интересной и полной новости, улучшено считывание текста. - 15.03: Создание классификатора для оценки нейтральности
Датасет для анализа нейтральности теперь формируется автоматически на основе сохранённых нейтральных и предвзятых новостей. Значение для того, чтобы считать текст предвзятым тоже высчитывается автоматически. - 16.03: Создание модуля автополнения сайта
Интересные новости и точки зрения на них теперь ищутся автоматически в Интернете по рубрикам. - 20.03: Добавление алгоритма ранжирования фактов
Каждому факту присуждаются баллы, исходя из его интересности. Благодаря этому, теперь выводится 10 самых интересных фактов, а не 10 первых - 22.03: Создание Анализатора
Был создан телеграмм бот, в котором анализ по новости или любому другому запросу можно получить в режиме реального времени. Он написан с использованием асинхронных функций, поэтому быстро и правильно работает даже с несколькими пользователями.
- 24.03: Создание PWA
Для сайта было создано PWA приложение которое может быть установлено на любую операционную систему (Windows, IOS, Android). Оно является полной копией сайта с поддержкой кеширования. - 09.04: Улучшение производительности и точности
Производительность была ускорена приблизительно 2 раза благодаря замене циклов на регулярные выражения и созданию паттернов для популярных сайтов. Также добавлена поддержка авторитетных сайтов, например, словарей и справочников. Алгоритм понимает, когда пользователь задаёт общий запрос, не связанный с новостями, и помечает приоритетными справочные ресурсы, а не новостные. - 25.04: Ребрендинг
Закончен ребрендинг. Теперь наш продует называется findly. Сайт переехал на новый домен findly.info. Раньше проект назывался Naggregator, что сложно звучало и добавляло сложности в разграничение подсервисов. Теперь название лаконичнее и позволяет комбинировать названия: findly новости – для новостей, findly бот – для онлайн-анализа и так далее. Также домен теперь не привязан только в российскому региону. Также был полностью переработан и улучшен интерфейс сайта и приложения – теперь дизайн помогает пользователю получить необходимую информацию, а не отвлекает его. UI улучшался на основе Яндекс.Вебвизора – мы внимательно изучили карту скролла и карту кликов и подстроили дизайн под эти показатели. - 07.05: Расширение возможностей Анализатора
Теперь анализатор автоматически понимает тип запроса и причисляет его к 1 из 4 категорий:
1. Новости, в которых наиболее важны цифры в фактах
2. Новости, в которых наиболее важны персоны в фактах
3. Запросы, которые актуальны прямо сейчас (курс доллара, падение акций)
4. Интеграция с сайтами (погода, подборки, Политех, YouTube, Википедия и так далее)
F. A. Q.
Зачастую, новостные издания занимаются переписыванием новостей друг от друга. Алгоритм Findly помогает пользователю ознакомиться с оригинальной статьей, минуя чтение этой же самой информации в другой обертке.
Алгоритм поиска наиболее интересной публикации старается предложить пользователю новость, в которой содержится наибольшее количество важной информации. Для этого он интеллектуально ищет статью, в которой содержится наибольшее количество информации из других статей по данному запросу с помощью матрицы смежности.
В качестве наиболее интересной публикации может быть предложена только нейтральная статья, так как миссия нашего проекта доносить до людей объективную информацию.
Русский язык чрезвычайно сложен и зачастую даже для человека непосильной задачей является понять посыл автора и сравнить его с другой точкой зрения, так как этот процесс субъективен.
Чтобы обеспечить объективность и непредвзятость, алгоритм поиска альтернативных точек зрения находит только существование точки зрения или её отсутствие на основе нашей собственной разработки – индекса нейтральности – критического количества частей речи, в которых можно уловить авторскую позицию.
Анализ этой позиции остаётся за пользователем.
В первую очередь, в тексте необходимо оставить непосредственно информацию – для этого из него удаляются диалоги, цитаты, скобки, вводные слова, перечисления и прочее. Затем оставшийся текст разбивается на предложения, а те, в свою очередь, на леммы. Мы используем нейросеть с открытым исходным кодом для начисления рейтинга каждому предложения, исходя из количества определённых лемм в нём.
Для каждого типа запроса свой алгоритм начисления баллов. В результате, система выводит 10 наиболее релевантных предложений.