ЗАДАЧА

01

Сервис проверки поддельных новостей (fake news) в сфере технологий и инноваций

описание

Часто появляющиеся новости в сфере технологий и инноваций не имеют первоисточника, не связаны с указанным в статье экспертом или имеют колоссальные искажения по сравнению с изначальной публикацией или пресс-релизом. Это говорит о том, что эти новости и материалы можно отнести к поддельным. Задача призвана решить проблему поддельных новостей, которые мы потребляем из международных и российских СМИ.

призовой фонд 600 000 ₽

1 место

300 000 ₽

2 место

200 000 ₽

3 место

100 000 ₽

Победители

1 МЕСТО

NorthShine

Москва, Киров, Новосибирск, Уфа

Команда: Павел Злоказов, Полина Бескоровайная, Светлана Кучуганова, Антон Полегенько, Антон Лабунский

Решение: Создали веб-приложение для анализа новостей на достоверность. Приложение имеет различные возможности для пользователей и администратора.
Пользователи могут проверять новость по ссылке или просто тексту на достоверность, находить первоисточник, просматривать статистику проверки источников.
Оценка достоверности складывается из нескольких критериев:
• присутствие источника новости в white-листе
• семантическая близость новости с новостью оригинала
• различия в тональности с новостью оригиналом
• уникальность текста

2 МЕСТО

Geek'a Chad

Москва, Челябинск

Команда: Егор Смирнов, Борис Груздев, Роман Смирнов, Семён Кошкаров, Дмитрий Хуторной

Решение: Алгоритм на основе проверенного списка источников новостей позволяет определить степень достоверности произвольного текста, а также выделяет части новости, которые были искажены.
Особенность подхода заключается в уникальном алгоритме фрагментации текста на ключевые элементы, которыми могут быть как словосочетания, так и группы предложений. Именно этот подход позволяет преодолеть ограничение современных NLP моделей по длине анализируемых текстов.

3 МЕСТО

Ezee

Москва, Красногорск, Химки, Санкт-Петербург

Команда: Александр Сергеев, Алексей Шкиль, Мария Рубаненко, Игорь Боровик, Алиса Аленичева

Решение: Система выделяет семантическое ядро, проводит фактчекинг и сравнивает с фактами в анализируемой статье. В случае различия — статье начисляются «штрафные баллы».
Далее оценивается количество и «качество» СМИ, которые «перепечатывали» статьи. Если первоисточником было малоизвестное СМИ, статья не была размещена ни на одном из «доверенных» СМИ, снова начисляются «штрафные» баллы.
Штрафные баллы также начисляются за орфографические ошибки, «кликбейтность», индекс «воды», эмоционально окрашенные слова и 10+ других признаков. По сумме штрафных баллов определяется индекс фейковости новости