В Университете Осло лингвисты работают со специалистами по искусственному интеллекту, чтобы разоблачить язык фейковых новостей, который они называют Fakespeak. Основной целью исследований, говорят ученые, улучшить имеющиеся инструменты проверки фактов.

Представлено устройство для тех, кто любит писать, но не хочет отвлекаться на что-то другое

Как проходило исследование

В 2003 году журналиста New York Times Джейсона Блэра разоблачили в фабрикации ряда новостных статей об американских солдатах во время войны в Ираке. Журналист пытался представить войну в положительном свете и максимально показать военных героями. Ученые собрали эти фальшивые тексты и сравнили их с подборкой реальных новостей, написанных Блэром. Тексты, которые стали лишь началом большего анализа, действительно оказались разными по стилю.

Исследователи обнаружили несколько больших языковых отличий:

  • Вымышленные тексты имели более неформальный стиль, а честные содержали более высокую плотность информации.
  • В истинных текстах прослеживается более частое использование существительных и слов, заменяющих существительные. В среднем слова длиннее.
  • В поддельных текстах чаще используются глаголы, особенно в настоящем времени. Кроме того, чаще встречались местоимения, прилагательные, эмоционально окрашенные слова, возгласы.

Также он использует меньше метафор в своих фейковых новостных статьях, чем когда пишет правду,
– рассказывает Силье Сюзанна Альвестад, руководитель проекта.

Вместе с тем Блэр часто использует лингвистические элементы, описывающие или пытающиеся вызвать положительные эмоции, что необычно для фейковых новостей, обычно склонных к запугиванию. Исследовательница говорит, что это могло быть связано с темой.

Ученые идут дальше

Текстов Джейсона Блэра в общей сложности набирается всего 80 страниц, поэтому специалисты по машинному обучению решили привлечь больший набор данных. Они добавили тексты разных авторов из сервисов проверки фактов.

Теперь исследователи работают над обнаружением языковых признаков фейковых новостей на других языках. Они уверены, что если удастся доказать значимое сходство, это даст мощный инструмент для борьбы с фейками в интернете.