В Університеті Осло лінгвісти працюють з фахівцями зі штучного інтелекту, щоб викрити мову фейкових новин, яку вони називають Fakespeak. Основною метою досліджень, кажуть науковці, є поліпшити наявні інструменти перевірки фактів.

Цікаво Представлено пристрій для тих, хто любить писати, але не хоче відволікатись на щось інше

Як проходило дослідження

У 2003 році журналіста New York Times Джейсона Блера викрили у фабрикації низки новинних статей про американських солдатів під час війни в Іраку. Журналіст намагався представити війну в позитивному світлі й максимально показати військових героями. Вчені зібрали ці фальшиві тексти й порівняли їх із добіркою реальних новин, написаних Блером. Тексти, які стали лише початком більшого аналізу, дійсно виявилися різними за стилем.

Дослідники виявили кілька великих мовних відмінностей:

  • Вигадані тексти мали більш неформальний стиль, а чесні містили вищу щільність інформації.
  • У правдивих текстах прослідковується частіше використання іменників і слів, що замінюють іменники. У середньому слова довші.
  • У підроблених текстах частіше використовуються дієслова, особливо в теперішньому часі. Крім того, частіше зустрічалися займенники, прикметники, емоційно-забарвлені слова, вигуки.

Також він використовує менше метафор у своїх фейкових новинних статтях, ніж коли пише правду,
– розповідає Сільє Сюзанна Альвестад, керівниця проєкту.

Разом із тим Блер часто використовує лінгвістичні елементи, які описують або намагаються викликати позитивні емоції, що незвично для фейкових новин, зазвичай схильних до залякування. Дослідниця каже, що це могло бути пов'язано з темою.

Вчені йдуть далі

Текстів Джейсона Блера загалом набирається лише 80 сторінок, тому фахівці з машинного навчання вирішили залучити більший набір даних. Вони додали тексти різних авторів із сервісів перевірки фактів.

Тепер дослідники працюють над виявленням мовних ознак фейкових новин іншими мовами. Вони впевнені, що якщо вдасться довести значущу схожість, це дасть потужний інструмент для боротьби з фейками в інтернеті.