Кристина Каю
Руководитель информационного центра социальных и гуманитарных наук, Эстонская национальная библиотека
Быстрое распространение генеративного искусственного интеллекта способствовало появлению большого количества фальсифицированного и низкокачественного контента — как на книжном рынке Amazon, так и среди научных публикаций, особенно в Google Scholar. Искусственный интеллект позволяет создавать большие объёмы текстов практически без затрат. Это представляет угрозу для авторов, работающих в научной сфере, вводит в заблуждение потребителей информации и может подрывать доверие к науке.
На книжном рынке Amazon искусственный интеллект сделал создание поддельного контента простым и дешёвым. Если раньше такая деятельность требовала значительных ресурсов, то теперь тексты можно создавать быстро и с минимальными усилиями. Наиболее распространённые формы мошенничества — это краткие пересказы и руководства по популярным книгам, которые продвигаются рядом с оригинальными произведениями. Часто такие публикации просто повторяют основные положения исходного материала, не предлагая содержательного анализа. Кроме того, без разрешения публикуются биографии, в которых используются имена известных авторов и факты их жизни, хотя сами тексты фактически созданы искусственным интеллектом и нередко содержат неточности. Также ИИ применяется для переформулирования оригинальных текстов с целью продажи их как новых произведений, хотя их содержание основано на уже существующих материалах. Такая практика снижает доходы оригинальных авторов и вводит читателей в заблуждение: они могут воспринимать подобные тексты как достоверные или подлинные источники.
В научной сфере похожие проблемы проявились в Google Scholar, где для индексирования научных текстов используются автоматизированные системы. В отличие от научных баз данных с более строгим контролем качества, такой подход позволяет распространяться и низкокачественным материалам, а также текстам, содержащим недостоверную информацию. В ходе исследований было выявлено множество подозрительных статей и фальсифицированных научных работ, в которых встречаются характерные для искусственного интеллекта формулировки. Это создаёт угрозу для надёжности научной коммуникации и использования научно обоснованной информации: подобные тексты искажают научную дискуссию и затрудняют различение достоверной информации и дезинформации.
Особенно тревожит то, что значительная часть таких статей посвящена политически чувствительным темам, включая здоровье, окружающую среду и технологии. Подобные материалы могут использоваться для влияния на общественное мнение. По мнению экспертов, с этой проблемой необходимо целенаправленно работать. Одним из важных шагов считается чёткая маркировка контента, созданного искусственным интеллектом, чтобы пользователи могли более осознанно оценивать его надёжность. Также существует потребность в законодательных мерах, которые защищали бы права авторов и ограничивали злоупотребление их именем или творческим стилем. В случае научных баз данных важно развивать более точные фильтры, позволяющие отличать рецензируемые научные работы от непроверенных материалов. Кроме того, необходимо обращать внимание и на саму академическую систему — например, на давление, связанное с необходимостью публиковать большое количество статей, поскольку оно может способствовать злоупотреблению искусственным интеллектом.
Как оценивать надёжность научной статьи или другого источника при поиске информации и написании исследовательской работы?
Анализируй язык, выражения и структуру текста
Хотя искусственный интеллект пишет на английском языке достаточно грамотно, у таких текстов есть определённые особенности:
- Чрезмерная статистическая предсказуемость. ИИ оптимизирован на предсказание статистически наиболее вероятных следующих слов, чтобы создавать убедительно звучащий текст. Учёные же сосредоточены на проверке гипотез и точном описании экспериментов, поэтому их язык обычно более разнообразен и менее «предсказуем».
- Повторы слов и смысловых связей. Исследования показывают, что в текстах, созданных ИИ, часто используется меньше уникальных слов, при этом эти слова теснее связаны между собой. В результате текст может казаться плавным, но его содержание нередко оказывается повторяющимся и замкнутым на одних и тех же идеях.
- Бессодержательные пересказы. Часто такие тексты просто повторяют основные положения исходного произведения, не добавляя нового анализа или комментария.
- Типичные формулировки, характерные для искусственного интеллекта.
- В статьях, созданных ИИ, в заголовках и основном тексте часто используются общие модные слова, чтобы материал выглядел актуальным. Обращай внимание на слова и выражения, которые звучат убедительно, но не несут конкретного содержания.
Проверь, где опубликован текст
Значительная часть сомнительных текстов, созданных ИИ, не публикуется в надёжных научных журналах.
- Неиндексируемые журналы. Многие работы, созданные с помощью ИИ, обнаруживаются в журналах, которые не входят в официальные научные базы данных, такие как Scopus или Web of Science.
- Google Scholar. При использовании Google Scholar следует быть осторожным, поскольку эта система включает в результаты поиска и тексты, не прошедшие строгий контроль качества.
Проверь ссылки
Убедись, что статьи и источники, на которые ссылается автор, действительно существуют.
Изучи автора или издателя
Полезно найти дополнительную информацию об авторе или издателе. Проверь официальный сайт, а также посмотри, есть ли у автора предыдущие публикации или другие работы.
Использованные источники:
AI Is Driving a New Surge of Sham ‘Books’ on Amazon. (2024). AuthorsGuild
Haider, J., Söderström, K. R., Ekström, B. & Rödl, M. (2024). GPT-fabricated scientific papers on Google Scholar: Key features, spread, and implications for preempting evidence manipulation. HKS Misinformation Review.
Constantino, T. (2024). AI Tools Fuel Rise Of Fake Research Papers On Google Scholar. Forbes
Rajkumar, R. (2024). Study finds AI-generated research papers on Google Scholar – why it matters. Zdnet.
Moersen, A. (2025) AI detection for peer reviewers: Look out for red flags. Sage.
Статья впервые опубликована на сайте RaRa.ee: “Tehisintellektiga loodud valeinfo teadusartiklites – kuidas eristada õiget? – Eesti Rahvusraamatukogu”, автор Kristiina Kaju, дата публикации — 27 апреля 2026 года.