Летом 2023 года руководитель направления «Программная инженерия» Государственного университета «Дубна» Мария Ушанкова, проверяя дипломные работы студентов в системе «Антиплагиат», вдруг отметила, что оригинальность их резко выросла по сравнению с предыдущими годами. А одна дипломная работа оказалась помечена системой как сгенерированная нейросетью почти полностью. Через полгода, когда Мария Ушанкова проверяла на «Антиплагиат» дипломы студентов-заочников, работ, в которых присутствует текст, сгенерированный нейросетью, было уже 15 из 25.
На международной научной конференции «Математика. Компьютер. Образование», которая прошла в Университете «Дубна» в начале 2024 года, Мария Ушанкова выступила с докладом «Влияние нейронных сетей на процесс написания дипломных работ студентами». И ее доклад на круглом столе «Цифровые платформы, искусственный интеллект и анализ данных» вызвал большой интерес.
– Мария, расскажите, пожалуйста, как для вас началась история выявления студенческих работ, сгенерированных нейросетью?
– Я работаю в Институте системного анализа и управления, подразделении, которое занимается подготовкой ИТ-специалистов. Я преподаю дисциплины, связанные с программированием. Как ученый секретарь государственной экзаменационной комиссии и обладатель расширенной учетной записи на сервисе «Антиплагиат», помогаю студентам проверять их работы на оригинальность. По нашему регламенту, чтобы дипломная работа была допущена к защите, процент ее оригинальности должен быть не меньше 70%.
И раньше, когда ChatGPT еще был недоступен широкой общественности, многие работы на первой проверке не дотягивали до 70 %, я начинала переписку со студентами и их руководителями на тему переработки текста. Летом 2023 года я заметила, что подобных переписок я веду исчезающе мало. Более того, оригинальность студенческих работ стала заметно выше!
В какой-то момент пришла работа, которую сервис «Антиплагиат» пометил как подозрительную. Раньше «подозрительной» этот сервис называл работу, в которой, например, русские буквы «а» и «о» меняют на английские, или мелким белым шрифтом между строк пишут какой-то параллельный текст – глазу такие вещи не видны. «Антиплагиат» ловит такие способы повысить оригинальность очень хорошо.
Однако в мае 2023 года сервис «Антиплагиат» запустил бета-версию проверки текстов на присутствие текста, сгенерированного нейросетями. Именно такая работа попалась мне летом.
Студенты уже используют нейросети для написания дипломов, просто сейчас появился механизм, который может это выявить. Пока этом механизм не лишен недостатков, но он развивается.
ChatGPT – это продвинутый «Т9» из мобильных телефонов
– Скажите, пожалуйста, а по содержанию сгенерированный текст можно отличить от текста, написанного человеком?
– Человеку это определить сложно. Должен быть очень насмотренный глаз. Просмотрев кучу таких текстов, имея личный опыт генерации текстов, я уже могу определять, что с большой вероятностью писала нейронка, а что с большой вероятностью писал человек.
Вообще, нам всем надо понимать, по какому принципу работает ChatGPT. Если сильно упростить, то это продвинутый «Т9» из мобильных телефонов. Он «придумывает» наиболее вероятные слова, которые будут следующими в сообщении. Но в отличие от модели «Т9», которая не умела хранить длинный контекст фразы, модель СhatGPT научилась это делать очень хорошо. Поэтому она «придумывает» следующее слово уже с большей долей вероятности.
Но пока что нейросетям сложно дается конкретика. Налить воды в текст – это пожалуйста. Но написать что-то осмысленное по конкретной теме, да еще и с подробностями, им пока удается плохо. Рецензент той самой дипломной работы, которую мы отловили как сгенерированную, говорила об этой работе: «Такое ощущение, что написана какая-то ерунда, как будто у человека в голове вата». Она не знала, что работа сгенерирована. Конечно, студенту пришлось еще поработать над своим дипломом.
– Как еще студенты используют нейросети, помимо написания дипломных работ?
– Нейросети отлично справляются с тестами. Студенты копируют вопрос и варианты ответов. И нейросеть не просто пишет, какой вариант правильный, она еще и объясняет почему. По крайней мере, это работает с тестами по английскому языку и по программированию. Думаю, что с другими тестами ситуация будет похожая.
Нейронные сети правильно отвечают на экзаменационные билеты по программированию и отлично генерят программный код программисту в ответ на подавляющее большинство простых задач.
Уже есть много сервисов, которые пишут курсовые и дипломы для студентов. Подобные услуги были всегда. Но раньше эту работу выполняли люди, а теперь нейросети. Более того, появляются нейросети, которые редактируют сгенерированные студенческие работы, так чтобы они были похожи на написанные человеком.
ChatGPT не обладает сознанием, но галлюцинации у него бывают
– Скажите, пожалуйста, какие слабые места есть у ChatGPT?
– Слабые места ChatGPT – отсутствие глубины и экспертности. Еще ChatGPT иногда галлюцинирует. Например, я делаю запрос: «Напиши текст о 8-й нормальной форме базы данных». Это айтишная история. И он мне ее описывает: выдает очень умный на вид текст, к которому не придерешься. За исключением того, что 8-й нормальной формы базы данных не существует. Их всего семь.
Однажды я наткнулась на статью, написанную медиками. Они спросили ChatGPT о каком-то несуществующем термине или заболевании. И получили отличный текст, очень похожий на медицинский. Потом они попросили ChatGPT привести научные источники, на которые можно сослаться. И нейросеть сделала это, указав источники, индексы на PubMed, по сути, выдумав несуществующие статьи. Так происходит, потому что ChatGPT – это генеративная модель. Все очень правдоподобно, но может оказаться неправдой.
Нейросеть прекрасно генерит фотографии с людьми. Современные модели уже разобрались с правильным количество пальцев на руках, но на групповой фотографии нейронка все еще может перепутать количество и положение ног.
– В чем сильные места нейросети? Чем можно и стоит пользоваться в образовательном процессе?
– Нейросеть – это просто котел мыслей и подсказок. Можно ее попросить написать варианты тем для дипломной или курсовой работы. Она отлично с этим справляется. Она напишет план для доклада, презентации, сочинения. Может написать введение или аннотацию. Нейросеть можно использовать для подсказки чего-то, чего ты не знаешь, как Гугл. Но только лучше. Гугл дает ссылки, по которым нужно еще что-то искать, а здесь будет готовый ответ. Нейросеть неплохо придумывает задачки для обучающих курсов.
Есть сервисы, которые делают презентации, иллюстрации. Есть нейросети, которые прекрасно генерят изображения, исторические фотографии, изображения в стилях разных художников.
Нейросети уже ворвались в нашу жизнь, мы их не можем отменить, они будут использоваться все больше. И человек, который умеет пользоваться нейросетью, на рынке труда будет более конкурентоспособен, чем тот, кто этого не умеет. Программисты, журналисты, редакторы, авторы детских романов, сценаристы фильмов, дизайнеры, мультипликаторы – нейросети коснутся очень многих профессий. Сейчас компания OpenAI, выпустившая ChatGPT, анонсировала нейронную сеть, которая делает видео по описанию. И делает здорово. Интересно, что будет с кинематографом лет через десять, какие возможности принесет генерация видео в индустрию производства видеоконтента.
– А может ли нейросеть, например, содействовать благотворительности?
– Нейросети могут использоваться для сбора и анализа данных, что поможет фондам работать более эффективно. Среди программистов много волонтеров, которые решают задачи таких фондов. Пишут автоматизированные системы для горячих линий. Анализируют юридические тексты – базу судебных решений, например. Даже делают приложения, которые детям сказки рассказывают.
– О чем важно знать преподавателям, которые уже столкнулись или в ближайшее время столкнутся с работами школьников и студентов, которые сгенерированы нейросетью?
– Студенты и школьники всегда будут решать задачу, как минимизировать количество времени и усилий, которые они тратят на освоение конкретной дисциплины. Такой конфликт интересов. Мы-то хотим, чтобы они больше трудились. По своему опыту я замечаю, что студенты, которые используют нейросети не глупее, чем те, кто их не использует.
Преподаватели должны понимать, что ученики все равно будут пользоваться нейросетями. Значит, и преподавателям имеет смысл осваивать эти технологии. Сейчас много разговоров: давайте мы им запретим, давайте вернемся к бумажным учебникам. Допустим. Но как потом студенты и выпускники вузов будут интегрироваться в современный мир, не зная технологий? Будут ли они конкурентоспособными?
Встречаю много вопросов от коллег: как мы можем отследить, сам студент написал эссе или его сгенерила нейросеть? Единственный способ выяснить это – обсудить написанное эссе с автором. Если ты хочешь действительно оценить работу студента и понять, что у него в голове, ты должен с ним поговорить.
– Есть ли какая-то статья в российском законодательстве, разрешающая или запрещающая использовать нейросети в написании дипломной студенческой работы?
– Сейчас допуск или недопуск конкретной работы с наличием сгенерированного текста к защите решается индивидуально. Естественно, определив, что работа сгенерирована нейросетью, я говорю об этом руководителю работы. Студент и руководитель вместе разбирают текст работы. До марта 2024 года в нашем университете не было никакого правового механизма, по которому мы не допускаем такую работу до защиты. Не было регламента, все на усмотрение комиссии.
Но сейчас в Университете «Дубна» внесены изменения в положение об итоговой аттестации, где прописано, что университет разрешает использование нейросетей при написании дипломных работ в определенном объеме.