Российская нейросеть отличила Неудачников от отличников публикациями в соцсетях | Журнал "Вольт"
Чт. Окт 29th, 2020


Российские ученые разработали алгоритм, который, судя по сообщениям в социальных сетях, может отличать отличников от бедных с точностью до 94%. Статью с результатами его работы опубликовал научный журнал EPJ Data Science, коротко об этом пишет ТАСС со ссылкой на пресс-службу Высшей школы экономики.

Фото: pixabay.com
Фото: pixabay.com

«Наша модель с точностью 94% определила студентов с высокой и низкой успеваемостью в сообщениях ВКонтакте. Мы также успешно применили его к коротким текстам в Twitter. Такой подход также может быть полезен для выявления депрессии, которая влияет на академическую успеваемость », – сказал Иван Смирнов, автор работы, заведующий лабораторией вычислительных социальных наук Института образования Национального исследовательского университета« Высшая школа экономики ».

В течение последнего десятилетия социологи, математики, физики и даже эпидемиологи активно изучали, как информация распространяется через социальные сети и как такие данные могут использоваться для изучения личностных черт и поведения пользователей таких сайтов.

Например, два года назад американские социологи создали систему, с помощью которой можно было оценить вероятность развода на основе сообщений в Facebook. Их российские коллеги научились вычислять семейное положение пользователей и пол человека по активности в социальных сетях. Точно так же британские ученые создали алгоритмы, которые оценивают уровень IQ и пять основных черт личности человека по его предпочтениям.

Смирнов и его коллеги задумались, можно ли с помощью таких технологий определить успеваемость школьников и студентов, а также оценить, какие проблемы могут помешать им успешно учиться.

Что характеризует плохих и отличников

Для этого ученые собрали и изучили сообщения, которые оставили на своих страницах в ВКонтакте около 2,4 тыс. Подростков, сдавших в 2012 году специальный тест на оценку грамотности и умения применять знания на практике в рамках Международной программы оценки Образовательные достижения студентов (PISA).

Ученые использовали эти данные для обучения нейронных сетей, которые могут анализировать семантическое содержание и стиль текстовых сообщений в социальных сетях и сравнивать их с типичным уровнем образования и успеваемостью людей, имеющих схожие интересы, знания и стиль письма.

После того, как нейронная сеть научилась достаточно точно определять плохих и отличных студентов, Смирнов и его коллеги протестировали алгоритм на наборе данных, полученном в результате анализа сообщений от студентов из ста крупнейших университетов России. Благодаря этому они подтвердили точность прогнозов нейронной сети и выделили несколько типичных черт плохих и отличников.

В частности, алгоритм обнаружил, что последние характеризуются длинными текстами, относящимися к литературе, физике, и описаниями мыслительных процессов. Кроме того, у них богатый словарный запас, который часто содержит иностранные слова. Для неудачников характерны ошибки, смайлы, восклицания и слова, написанные заглавными буквами. Они чаще обсуждают гороскопы, военную службу и дорожно-транспортные происшествия.

«Наши результаты еще раз показывают, насколько уязвима конфиденциальность пользователя в социальной сети. Люди обеспокоены повсеместным распространением фотоаппаратов и систем распознавания лиц, однако даже такой, казалось бы, незначительный цифровой след, вроде короткого текста, может стать источником информации, которую человек даже не собирался раскрывать », – заключил Смирнов.



Source link

от ТАСС

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *