Искусственный интеллект, разработанный для обработки письменного языка, может использоваться для предсказания событий в жизни людей. В рамках исследовательского проекта, проведенного учеными из DTU, Копенгагенского университета, ITU и Университета Нортестера в США, были изучены большие объемы данных о жизнях людей. Эти данные использовались для обучения так называемых «трансформерных моделей» (аналогичных ChatGPT), которые могут систематизировать информацию и предсказывать, что произойдет с человеком в будущем, а также определять даже время его смерти.
В новой научной статье под названием «Использование последовательностей жизненных событий для предсказания человеческих жизней», опубликованной в Nature Computational Science, исследователи проанализировали данные о здоровье и трудовой деятельности 6 миллионов датчан, разработав модель под названием life2vec. После начального этапа обучения, на котором модель изучала закономерности в данных, она показала превосходство над другими нейронными сетями и смогла с высокой точностью предсказывать такие события, как личностные черты и время смерти.
«Мы использовали модель, чтобы ответить на фундаментальный вопрос: насколько точно можно предсказать будущее человека, основываясь на его прошлом? С научной точки зрения для нас важен не сам факт предсказания, а те аспекты данных, которые позволяют модели давать такие точные ответы», — говорит Сунне Леманн, профессор DTU и первый автор статьи.
Предсказания времени смерти
Предсказания от Life2vec отвечают на общие вопросы, например: «смерть в течение четырех лет?». Когда исследователи проанализировали ответы модели, результаты подтвердили существующие данные социальных наук. Например, люди, занимающие руководящие должности или имеющие высокий доход, имеют больше шансов выжить. В то же время мужчины, люди с низкой квалификацией или с диагнозами психических заболеваний находятся в зоне более высокого риска смерти. Life2vec кодирует данные в виде сложной системы векторов — математической структуры, организующей различную информацию. Модель размещает данные о дате рождения, образовании, зарплате, жилье и здоровье.
«Интересно рассматривать человеческую жизнь как длинную последовательность событий, подобно тому, как предложение состоит из слов. Обычно трансформеры в ИИ применяются для таких задач, но в наших экспериментах мы используем их для анализа так называемых “жизненных последовательностей” — событий, которые произошли в жизни человека», — объясняет Сунне Леманн.
Этические вопросы
Исследователи подчеркивают, что использование модели life2vec поднимает множество этических вопросов, таких как защита личных данных и предвзятость в данных. Эти проблемы необходимо глубже осмыслить, прежде чем модель можно будет использовать для оценки, например, риска возникновения заболеваний или других предотвратимых событий в жизни человека.
«Модель открывает важные положительные и отрицательные перспективы, которые требуют обсуждения и решения на политическом уровне. Подобные технологии для предсказания жизненных событий и поведения человека уже используются технологическими компаниями для анализа нашего поведения в социальных сетях, создания точных профилей и предсказания нашего поведения. Этот вопрос должен стать частью демократического диалога, чтобы общество осознавало, куда нас ведет технология и является ли это направлением, которое мы хотим поддерживать», — подчеркивает Леманн.
Следующим шагом, по словам исследователей, станет включение других типов информации, таких как тексты и изображения, а также данные о социальных связях. Это откроет новые возможности для взаимодействия между социальными и медицинскими науками.