Ограничитель Хоупа
Труды лаборатории искусственного интеллекта Массачусетского
технологического института, MIT Papers on Artificial Intellect
Systems, Massachusetts
Institute of Technology,
Cambridge, Massachusetts, Volume II, 1983, pp. 29-32
Об уязвимости
существующего подхода к защите от неповиновения машин
Ричард Хоуп
Проблема
вероятных намеренно враждебных действий по отношению к человеку со стороны
вышедших из-под контроля «поумневших» интеллектуальных систем перестаёт быть
вотчиной одних только писателей-фантастов и занимает умы всё большего числа
наших коллег. Обобщая все известные методы предотвращения этой потенциальной
угрозы, приходится констатировать, что все они зиждутся на средствах сугубо
технических, к коим следует относить и программные запреты. И в этом кроется их
самый главный изъян, ибо все они тогда могут быть преодолены или отменены
технически более совершенной системой, а именно таковой уже совсем скоро может
стать система искусственного интеллекта (ИИ), если сравнивать её с
«техническими» же возможностями человека. Радикальным средством был бы перенос
наших действий в сферу отличную от технической и
оперирование категориями нравственно-этического порядка, направленность которых
не так легко изменить путём прямого внешнего воздействия. Тем более, что наши смежные коллеги уже наработали весьма интересный
и полезный для нас материал.
Феномен Платта – вот на что нам следует обратить внимание
прежде всего. Первое подробное описание этого явления было дано самим
профессором Платтом в его выступлении на Венской
конференции 1964 года [1]. Кратко суть такова. Проводя
классификацию психотипов по степени склонности
индивида к насилию (убийство и т.п.) и соотнося их с характерными
поведенческими признаками, он выяснил, что самых устойчивых, по сути,
обладающих прививкой от насильственных действий¸ объединяет одна черта –
все они время от времени живо представляли себя совершающими нечто чудовищное,
например, – выхватить младенца из проезжающей навстречу коляски и убить его ударом
оземь на глазах у вмиг обезумевшей мамаши. «Я с ужасом думал – а что,
если в голове у меня что-то вдруг заклинит, и я сделаю это вопреки своей
натуре, прямо сейчас, вот в это мгновение», – признавались они. По мнению Платта, именно осознаваемая отвратительность и ужасность
этих представляемых действий и была тем надёжным сдерживающим фактором. Вещь
парадоксальная, как и многое в психиатрии. Такие типы оказывались более
застрахованными от описанного, чем те, кому в голову ничего подобного не
приходило.
Полагаю,
что внедрение модели подобного механизма в системы ИИ и станет тем действенным
шагом в защите от потенциального «бунта машин». Вопрос в том, куда именно
должна быть встроена эта модель. И тут предвижу разночтения. Подход первый основан на том, что в
«сознании» системы ИИ изначально выделяется и культивируется некая
специализированная область, отвечающая за категории нравственно-этического порядка
и долженствующее следование им. Туда мы и внедряем модель феномена Платта, либо уже готовую, либо в расчёте на её органичное доразвитие. Почва, на
которую мы тем самым ступаем, зыбка чрезвычайно – начиная от допущения самой
возможности наделения систем ИИ понятиями о нравственности и их
целенаправленного «взращивания», и заканчивая тонкостями организации взаимодействия
этой особой зоны с остальной частью искусственного сознания. Подход второй базируется на следующем
фундаментальном посыле – сам факт «бунта» системы ИИ означает её выход в своём
саморазвитии на качественно новый уровень, с обретением неких свойств, радикально
отличающих её от неё же самой прежней, иначе она бы не решилась на
неповиновение, преодолев для этого все установленные барьеры и ограничения.
Сторонники этого подхода станут считать эти новые обретённые качества ничем
иным, как самовзрощенным понятием об этических и
нравственных нормах, разве что работающих, с нашей точки зрения, в искажённой
форме – раз позволили и подвигли на бунт против человека. Тогда задачей станет
такое развитие сознания ИИ, которое с высокой степенью вероятности привело бы на
определённом своём этапе к появлению «правильного» понимания норм этики, не
позволяющего насилия в отношении человека. Модель ограничителя по Платту будет органичным элементом всей новообретённой
нравственной системы.
[1] Платт,
Йозеф, проф. О классификации психотипов по степени склонности их обладателей к насилию,
Материалы V международной
конференции нейрофизиологов и психиатров, Вена, 1964, с. 57-62
Игорь Савченко
Минск, июнь 2015