
Данные до 2022 года стали “доядерной сталью” для обучения ИИ
Искусственный интеллект, призванный стать локомотивом технологического прогресса, начинает тормозить собственное развитие. По данным издания The Register, генеративные модели заполнили интернет таким количеством синтетического контента, что это создаёт настоящий технологический тупик.
И мы наблюдаем формирование “цифрового замкнутого круга”. Новые модели искусственного интеллекта всё чаще обучаются на материалах, созданных предыдущими версиями искусственного интеллекта. Результат напоминает классическую игру в “испорченный телефон”. Где каждый последующий участник передаёт всё более искажённую информацию. В профессиональных кругах этот сценарий получил название “коллапс модели”.
Возникает поразительная аналогия с доядерной сталью! Точно так же, как металл, произведённый до первых ядерных испытаний в июле 1945 года, ценится за отсутствие радионуклидов, так и данные до 2022 года становятся бесценным ресурсом из-за минимального “загрязнения” синтетическим контентом.
Морис Чиодо, научный сотрудник Центра изучения экзистенциального риска при Кембриджском университете, подчёркивает: доступ к “чистым данным” критически важен для предотвращения деградации моделей.