Специалистам в отрасли удалось разработать принципиально новую архитектуру нейронной сети, которая получила название KAN. Ранее в основе архитектур глубокого обучения всегда лежал многослойный перцептрон (MLP).

Новая архитектура нейронной сети Kolmogorov-Arnold Networks отличается от предшественницы способом перемещения активаций с весов и нейронов на "ребра" сети. В то время как MLP имеют детерминированные функции активации в нейронах, в KAN они перемещены непосредственно на веса внутри сети и становятся объектами обучения.

Сравнение двух архитектур. Источник: https://datasecrets.ru/

Новая архитектура по своей работе схожа с глубокими математическими принципами, в числе которых теорема об аппроксимации Колмогорова-Арнольда. В процессе тестов KAN показала преимущество перед MLP в точности, а также большую гибкость, которая в дальнейшем поможет заново интерпретировать сети.

Добавим, что у нового метода есть свои недостатки. В сравнении с прошлой архитектурой новая дольше обучается, также процесс требует большей вычислительной мощности в связи со сложностью обучаемых активаций.

В перспективе KAN может полностью заменить MLP, на ее базе появится целое поколение новых больших языковых моделей. Такой поход обеспечит резкий рост способностей искусственного интеллекта.

Ранее издание involta.media опубликовало статью о том, что модель искусственного интеллекта под названием NtechLab может спрогнозировать инсульт.