Разработчик программного обеспечения и фанат электронных таблиц Айшан Ананд сумел втиснуть GPT-2 в Microsoft Excel. Эта возможность даёт представление о том, как функционируют большие языковые модели (LLM) и как лежащая в их основе архитектура Transformer осуществляет своё интеллектуальное предсказание следующего токена.
Вся работа уместилась в 1,25-гигабайтную электронную таблицу на GitHub, и любой желающий может её скачать и поэкспериментировать.
Естественно, GPT-2 в виде электронной таблицы несколько отстаёт от современных LLM 2024 года, однако GPT-2 была передовой разработкой и привлекла много внимания в 2019 году. Важно понимать, что GPT-2 – это не чат-бот, поэтому пообщаться с ним не получится. Одним из преимуществ использования GPT-2 в Excel является то, что эта LLM работает на 100% локально, без каких-либо вызовов API и обращения к интернету.
GPT-2 работает на основе интеллектуального «предсказания следующего токена», где языковая модель с архитектурой Transformer дополняет введённый фрагмент наиболее вероятной следующей частью последовательности. Эта электронная таблица может обрабатывать всего 10 токенов ввода, что ничтожно мало по сравнению с 128 000 токенов, которые может обрабатывать GPT-4 Turbo. Тем не менее это по-прежнему хороший демонстрационный вариант, и Ананд утверждает, что его работа идеально подходит для ознакомления маркетологам, менеджерам по продуктам, разработчикам, и учёным, которые только начинают знакомство с ИИ.