Пользователю нужно написать одно-два слова на русском или английском языках и выбрать один из стилей — и, как обещается, «Балабоба» создаст осмысленный текст на любую тему, похожий на тексты из интернета, на которых училась модель. Чтобы текст получился связным и грамматически правильным, модель генерирует его последовательно по словам и оценивает, насколько предсказанное слово корректно. Например, может ли после «Мама мыла...» идти слово «бегать» или слово «раму», отмечает издание..
«Балабоба» генерирует тексты с помощью языковой модели «Яндекса» YaLM, которая решает задачи, связанные с обработкой естественного языка. Например, модели YaLM помогают «Алисе» поддерживать беседу, определяют темы вопросов в «Кью», улучшают описания заказов на «Услугах», генерируют карточки для быстрых ответов в «Поиске». Также языковые модели YaLM ищут ключевые моменты видео, генерируют рекламные объявления и описания сайтов (сниппеты).
В семействе языковых моделей YaLM может быть от 1 млрд до 100 млрд параметров.
Самую большую двуязычную модель YaLM 100B на 100 млрд параметров «Яндекс» недавно выложил в открытый доступ. В «Балабобе» используется её облегчённая версия на 3 млрд параметров. Сообщается, что модель обучалась на терабайтах текстов англоязычного и русскоязычного интернета в равной пропорции.