Представлена новая бесплатная нейросеть OpenCodeInterpreter с открытым исходным кодом, которая предназначена для генерации кода.

ИИ-модель обучена на уникальном наборе данных под названием Code-Feedback. Он включает 68 тысяч взаимодействий, которые содержат инструкции пользователей и обратную связь компилятора.

Для обучения OpenCodeInterpreter также использовали запросы пользователей с платформы LeetCode, на которой разработчики обсуждают проблемы с кодом. Это помогло обеспечить широкий набор данных, а также даст пользователям возможность получать качественные ответы в случае возникновения проблем при кодировании.

Отметим, что для создания модели разработчики использовали комплексный подход, который включил пять различных методов сбора и обработки данных. Благодаря этому удалось решить три основные задачи: включение разнообразных реальных запросов, структурированный формат многооборотного диалога и чередование текстовых и кодовых ответов.

Данный набор позволяет модели как генерировать код, так и вносить в него правки на основе подсказок человека. Такой подход поможет установить новые стандарты в генерации кода.

Производительность нейросети OpenCodeInterpreter была проверена на таких тестах, как HumanEval и MBPP. ИИ-модель показала лучшие результаты среди похожих систем, в числе которых GPT-4.

Ранее издание involta.media опубликовало статью о том, что ученые нашли способ обходить цензуру в нейросетях.