Добавить
Уведомления

Correctness-Guaranteed Code Generation via Constrained Decoding

Генерация кода с гарантированной корректностью с помощью ограниченного декодирования Данный документ описывает метод генерации семантически и корректного при выполнении кода с использованием языковых моделей (ЛМ). Он решает значительную проблему обеспечения корректности кода, генерируемого ЛМ, особенно для критически важных приложений, таких как видеоигры и робототехника, где требуется однократная точность. Авторы предлагают новый алгоритм ограниченного декодирования, который включает контекстно-зависимый парсер. Этот парсер, основанный на концепции динамического «Дерева Парсеров» (ToP), направляет генерацию кода, выдавая регулярные выражения на каждом шаге, обеспечивая семантическую корректность и будущую валидность программы. ToP интегрирует контекстную информацию, такую как области видимости переменных и ограничения типов, удовлетворяя потребность в немедленной семантической обратной связи во время инкрементальной генерации токенов. Алгоритм также включает процедуру «лечения токенов» для устранения несоответствий между токенами ЛМ и состояниями парсера. Подход демонстрируется на sLua, строго типизированном варианте Lua, успешно генерируя семантически корректные программы, соответствующие предписанным программным интерфейсам (API). Более того, в работе показано, что при тщательном проектировании API эти семантические гарантии могут распространяться на корректность во время выполнения, что подтверждается генерацией игровой механики для видеоигры в жанре roguelike. Этот метод позволяет ЛМ создавать сложный, безошибочный код для критически важных производственных сред. #ГенерацияКода #ЯзыковыеМодели #ОграниченноеДекодирование #СемантическаяКорректность #КорректностьВыполнения #ДеревоПарсеров #sLua #ИИПрограммирование #РазработкаПО #COLM2025 документ - https://arxiv.org/pdf/2601.15445v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

Иконка канала Paper debate
4 подписчика
12+
3 просмотра
2 месяца назад
12+
3 просмотра
2 месяца назад

Генерация кода с гарантированной корректностью с помощью ограниченного декодирования Данный документ описывает метод генерации семантически и корректного при выполнении кода с использованием языковых моделей (ЛМ). Он решает значительную проблему обеспечения корректности кода, генерируемого ЛМ, особенно для критически важных приложений, таких как видеоигры и робототехника, где требуется однократная точность. Авторы предлагают новый алгоритм ограниченного декодирования, который включает контекстно-зависимый парсер. Этот парсер, основанный на концепции динамического «Дерева Парсеров» (ToP), направляет генерацию кода, выдавая регулярные выражения на каждом шаге, обеспечивая семантическую корректность и будущую валидность программы. ToP интегрирует контекстную информацию, такую как области видимости переменных и ограничения типов, удовлетворяя потребность в немедленной семантической обратной связи во время инкрементальной генерации токенов. Алгоритм также включает процедуру «лечения токенов» для устранения несоответствий между токенами ЛМ и состояниями парсера. Подход демонстрируется на sLua, строго типизированном варианте Lua, успешно генерируя семантически корректные программы, соответствующие предписанным программным интерфейсам (API). Более того, в работе показано, что при тщательном проектировании API эти семантические гарантии могут распространяться на корректность во время выполнения, что подтверждается генерацией игровой механики для видеоигры в жанре roguelike. Этот метод позволяет ЛМ создавать сложный, безошибочный код для критически важных производственных сред. #ГенерацияКода #ЯзыковыеМодели #ОграниченноеДекодирование #СемантическаяКорректность #КорректностьВыполнения #ДеревоПарсеров #sLua #ИИПрограммирование #РазработкаПО #COLM2025 документ - https://arxiv.org/pdf/2601.15445v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

, чтобы оставлять комментарии