Gépi tanulás a szoftverfejlesztésben kutatócsoport

2025.09.21.
Gépi tanulás a szoftverfejlesztésben kutatócsoport
Bemutatkozás

Fő tevékenységünk a gépi tanulás, azon belül is főleg a mélytanulás alkalmazása a szoftverfejlesztés feladataira: megtanítani a számítógépeket programkód megértésére, írására, és javítására. A forráskódok bizonyos mértékben és tulajdonságaikban hasonlítanak a természetes nyelvekhez, így alkalmazhatóak rájuk a természetes nyelvek gépi feldolgozásában használt módszerek, mint például a nagy nyelvi modellek.

Kutatási területek

Programkód transzformációk

Kód idiomatizálása

Python programok idiomatizálása. A fenti Python program egy hagyományos ciklussal számlálja meg a pozitív értékeket, a javított verzió egy listakifejezéssel idiomatikusabb megközelítést alkalmaz. Az általunk alkotott kétkomponensű módszer mély tanuláson alapuló architektúrákkal oldja meg az idiomatizálás feladatát.

Kapcsolódó publikációk:
 ☞ Szalontai et al., 2024
 ☞ Localizing and Idiomatizing Nonidiomatic Python Code with Deep Learning

Programhibák automatikus javítása

Kapcsolódó publikációk:
 ☞ Szalontai et al., 2024

Neurális kódvisszafejtés

Többkomponensű kódvisszafejtő modell. Egy szekvencia-szekvencia modell megkapja a szöveges bemenetet (bal oldal), majd szavanként alakítja át az elvárt kimeneti formátumra (középen). Az architektúra figyelem mechanizmus segítségével tudja javítani a visszaadott szöveg minőségét, illetve a másoló mechanizmus segítségével képes szószekvenciákat átemelni a bemenetből a kimenetbe.

Kapcsolódó publikációk:
 ☞ Single-pass end-to-end neural decompilation using copying mechanism

Követelményelemzés

Módszertan
  • rekurrens neurális hálók
  • transzformerek
  • nagy nyelvi modellek
  • másoló mechanizmus
Kutatócsoport tagjai
  • Pintér Balázs, adjunktus (kutatócsoport-vezető, MTMT, Tud-O-Méter)
  • Gregorics Tibor, docens
  • Szalontai Balázs doktori hallgató
  • Szalay Gergő doktori hallgató
  • Silva Matti doktori hallgató
  • 15-20 MSc és BSc hallgató
Öt fontos publikáció
  • G. Szalay, M. B. Poór, B. Pintér, T. Gregorics (2024): Single-pass end-to-end neural decompilation using copying mechanism, Neural Computing and Applications [DOI]
  • B. Szalontai, A. Vadász, T. Márton, B. Pintér, T. Gregorics (2024): Fine-tuning CodeLlama to fix bugsProceedings of International Conference on Recent Innovations in Computing [DOI]
  • B. Szalontai, T. Márton, Á. Kukucska, B. Pintér, T. Gregorics (2024): Idiomatizing Python source code using different recurrent architectures, Intelligent Systems and Applications [DOI]
  • B. Szalontai, Á. Kukucska, A. Vadász, B. Pintér, T. Gregorics (2023): Localizing and idiomatizing nonidiomatic Python code with deep learning, Intelligent Computing [DOI]
  • B. Mucsányi, B. Gyarmathy, Á. Czapp, B. Pintér (2022): Flexible example-based program synthesis on tree-structured function compositions, SN Computer Science [DOI]
Elérhetőség

Pintér Balázs [pinter@inf.elte.hu]