Skip Navigation Links
Navigációs hivatkozások átugrása
Oktatási feladatok
Kutatási területek
Szervezeti felépítés
Magunkról
Kapcsolatok
Szakdolgozati témák: Dokumentum nyelvének és kódolásának az automatikus felismerése

Cím

Dokumentum nyelvének és kódolásának az automatikus felismerése 

Leírás

Létszám: 1 diák

Időtartam: 1-2 félév

Konzulens: Pataki Máté

Feladat: Egy olyan eszköz létrehozása, amely nagy pontossággal meg tudja állapítani szöveg nyelvét

és kódolását, valamint azt is, ha az adott szöveg értelmetlen, vagy sok hibát tartalmaz.

Elvárt funkciók, működés:

 - Egy tesztkollekció létrehozása, amely számos hibás és különleges kódolású szöveget tartalmaz

 - Kódolás és a nyelv felismerése kizárólag a dokumentum szövegének az ismeretében

 - Amennyiben a kódolás és a nyelv nem kompatibilis egy automatikus javítás (például kalapos

   magánhangzók cseréje hosszúra magyar nyelv esetében)

 - Felismerés megbízhatóságának becslése

Biztosítunk:

 - személyes konzultáció (Bp. 1111, Lágymányosi utca 11.)

 - folyamatos kapcsolattartás (telefon, skype, email)

 - a szerző(k) neve feltüntetésre kerül a szoftveren

 - megfelelő eredmény esetén részmunkaidős állás diákoknak, vagy teljes munkaidős végzés után

 

 

Konzulens neve

Pataki Máté (MTA Sztaki) 
Mellékletek
létrehozta: Abonyi-Tóth Andor  a következő időpontban: 2012.11.06. 12:06 
Utolsó módosítás: Abonyi-Tóth Andor  2012.11.06. 12:06