ALGEMENE INLIGTING

Al die onderstaande projekte vorm deel van groter projekte by CTexT. As sodanig sal u begelei word deur ’n dosent by Lettere en of Natuurwetenskappe, sowel as ’n navorser/ingenieur by CTexT.

Masjienvertaling vir Suid-Afrikaanse tale

Masjienvertaling behels die outomatiese vertaling van tekste van een taal (byvoorbeeld Engels) na ’n ander taal (byvoorbeeld Afrikaans). CTexT® het oor die laaste 5 jaar reeds masjienvertaalsisteme vir Engels na Afrikaans, isiZulu, Sesotho sa Leboa en Tshivenda ontwikkel en daar word beoog om masjienvertalingsisteme vir al die Suid-Afrikaanse tale te ontwikkel. Die kompleksiteit van taal en die diversiteit van tale maak dit ’n besondere uitdagende taak vir ’n rekenaar. Hoe moet ’n rekenaar byvoorbeeld weet om “Sy het haar man geslaan” te vertaal as “She hit her husband” en nie as “She has her man hit” nie?

Om hierdie tipe probleme op te los, word gewoonlik een van drie benaderings gevolg:

   •   reël-gebaseerde benaderings;

   •  data-gedrewe benaderings (deur byvoorbeeld van masjienleertegnieke gebruik te maak); en

   •   hibriede benaderings (kombinasies van die vorige twee benaderings).

Hulpbronontwikkeling vir Suid-Afrikaanse tale

Alle taaltegnologiese toepassings bestaan uit ʼn kombinasie van verskillende tegnologieë en datastelle wat die prosessering van natuurlike taal moontlik maak. Suid-Afrikaanse tale beskik nie oor toegang tot baie van hierdie hulpbronne nie en waar die hulpbronne wel bestaan is daar ruim geleentheid vir die uitbreiding en verbetering van die hulpbronne.

Hulpbronne waarop die sentrum fokus sluit in:

   • outomatiese morfologiese en sintaktiese analiseerders;

   • outomatiese betekenisanaliseerders;

   • hulpbrontoetsing;

   • databasis- en annoteringstelsels;

   • teksgenerering- en vraag/antwoordsisteme;

   • ongekontroleerde leer vir kerntegnologieë; en

   • teks-na-spraaksintese.

Ander navorsingsmoontlikhede

Buiten die projekte waaraan daar aktief by CTexT® gewerk word, is daar navorsingsgeleenthede in die volgende velde:

   • inligtingonttrekking en -ontsluiting;

   • outomatiese e-posklassifikasie;

   • plagiaatopsporing;

   • foutontleding; en

   • skryfhulpmiddels (onder andere spel- en grammatikatoetsers).

Beroepsmoontlikhede

Daar is verskeie werksgeleenthede vir spesialiste in die veld van taaltegnologiese toepassings, van groot internasionale maatskappye soos Google, Twitter, Amazon, Microsoft, ens. tot kleiner Suid-Afrikaanse maatskappye en navorsingsinstansies. Van die moontlikhede sluit in:

   • internet- en inligtingstegnologie-bedrywe

   • bankwese;

   • telekommunikasiewese;

   • leksikografie en woordeboekontwikkeling; en

   • navorsing.