ქართული ენის ნაციონალური კორპუსის არქონა ართულებს კვლევების წარმართვას ქართველოლოგიის მიმართულებით და ქართული ენობრივი მასალის გაღრმავებულ შესწავლას მსოფლიოში აღიარებული სტანდარტებისა და მეთოდების გამოყენებით.
დღესდღეობით არსებობს შემდეგი კორპუსები:
TITUS - ARMAZI - კავკასიური ენები და კულტურები: ელექტრონული დოკუმენტაცია
პირველი ქართულენოვანი ტექსტების აკადემიური მონაცემთა ბაზა. აერთიანებს სხვადასხვა პერიოდის ქართული ლიტერატურის ტექსტურ მასალას.
ხელმძღვანელი: იოსტ გიპერტი
TITUS - ARMAZI -
პირველი ქართულენოვანი ტექსტების აკადემიური მონაცემთა ბაზა. აერთიანებს სხვადასხვა პერიოდის ქართული ლიტერატურის ტექსტურ მასალას.
ხელმძღვანელი: იოსტ გიპერტი
კორპუსი მოიცავს ორ სუბკორპუსს: თანამედროვე ქართული ენის კორპუსს (124 055 170 ერთეული) და ქართულ ლიტერატურულ კორპუსს, მორფოლოგიური ანოტირებით (20 903 850 ერთეული). პროექტის ხელმძღვანელი: Paul Meurer, Uni Computing[2].
საქართველოს ლინგვისტური პორტრეტი[3] - ქართული დიალექტური კორპუსი
ქართულ დიალექტურ კორპუსში წარმოდგენილია სამი ქართველური ენა (ქართული, სვანური, ზანური) და მათი დიალექტები. პროექტის ხელმძღვანელი: მარინე ბერიძე.
ილიას სახელმწიფო უნივერსიტეტის მიმდინარე პროექტები:
- “ვეფხისტყაოსნის“ ქართულ-ინგლისური კორპუსი
- თანამედროვე ქართული ენის კორპუსი (1991-2011)