UniLab • უნილაბი

Qart-NLP

QARTNLP – შენი კიბერ იარაღი, ქართული ენის ციფრული დამუშავებისთვის

Group 9

მოვიდა დრო, რომ კალამი, სურვილისამებრ, მაისურის მხარზე გააპრიალო და გვერდით გადადო, მოიმარჯვო კომპიუტერი და შეუდგე დიდი ტექსტების დახარისხებას, ქართული ენის  დამუშავების პლატფორმაზე.


ეს მეგობრული ციფრული მოწყობილობა, რომლის გამოყენებაც ძალზედ მარტივია, დიდი ალბათობით შენი შეუცვლელი დამხმარე გახდება.

პრაქტიკული გამოყენების სისადავე  QartNLP-ს მთავარი ნიშა არაა, პლატფორმა, მასში ტექსტური ფაილის ატვირთვის შემდეგ იმ შემთხვევაშიც კი გააგრძელებს მის მორფოლოგიურ თუ სუფიქსურ დამუშავებას, თუ უეცრად ინტერნეტთან წვდომას დაკარგავ, ან კომპიუტერი დაუგეგმავ შესვენებაზე გასვლას გადაწყვეტს და  საერთოდ გაგეთიშება,  შენ კი სანამ ჩაის მშვიდად მიირთმევ, QartNLP ამ დროს სიტყვებს უნიკალურ ლემებამდე დაიყვანს და ამ სიტყვათა დახარისხება/გაფილტვრის პროცესში ისეთი სიტყვების აღმოჩენაშიც კი დაგეხმარება, რომელზეც მომავალში – შესაძლოა ახალი სიტყვების ლექსიკონი შეიქმნას.

საინტერესოა, ილიაუნის “ელექტრონული ლექსიკოგრაფიის” ფაკულტეტის, დოქტორანტურის სტუდენტ სალომე ჭიღლაძის გამოცდილება, თუ როგორ გამოიყენა  QartNLP-ის პლატფორმა  თავის სადოქტორო კვლევაში: “ქართულ-ინგლისური სასწავლო ონლაინ ლექსიკონის მოდელი იგორ მაჩუკის თეორიის პერსპექტივიდან.”

კითხვაზე თუ – რა როლი ითამაშა  QartNLP-იმ  მის კვლევაში, გვიპასუხა:

“ნაშრომზე მუშაობისას ყველაზე გამოსადეგი იყო ლემატიზატორი, ვინაიდან მქონდა დიდი რაოდენობით სიტყვანი, ხელით კი შეუძლებელი იყო ამ მოცულობის მასალასთან გამკლავება, მისი დახმარებით მქონდა პირველი ხელშესახები შედეგები პრაქტიკული მიმართულებით.

მქონდა 137 ათასი სიტყვა და აქედან მივიღე 34 ათასი ლემა, მნიშვნელოვნად დამიზოგა დრო, რადგან ეს დღემდე არ მექნებოდა დამუშავებული”


ილიას სახელმწიფო უნივერსიტეტის დოქტორანტურის სტუდენტ – ლექსიკოგრაფმა თამარ ლალუაშვილმა კი გაგვიზიარა თავისი გამოცდილება თუ როგორ გამოიყენა ლემატიზატორი საკუთარ სადოქტორო ნაშრომზე მუშაობისას:

“ლემატიზატორი მნიშვნელოვანი ხელსაწყოა ლინგვისტებისთვის, რადგან ხშირად ლექსიკონების შედგენისას, როცა ხდება მასალის ტოკენიზაცია, გვჭირდება სიტყვების უნიკალურ ლემებამდე დაყვანა, რათა არ გამეორდეს სიტყვები. ზოგჯერ არ არის აუცილებელი, რომ ლექსიკონში ყველა ბრუნვის ფორმა, გრამატიკული დრო ან პირის ნიშნები შევიტანოთ.

ლემატიზატორი გვაძლევს ამ მასალის გაფილტვრის და ერთ ფორმამდე, სიტყვამდე დაყვანის საშუალებას. ეს წიგნის შემთხვევაში დაზოგავს დიდ ადგილს და რა თქმა უნდა დროს, რადგან არ მოგიწევს ხელით წვალება და გადარჩევა მასალის”

ხელსაყრელია არა?

მაშინ, თუ დროის და ენერგიის დაზოგვა შენს პრიორიტეტებშიც არ თმობს პირველობას და საქმის გამარტივება შენი საყვარელი ჰობია,  სცადე შენი ცხოვრების შეცვლა  qartnlp-ს პლატფორმასთან დამეგობრებით, რომელიც შენი მარჯვენა ხელი გახდება- ქართული ენის დახვეწილი მოდელის ჩამოყალიბებაში.

მოვიდა დრო, რომ – გამოცადო.

უნილაბის კიბერამბების გამოწერა შეგიძლია აქ: