தமிழ் உரை பகுப்பாய்வில் செயற்கை நுண்ணறிவு (Artificial Intelligence in Tamil Text Analysis)
தமிழ் உரை பகுப்பாய்வில் செயற்கை நுண்ணறிவு (Artificial Intelligence in Tamil Text Analysis)
Authors: Dr. R. Poongothai, Dr. R. Nithya, Dr. S. Elayarani
ISBN: 978-81-69297-28-8
DOI: https://doi.org/10.59646/641
Date of Publication: March 25, 2026
Cite this book: R. Poongothai, R. Nithya, and S. Elayarani, (2026), Artificial Intelligence in Tamil Text Analysis, San International Scientific Publications, ISBN: 978-81-69297-28-8, DOI: https://doi.org/10.59646/641
Preface
“தமிழ் உரை பகுப்பாய்வில் செயற்கை நுண்ணறிவு” என்ற இந்த நூல், தமிழ் மொழியையும் நவீன தொழில்நுட்பத்தையும் இணைக்கும் ஒரு முயற்சியாக உருவாக்கப்பட்டுள்ளது. உலகம் முழுவதும் செயற்கை நுண்ணறிவு (AI) வேகமாக வளர்ந்து வரும் இக்காலத்தில், மொழி தொழில்நுட்பங்களின் முக்கியத்துவம் மிகுந்து வருகிறது. குறிப்பாக, செழுமையான இலக்கியப் பாரம்பரியத்தையும் தனித்துவமான இலக்கண அமைப்பையும் கொண்ட தமிழ் மொழியில், இயற்கை மொழி செயலாக்கம் (NLP) தொடர்பான ஆய்வுகள் மற்றும் பயன்பாடுகள் அதிகரித்து வருகின்றன.
இந்த நூல், தமிழ் உரை பகுப்பாய்வை செயற்கை நுண்ணறிவு மூலம் புரிந்துகொள்ள விரும்பும் மாணவர்கள், ஆய்வாளர்கள் மற்றும் தொழில்நுட்ப நிபுணர்களுக்கு வழிகாட்டியாக அமையும் வகையில் வடிவமைக்கப்பட்டுள்ளது. அடிப்படை கருத்துக்களிலிருந்து தொடங்கி, மேம்பட்ட இயந்திரக் கற்றல் மற்றும் ஆழக் கற்றல் முறைகள் வரை படிப்படியாக விளக்கப்படுகின்றன.
இந்த நூலின் அலகு I, செயற்கை நுண்ணறிவு மற்றும் இயற்கை மொழி செயலாக்கத்தின் அடிப்படைகளை அறிமுகப்படுத்துகிறது. தமிழ் மொழியின் தனிச்சிறப்புகள் மற்றும் கணினி மொழியியல் பற்றிய புரிதலை வழங்குகிறது. அலகு II, தமிழ் உரையின் முன் செயலாக்க நுட்பங்களை விவரிக்கிறது. Tokenization, stop words நீக்கம், stemming, Unicode போன்ற அம்சங்கள் இதில் எடுத்துரைக்கப்படுகின்றன. அலகு III, மொழியியல் அடிப்படைகள் மற்றும் தமிழ் மொழியின் அமைப்பை விளக்குகிறது. இலக்கணம், syntax, semantics மற்றும் POS tagging போன்ற முக்கிய கருத்துகள் இதில் அடங்கும். அலகு IV, இயந்திரக் கற்றல் முறைகள் மற்றும் உரை வகைப்படுத்தல் நுட்பங்களை விளக்குகிறது. Classification, feature extraction மற்றும் மதிப்பீட்டு அளவுகோல்கள் இதில் சேர்க்கப்பட்டுள்ளன. அலகு V, ஆழக் கற்றல் மற்றும் நவீன மாதிரிகள் குறித்து விரிவாக எடுத்துரைக்கிறது. Neural networks, word embeddings, transformer மாதிரிகள் மற்றும் BERT போன்ற முன்னேற்றமான தொழில்நுட்பங்கள் இதில் இடம்பெற்றுள்ளன. அலகு VI, உரை பகுப்பாய்வு மற்றும் உணர்வு பகுப்பாய்வை (Sentiment Analysis) மையமாகக் கொண்டுள்ளது. சமூக ஊடகத் தரவுகள் மற்றும் உணர்வு கண்டறிதல் போன்ற பயன்பாடுகள் இதில் விளக்கப்படுகின்றன.
அலகு VII, தகவல் சுரண்டல் மற்றும் தகவல் மீட்பு தொடர்பான நுட்பங்களை எடுத்துரைக்கிறது. NER, text summarization, question answering systems மற்றும் semantic search போன்றவை இதில் அடங்கும். இந்த நூல், தமிழ் மொழி மற்றும் செயற்கை நுண்ணறிவு ஆகிய இரண்டிற்கும் இடையிலான பாலமாக இருந்து, கல்வி மற்றும் ஆராய்ச்சி துறைகளில் பயனுள்ளதாக இருக்கும் என நம்புகிறோம். தமிழ் மொழியில் தொழில்நுட்ப வளர்ச்சியை முன்னேற்றும் ஒரு சிறிய முயற்சியாக இந்நூல் அமையும் என நாங்கள் எதிர்பார்க்கிறோம்.
இந்த நூலைப் பயன்படுத்தும் அனைவருக்கும் இது பயனுள்ளதாக இருக்கும் என்று நம்புகிறோம்.
