Colombo Institute of Technology

Colombo Institute of Technology

Share

22/04/2023

Large Language Modeling (LLM) යනු ස්වභාවික භාෂා අනුකරණය කිරීමට සහ උත්පාදනය කිරීමට යන්ත්‍ර ඉගෙනුම් ආකෘති පුහුණු කිරීම කෙරෙහි අවධානය යොමු කරන කෘතිම බුද්ධි ක්ෂේත්‍රයකි. LLM විසින් මෑත වසරවලදී සැලකිය යුතු දියුණුවක් අත්කර ගෙන ඇති අතර, GPT-3 (Generative Pre-trained Transformer 3) වැනි ආකෘති සංවර්ධනය කිරීමත් සමඟ OpenAI විසින් බිලියන 175 පරාමිති අඩංගු වන පුළුල් පරාසයක කාර්යයන් සිදු කළ හැකි ආකෘතීන් නිර්මාණය කර ඇත.

LLM හි එක් ප්‍රධාන ප්‍රතිලාභයක් නම්, එය පාරිභෝගික සේවා, භාෂා පරිවර්තනය සහ වචන සකස් කිරීම කිරීම ඇතුළුව පුළුල් පරාසයක යෙදුම්වල භාවිතා කළ හැකි වඩාත් මානව-සමාන සංවාද අතුරුමුහුණත් (Human like interface) නිර්මාණය කිරීමට ඉඩ සැලසීමයි. සමාජ මාධ්‍යවල නැගීම සහ chat-bots සහ virtual Assistants භාවිතය වැඩි වීමත් සමඟ ස්වභාවික භාෂා සැකසුම් හැකියාවන් සඳහා වැඩි ඉල්ලුමක් පවතින අතර, LLM එයට හොඳ විසඳුමක් ලෙස සැලකේ.

LLM මාදිලි සාමාන්‍යයෙන් විකිපීඩියා හෝ පුවත් ලිපි වැනි දේ වල භාවිතා කරනා ස්වාභාවික භාෂා දත්ත කට්ටල මත පූර්ව-පුහුණු (pre-trained) කර ඇත. මෙම පූර්ව-පුහුණු ක්‍රියාවලිය මඟින් ආකෘතිවලට භාෂාවේ යටින් පවතින ව්‍යුහය සහ රටා ඉගෙන ගැනීමට ඉඩ සලසයි, එමඟින් පරිශීලක යෙදවුම්වලට අනුකූල සහ අදාළ ප්‍රතිචාර ජනනය කිරීමට ඔවුන්ට හැකි වේ.

කෙසේ වෙතත්, LLM හා සම්බන්ධ සමහර අභියෝගද ඇත. එක් ප්‍රධාන අභියෝගයක් වන්නේ මෙම ආකෘති පුහුණු කිරීමට සහ යෙදවීමට අවශ්‍ය ගණනය කිරීමේ පිරිවැය සහ යටිතල පහසුකම්ය. LLM මාදිලි පුහුණු කිරීම සඳහා මහා පරිමාණ පරිගණක සම්පත් (large scale computing resources) වෙත ප්‍රවේශය අවශ්‍ය වන අතර, එහි ප්‍රතිඵලයක් ලෙස ලැබෙන මාදිලි ක්‍රියාත්මක කිරීම සඳහා ගණනය කිරීමේ මිල අධික විය හැක. මීට අමතරව, පුහුණුවීම් සහ විශාල මාදිලි ධාවනය කිරීමේ බලශක්ති පරිභෝජනය සහ පාරිසරික බලපෑම පිළිබඳවද ගැටලු පවතී.

තවත් අභියෝගයක් වන්නේ LLM මාදිලිවල පක්ෂග්‍රාහී වීමේ හැකියාවයි (Potential for bias). මෙම ආකෘතීන් මිනිසා විසින් ජනනය කරන ලද විශාල දත්ත කට්ටල මත පුහුණු කර ඇති බැවින්, පුහුණු දත්තවල පවතින පක්ෂග්‍රාහීත්වය නොදැනුවත්වම LLM ප්‍රතිදානයන් තුලට ඇතුලත් විය හැක.

අවසාන වශයෙන්, Large Language Modeling යනු පුළුල් පරාසයක යෙදුම් සහ ස්වභාවික භාෂා සැකසුම් ක්ෂේත්‍රය ඉදිරියට ගෙන යාම සඳහා සැලකිය යුතු විභවයක් සහිත ශීඝ්‍රයෙන් වර්ධනය වන ක්ෂේත්‍රයකි. LLM ආශ්‍රිත අභියෝග පවතින අතර, මේ ආශ්‍රිතව සිදුවෙමින් පවතින පර්යේෂණ සහ සංවර්ධනයන් මෙම අභියෝගවලට මුහුණ දීමට සහ කෘතිම බුද්ධියේ සහ භාෂා සැකසීමේ නව ප්‍රගතිය සඳහා මග පාදනු ඇත.

26/03/2023

පරිගණක භාෂා (Computer programming languages) 20 වන සියවසේ මැද භාගයේදී මුලින්ම නිර්මාණය වූ දා සිට සැලකිය යුතු ලෙස පරිණාමය වී ඇත. ආරම්භයේ දී, පරිගණක භාෂා සරල යොදා ගැනීම් වලින් සමන්විත වූ අතර පැරණිතම ඒවා වන්නේ machine code සහ assembly language භාෂාවන්ය. කෙසේ වෙතත්, කාලය සහ පරිගණක තාක්ෂණයේ දියුණුවත් සමඟ, පරිගණක භාෂා වඩාත් සංකීර්ණ, බහුකාර්ය සහ භාවිතයට පහසු වී ඇත.

1950 සහ 1960 ගණන් වලදී, Fortran, COBOL සහ Lisp වැනි පළමු ඉහළ මට්ටමේ පරිගණක භාෂා සංවර්ධනය කරන ලදී. මෙම භාෂා machine code සහ assembly language භාෂාවන්ට වඩා පරිශීලක-හිතකාමී (user friendly) ලෙස නිර්මාණය කර ඇති අතර, ඒවා මිනිසාට කියවිය හැකි ආකාරයෙන් කේත ලිවීමට ක්‍රමලේඛකයින්ට ඉඩ ලබා දුනි. 1970 ගණන් වලදී, C සහ Pascal වැනි භාෂාවන් වර්ධනය වීමත් සමඟ පරිගණක භාෂා අඛණ්ඩව පරිණාමය විය, ඒවා පෙර භාෂාවලට වඩා කාර්යක්ෂමව නිර්මාණය කර ඇත.

1980 සහ 1990 ගණන් වලදී, C++, Java, සහ Python වැනි භාෂා දියුණු වීමත් සමඟ පරිගණක භාෂා වඩාත් බහුකාර්ය විය. මෙම භාෂාවන් Object Oriented ලෙස නිර්මාණය කර ඇති අතර එමඟින් විවිධ යෙදුම්වල භාවිතා කළ හැකි නැවත භාවිතා කළ හැකි කේතයක් නිර්මාණය කිරීමට ක්‍රමලේඛකයින්ට ඉඩ ලබා දුනි. මීට අමතරව, මෙම භාෂා නිර්මාණය කර ඇත්තේ විවිධ පරිගණක පද්ධති වලින් ස්වාධීන (platform independent) වන පරිදිය, එනම් මෙම භාෂාවලින් ලියා ඇති කේතයක් ඕනෑම පරිගණකයක හෝ මෙහෙයුම් පද්ධතියක භාවිත කළ හැක.

මෑත වසරවලදී, Swift, Kotlin සහ Rust වැනි භාෂා වර්ධනය වීමත් සමඟ පරිගණක භාෂා අඛණ්ඩව පරිණාමය වී ඇත. මෙම භාෂා පෙර භාෂාවලට වඩා කාර්යක්ෂම, ආරක්ෂිත සහ භාවිතයට පහසු වන පරිදි නිර්මාණය කර ඇත. මීට අමතරව, ක්‍රියාකාරී ක්‍රමලේඛනය (functional programming) සහ ප්‍රතික්‍රියා ක්‍රමලේඛනය (reactive programming) වැනි නව ක්‍රමලේඛන ආකෘතීන් වඩාත් ජනප්‍රිය වී ඇති අතර, මෙම ආකෘතීන්ට සහය දැක්වීම සඳහා නව භාෂා බොහොමයක් සංවර්ධනය කර ඇත.

සමස්තයක් වශයෙන්, පරිගණක භාෂා සංවර්ධනය ක්‍රමානුකූලව වැඩිදියුණු කිරීමේ ක්‍රියාවලියක් වී ඇති අතර, සෑම නව භාෂාවක්ම පෙර භාෂාවල ශක්තිමත් ලක්ෂණයන් මත ගොඩනඟා ඒවායේ දුර්වලතා ආමන්ත්‍රණය කරයි. අද, තෝරා ගැනීමට ක්‍රමලේඛන භාෂා සිය ගණනක් ඇත, ඒ සෑම භාෂාවකටම තමන්ගේම ශක්තීන් සහ දුර්වලතා ඇති අතර, ක්‍රමලේඛකයින්ට ඔවුන්ගේ අවශ්‍යතා සපුරාලන භාෂාවක් සොයා ගැනීම වෙන කවරදාටත් වඩා පහසු කරයි.

06/03/2023

කටහඬ හඳුනාගැනීම, එසේත් නොමැති නම් කථනය හඳුනාගැනීම (Voice recognition) ලෙසද හැදින්වෙන මෙය, කෘත්‍රිම බුද්ධියේ (AI) ශීඝ්‍රයෙන් වර්ධනය වන ක්ෂේත්‍රයකි, එමගින් යන්ත්‍රවලට මිනිස් කථනය හඳුනා ගැනීමට සහ අර්ථ නිරූපණය කිරීමට හැකි වේ. මෙම තාක්‍ෂණය එහි ආරම්භයේ සිට බොහෝ දුරක් පැමිණ ඇති අතර එහි හැකියාවන් නිරන්තරයෙන් වර්ධනය වේ.

මෑත වසරවල කටහඬ හඳුනාගැනීමේ තාක්ෂණයේ වඩාත්ම වැදගත් දියුණුවක් වන්නේ ගැඹුරු ඉගෙනුම් ඇල්ගොරිතම (Deep learning algorithms) සංවර්ධනය කිරීමයි. මෙම ඇල්ගොරිතම මිනිස් මොළය තොරතුරු සකසන ආකාරය අනුව හැඩගස්වා ඇති අතර, යන්ත්‍රවලට කථන රටා හඳුනා ගැනීමට සහ වෙන කවරදාටත් වඩා නිවැරදිව වචන සහ වාක්‍ය ඛණ්ඩ හඳුනා ගැනීමට ඉඩ සලසයි.

ගැඹුරු ඉගෙනීමේ උපකාරයෙන්, කටහඬ හඳුනාගැනීමේ පද්ධති වඩාත් නිවැරදි වී ඇති අතර දැන් වාචික කතා, ස්ලැන්ග් සහ උච්චාරණ ඇතුළු ස්වභාවික භාෂාව තේරුම් ගැනීමටද හැක. අතථ්‍ය සහායකයින් (Virtual assistants), ස්මාර්ට් නිවාස උපාංග (smart home devices) සහ පාරිභෝගික සේවා චැට්බෝට් (customer service chatbots) ඇතුළු විවිධ යෙදුම්වල හඬ හඳුනාගැනීමේ තාක්‍ෂණය භාවිත කිරීමට මෙනිසා හැකි වී ඇත.

හඬ හඳුනාගැනීමේ තාක්ෂණයේ තවත් වැදගත් වර්ධනයක් වන්නේ ස්වභාවික භාෂා සැකසුම් (NLP - Natural Language Processing) හැකියාවන් එයට ඒකාබද්ධ කිරීමයි. NLP, යන්ත්‍රවලට කථා කරන වචන පිටුපස ඇති සන්දර්භය සහ අභිප්‍රාය තේරුම් ගැනීමට ඉඩ සලසයි, එමඟින් වඩාත් නිවැරදි හා අදාළ ප්‍රතිචාර සැපයීමට ඔවුන්ට හැකි වේ.

මෙම දියුණුවට අමතරව, කටහඬ හඳුනාගැනීමේ තාක්ෂණය යන්ත්‍ර ඉගෙනීම සහ පරිගණක දැක්ම (Computer vision) වැනි වෙනත් AI තාක්‍ෂණයන් සමඟ ද ඒකාබද්ධ වෙමින් ඊටත් වඩා බලවත් සහ සංකීර්ණ පද්ධති නිර්මාණය කරයි. නිදසුනක් වශයෙන්, සමහර සමාගම් කථනයේ හැඟීම් හඳුනාගෙන ඒ අනුව ප්‍රතිචාර දැක්විය හැකි හඬ හඳුනාගැනීමේ පද්ධති සංවර්ධනය කිරීමට කටයුතු කරමින් සිටී.

මෙම දියුණුව තිබියදීත්, කටහඬ හඳුනාගැනීමේ තාක්ෂණයේ ජය ගැනීමට තවමත් අභියෝග කිහිපයක් තිබේ. එක් ප්‍රධාන අභියෝගයක් වන්නේ යන්ත්‍රවලට කථනය නිවැරදිව හඳුනා ගැනීමට අපහසු වන පසුබිම් ශබ්දය සහ වෙනත් සාධක සමඟ කටයුතු කිරීමයි. කෙසේ වෙතත්, සිදුවෙමින් පවතින පර්යේෂණ සහ සංවර්ධනය සමඟ, හඬ හඳුනාගැනීමේ තාක්ෂණයේ අනාගතය යහපත් බව පෙනෙන අතර, ඉදිරි වසරවලදී ඊටත් වඩා නව්‍ය යෙදුම් දැකීමට අපට අපේක්ෂා කළ හැක.

01/03/2023

5 වන කාර්මික විප්ලවය (5th Industrial Revolution), Industry 5.0 ලෙසද හැඳින්වේ. එය කාර්මික විප්ලවයේ නවතම අදියර වන අතර එමගින් Industry 4.0 හී තාක්ෂණයන් වන ස්වයංක්‍රීයකරණය (Automation), කෘතිම බුද්ධිය (Artificial Intelligence) සහ Internet of Things (IoT) මිනිසාගේ නිර්මාණශීලිත්වය සහ දක්ෂතාවය සමඟ එකට මුසු කිරීමට උත්සාහ කරයි. Industry 5.0 හි මූලික අවධානය යොමු වන්නේ නිෂ්පාදන ක්‍රියාවලියේ කේන්ද්‍රස්ථානයට මිනිසුන් තැබීමෙන් වඩාත් තිරසාර හා මානුෂීය කර්මාන්තයක් නිර්මාණය කිරීමයි.

Industry 4.0 හි ඇති සීමාවන්ට ප්‍රතිචාරයක් ලෙස Industry 5.0 සංකල්පය මතු විය. Industry 4.0 තාක්‍ෂණයන්ට නිෂ්පාදන සහ කර්මාන්ත පරිවර්තනය කිරීමේ හැකියාව ඇති අතර, ඒවා බොහෝ විට විවේචනයට ලක්වන්නේ ඒවායේ මානව ස්පර්ශය (Human touch) නොමැතිකම මිනිස් රැකියා නැති කිරීමේ හැකියාව නිසාය. Industry 5.0 හී දී නිෂ්පාදන ක්‍රියාවලියේදී මානව සේවකයින්ගේ කාර්යභාරය අවධාරණය කරමින් සහ මිනිසුන් සහ යන්ත්‍ර අතර සහයෝගීතාවය සඳහා නව අවස්ථා නිර්මාණය කිරීමෙන් මෙම ගැටළු විසඳීමට උත්සාහ කරයි.

Industry 5.0 තවමත් එහි මුල් අවධියේ පවතින අතර, එහිදී භාවිතා කරනු ලබන තාක්ෂණයන් සහ ක්‍රියාවලීන් පිළිබඳව පැහැදිලි එකඟතාවයක් නොමැත. කෙසේ වෙතත්, මෙමගින් වැඩිදියුණු කළ හැකි ක්‍රියාදාමයන් අතරට මානව-යන්ත්‍ර අන්තර්ක්‍රියා (Human-machine interactions) වැඩි දියුණු කිරීම සඳහා Augmented reality, පැළඳිය හැකි උපකරණ (Wearables) සහ වෙනත් තාක්ෂණයන් භාවිතය, තිරසාරභාවය සහ සමාජ වගකීමට ප්‍රමුඛත්වය දෙන නව නිෂ්පාදන ආකෘති සංවර්ධනය සහ නව පුහුණු වැඩසටහන් සහ අධ්‍යාපන මුලපිරීම් නිර්මාණය කිරීම ඇතුළත් වේ.

සමස්තයක් වශයෙන්, 5 වන කාර්මික විප්ලවය වඩාත් තිරසාර, මානුෂීය සහ සාධාරණ අනාගතයක් නිර්මාණය කිරීම සඳහා මිනිසාගේ නිර්මාණශීලිත්වය සහ දක්ෂතාවය සමඟ උසස් තාක්ෂණයන්හි බලය ඒකාබද්ධ කරන කර්මාන්තයේ නව යුගයක් නියෝජනය කරයි.

Want your university to be the top-listed University in Colombo?
Click here to claim your Sponsored Listing.

Website

Address


Colombo