Супрацоўнікі аддзела гісторыі беларускай мовы Інстытута мовазнаўства імя Якуба Коласа Цэнтра даследаванняў беларускай культуры, мовы і літаратуры прадставілі праект на конкурсе “100 інавацый маладых вучоных” у межах “Фестывалю навукі-2024” базу даных “Alpha”, прызначаную для навучання штучнай нейроннай сеткі распазнаваць старабеларускія тэксты.
“Alpha” – упершыню створаная ў Беларусі база даных для навучання нейрасеткі распазнаваць старабеларускі тэкст з выявы. На яе аснове змогуць трэніравацца лінгвістычныя мадэлі для расчытвання і ўзнаўлення ў электронным друкаваным фармаце старажытных друкаваных тэкстаў з перадачай іх графічных асаблівасцей, што значна аптымізуе працу са старадрукамі. У перспектыве “Alpha” будзе функцыянаваць як адкрыты рэсурс, якім змогуць карыстацца ўсе зацікаўленыя ў захаванні старабеларускай моўнай спадчыны.
Наведвальнікі выставы “100 інавацый маладых вучоных” мелі магчымасць пабачыць фрагменты навучальнай базы даных, фотакопіі старажытных беларускіх твораў, а таксама працу эксперыментальнай штучнай нейроннай сеткі, якая ўжо ўмее распазнаваць асобныя старабеларускія словы з выявы.