Operationalisering av bruksbaserad språkinlärning: En minimal kognitiv arkitektur
Huvudsyftet med det här projektet är att testa hur långt en domängeneraliserad tillgång till språkinlärning kan gå. De flesta modeller för artificiell språkinlärning som finns tillgängliga är inte kognitivt trovärdiga, och vårt mål är att visa att sekvensminne, chunking och generalisering är tillräckligt för att lära sig språk.
Start
2023-01-01
Planerat avslut
2026-12-31
Huvudfinansiering
Samarbetspartners
Forskningsområde
Forskningsinriktning
Projektansvarig vid MDU
Vilka kognitiva mekanismer gör det möjligt för människor att lära sig komplext språk? Utifrån en helhetssyn på mänsklig kognition, inspirerad av modeller inom artificiell intelligens, är vår hypotes att en minimal kognitiv arkitektur baserad på sekvensminne, chunkning och generalisering kan lära sig grammatik. Dessa tre komponenter antar vi är generella mentala förmågor hos människor som inte är specifikt anpassade för språk. Sekvensminne är centralt eftersom ny forskning visar att djur inte kan uppfatta exakt ordningsföljd, samtidigt som just ordningsföljd är betydelsefull i språk. Chunkning, det vill säga förmågan att mentalt slå ihop flera enheter till en, har pekats ut som viktigt för mänsklig informationsbehandling, språkförståelse och språkinlärning. Generalisering är en välkänd mental förmåga hos både människor och andra djur.
Vår idé är att chunking, och generalisering ska göra det möjligt att fatta beslut grundade på symboliska kategorier i stället för bara ord eller sekvenser av ord, och därmed minska det explosionsartade kombinatoriska problem som språkinlärning innebär. Centralt för projektet är att symboliska kategorier och hur de kan kombineras, det vill säga grammatik, uppstår under inlärningsprocessen. Därmed operationaliserar vår modell bruksbaserad inlärning, samt uppbyggnad av grammatik genom inlärning.
Inlärningsmodellens uppgift är att identifiera meningar i en ström av språk där ledtrådar som skiljetecken och stor bokstav avlägsnats. Modellen förväntas utforska och upptäcka de kategorier och kombinationer som underlättar uppgiften och på så vis bygga upp ett fungerande grammatiskt system. Arkitekturen kommer att utvärderas på både artificiella och naturliga språk.
Resultaten kan generera banbrytande framsteg för vår förståelse av den mänskliga språkförmågan och få betydelse inom fälten språkinlärning, kognition, kulturell evolution, biologisk evolution, artificiell intelligens och natural language processing.
Projektet genomförs på det tvärvetenskapliga Centrumet för evolutionär kulturforskning (CEK) vid Stockholms universitet.
Projektmål
Huvudmålet med det här projektet är att designa och implementera en minimal kognitiv arkitektur för att lära sig komplex grammatik baserat på sekvensminne, chunkning och schematisering, drivna av belöningsinlärning. Denna arkitektur kommer att evalueras på både artificiella och naturliga språk för att avgöra hur snabbt och exakt den kan identifiera meningar, sin förmåga att tilldela produktiva grammatiska kategorier till okända element och sin förmåga att extrahera parsimoniska grammatiska kategorier för alla element i ett naturligt språk.
Aktiviteter
Vi kommer att designa och implementera en minimal domängeneraliserad kognitiv arkitektur för att lära sig grammatik. Vi kommer att konstruera ett datorbaserat system som kan lära sig att extrahera kategorier och deras relationer från en ström av lingvistisk information, med endast stöd på sekvensminne, chunking och schematisering. Inlärningen kommer att baseras på enkla principer för förstärkning av associerade styrkor, där förstärkningen drivs av korrekt identifiering av meningar. Vi kommer också att analysera och utvärdera modellens prestanda på både artificiella och naturliga lingvistiska input.