Norwegian Constructicon

Om prosjektet

Velkommen til Det norske konstruktikonet (forkortet NorKon), en stor, søkbar database over grammatiske konstruksjoner i norsk. Vi bruker ordet «konstruksjon» for å referere til språkmønstre som er idiomatiske og som vanskelig lar seg oversette direkte. Dermed er de også ofte vanskelige å forstå og bruke riktig for innlærere. Konstruksjoner kan bestå av flere ord med én eller flere «åpne plasser», som i X og X, fru Blom (1), X belønne Y framfor Z (2), og X passe inn med Y (3). Vi regner også høyfrekvente ordkombinasjoner som fort gjort (4) som konstruksjoner, fordi de er ikke-komposisjonelle (det er ikke nok å vite betydningen av fort og gjort for å forstå fort gjort).

  1. Puben er irsk...skjønt [«er»]X og [«er»]X, fru Blom. (NoWaC, et webkorpus som inneholder ca. 700 millioner ord)
  2. [Publiseringssystemet]X belønner [kvantitet]Y framfor [kvalitet]Z. (Khrono)
  3. [Alt som ikke]X passer inn med [deres ideologi]Y, skal ut. (Khrono)
  4. Det er fort gjort å trykke på feil tast. (NoWaC)

Alle disse konstruksjonene er svært vanlige i norsk, men de faller mellom to stoler i den forstand at de i liten eller ingen grad er representert i grammatikk- eller ordbøker. NorKon er ment å kompensere for denne mangelen i eksisterende språkressurser.

Det beste fra leksikografi og grammatikk

Leksikografi, eller ordkunnskap og utarbeiding av ordbøker, er et empirisk fag som baserer seg på store mengder korpusdata for å beskrive ordenes betydning og bruk, også flerordsuttrykk. Samtidig er relasjonene mellom ordene og hvordan de kombineres et underutviklet område innen leksikografi. Tradisjonell grammatikk på sin side fokuserer nettopp på hvordan språkformer danner et helhetlig system, men tar for seg kun en liten del av språket og baserer seg som regel ikke på autentiske eksempler. Dette betyr at det oppstår blindsoner i språket som er lite beskrevet. Vi kan illustrere dette med konstruksjonene drive og V (5), sitte og V (6), ligge og V (7), stå og V (8), og gå og V (9), der V står for et verb.

  1. Min venninne og jeg driver og planlegger tur til Mount Everest. (NoWaC)
  2. Jeg sitter og leser i et blad nå. (NoWaC)
  3. Det pipes mot Vidar Riseth når han ligger og vrir seg i «smerte». (NoWaC)
  4. Vi ble stående og diskutere gårdsprodusert øl fra Midt-Norge. (NoWaC)
  5. Nå orker jeg ikke gå og ha det slik lenger. (NoWaC)

Disse konstruksjonene er mangelfullt beskrevet i ordbøkene. For eksempel er sitte og V oppført i Norsk Akademis Ordbok (naob.no), men ikke i bokmåls- og nynorskordboka (ordbokene.no); drive og V er oppført i nynorskordboka, men ikke i NAOB og bokmålsordboka, osv. Dessuten peker ikke uttrykkene, i den grad de er representert, til hverandre. Man går med andre ord glipp av at disse uttrykkene inngår i et system for å uttrykke at en handling er pågående, tilsvarende engelsk «present continuous».

Dersom vi konsulterer en innføringsbok i norsk grammatikk, blir alle konstruksjonene nevnt sammen: «Norwegian uses separate expressions to compensate for the lack of progressive tense» (Mac Donald & MacDonald 2013: 76). Men eksemplene som oppgis er liten grad illustrerende når det gjelder forskjellene mellom de ulike uttrykkene.

NorKon baserer seg på autentiske eksempler og kvantitativ analyse av korpusdata. Dermed fanger vi opp at drive og V kan uttrykke både handlinger som pågår akkurat nå, men som også kan ha utstrekning over uker, måneder eller år, og at vanlige verb som inngår i konstruksjonen er vedlikeholde, utvikle og bygge. Dette i motsetning til sitte og V, som gjerne brukes sammen med verb som vente, lese og skrive for å uttrykke handlinger som pågår nå og typisk har en utstrekning på minutter eller timer. Vi kan også vise hva slags subjekter de ulike konstruksjonene tar, og da ser vi for eksempel at personer ligger og sover, venter eller vrir seg i smerte, mens søppel og rot ligger og slenger.

Konstruksjonene i (5-9) inngår dessuten i en mer abstrakt konstruksjon (eller familie av konstruksjoner) som vi kaller V og V (pseudokoordinasjon). På denne måten fanger vi opp semantiske og formelle fellestrekk mellom konstruksjoner, i dette tilfellet at de uttrykker en pågående handling og består av to verbaler som kongruerer i tempus og knyttes sammen med og.

Ved å kombinere solide, empiriske undersøkelser i god leksikografisk ånd, med den tradisjonelle grammatikkens søken etter systematiske paradigmatiske relasjoner (former som kan fylle samme plass i en setning) kombinerer NorKon det beste av to verdener. Men vi går også lenger enn begge disse disiplinene når vi representerer språket som et nettverk av konstruksjoner.

Et dynamisk nettverk av konstruksjoner

Alle konstruksjoner i NorKon blir gruppert i familier basert på semantiske og syntaktiske tagger. Dette gjør det enklere å se hvordan konstruksjonene henger sammen, hva de har til felles og hvordan de skiller seg fra hverandre. For eksempel har vi sett at konstruksjonene i (5-9) bruker pseudokoordinering for å uttrykke en pågående handling. Disse skiller seg fra konstruksjonene i (10-13) på flere interessante måter. Konstruksjonen ta og V (10) er også et eksempel på pseudokoordinasjon, men markerer at handlingen er i begynnelsesfasen (ingressivt aspekt). Konstruksjonen V og V (reduplisering, altså at verbet er det samme på begge plasser) (11) uttrykker at handlingen foregår ved gjentatte anledninger. Konstruksjonen holde på å V (12) kan uttrykke en pågående handling med utstrekning i tid, men er ikke en pseudokoordinasjon fordi verbet ikke kongruerer (*de holdt på å laget). Dessuten kan holde på å V bety at en handling er nær ved å skje, men ikke ble fullført (13).

  1. Tusen takk, mamma, sier Maha og tar og legger matpakken i skolesekken. (NoWaC)
  2. Jeg har prøvd og prøvd, men jeg fordrar ikke dataspill. (NoWaC)
  3. Mozilla melder at de holder på å lage en Firefox-variant for mobiltelefoner. (NoWaC)
  4. Jeg holdt på å dø i brann i 2002. (NoWaC)

Disse eksemplene viser at faktisk språkbruk er langt fra den idealiserte forestillingen der én form har én funksjon og kategorier enkelt kan overføres fra et språk til et annet (eksempel (5), (6), (7), (8), (9) og (12) kan alle oversettes til engelsk med «present continuous», men ingen av dem brukes nøyaktig som den engelske formen). Snarere kan vi snakke om et lappeteppe av delvis overlappende former, der vår oppgave er å vise hvordan de ulike lappene er sydd sammen. Konstruksjonene vi har diskutert her kan representeres grafisk som i figuren under, der noen konstruksjoner har lignende form og funksjon, mens andre bare deler form eller bare funksjon.

Figur1 Om NorKon

Et slikt lokalt nettverk av konstruksjoner kan utvides til å inkludere hele språket, og termen «konstruktikon» brukes derfor både for å referere til databaser som NorKon, men også for å referere til det mentale nettverket som sies å utgjøre vår språkevne (se Teorien bak prosjektet under). NorKon utgjør dermed en kognitivt plausibel modell av språket som et nettverk av mentale assosiasjoner mellom språklige former og funksjoner. Derfor er vårt mål at NorKon skal dekke så mye av språket som mulig.

Pedagogiske fordeler

I innledningen nevnte vi at flerordsuttrykk er et lite utforsket område av språket. For innlærere er det vanskelig å oppdage og mestre disse strukturene uten eksplisitt undervisning på grunn av deres uregelmessige syntaks og ikke-komposisjonelle betydning. Dermed er det strategisk å fokusere på frekvente konstruksjoner når man underviser i fremmedspråk.

Ved å flytte fokus fra tradisjonell grammatikk til språkstrukturer som er frekvente i faktisk språkbruk flyttes også fokus fra å bruke språket på en måte som er grammatikalsk korrekt til en måte som er idiomatisk (les: slik folk faktisk bruker språket). Det er ikke grammatikalsk feil å si «en fugl er i treet», men folk med norsk som morsmål vil allikevel foretrekke «det sitter en fugl i treet» (14). Denne presenterings-konstruksjonen er et eksempel på idiomatisk språk, altså slik vi pleier å si ting på norsk. Et godt idiomatisk språk er veien til språklig integrering og NorKon tilbyr strukturert oversikt over idiomatiske strukturer som er annotert for språknivå i henhold til Europarådets nivåskala (A1 til C2).

  1. Det sitter [en fugl]NOE(N) [i treet utenfor vinduet]STED. (NoWaC)

NorKon fokuserer også på språkets generative kraft: hvordan man kan kombinere ulike konstruksjoner for å skape stadig mer komplekse strukturer. For eksempel kan sitte og V-konstruksjonen (6) og presenterings-konstruksjonen (14) kombineres til en ny struktur (15), som både presenterer en ny referent og beskriver at handlingen som utføres er pågående og har utstrekning i tid.

  1. Det sitter [en statsråd]NOE(N) [i Oslo]STED og [overkjører lokaldemokratiet]HANDLING. (Facebook)

I denne fremstillingen har vi brukt fagtermer for å beskrive hvordan konstruksjonene brukes, men én av fordelene med konstruksjonsbasert læring er at man kan unnslippe «ordklasseveldet» og den gresk-latinske terminologien som følger med på lasset. Klassisk grammatikkundervisning tar utgangspunkt i språklige former, som f.eks. presens perfektum. Vi kan tenke på konstruksjoner som et språklig mønster med en språklig funksjon og heller ta utgangspunkt i funksjonen. For eksempel kan vi bruke konstruksjonen ha (ikke) V siden TIDSPUNKT for å uttrykke at en situasjon (ikke) gjelder siden et tidspunkt i fortiden og også i fremtiden. Konstruksjonen brukes altså både positivt (16) og negativt (17), mens varianten ha ikke V på ANTALL TID (18) bare kan brukes negativt.

  1. Koret vårt har [eksistert]HANDLING siden [96]TIDSPUNKT. (NoWaC)
  2. Jeg må så innmari tisse, jeg har ikke [tissa]HANDLING siden [i dag tidlig]TIDSPUNKT. (NoWaC)
  3. Jeg har ikke [trent]HANDLING [flere år]ANTALL TID. (NoWaC)

Fordelen med en slik tilnærming er at man slipper å lære om alle de ulike bruksområdene til en kategori (f.eks. presens perfektum) på én gang og heller kan fokusere på den relevante kommunikative funksjonen som trengs for å uttrykke en idé. Dessuten kan man også unngå terminologi som presens perfektum. Fordelen for studenter uten skolegang burde være åpenbar, men også for høyt utdannede kan dette være en fordel fordi slike kategorier oppfører seg ulikt på tvers av språk: for eksempel er det mange språk som ikke bruker presens perfektum for å uttrykke at en situasjon fortsatt (ikke) gjelder.

Teorien bak prosjektet

Dette prosjektet tar utgangspunkt i konstruksjonsgrammatikken, en språkteori som anser hele vår språkevne som evnen til å beherske og kombinere grammatiske konstruksjoner. En konstruksjon defineres som et konvensjonalisert form-funksjon-par, og kan være alt fra et morfem til et komplekst syntaktisk mønster. Konstruksjonsgrammatikk analyserer språk som et strukturert nettverk av grammatiske konstruksjoner, kalt et konstruktikon.

Termen konstruktikon refererer både til språkevnen som et nettverk av mentale assosiasjoner mellom lingvistiske former og funksjoner, og til digitale databaser som NorKon, som skal representere hvordan denne kunnskapen er organisert. NorKon er inspirert av lignende prosjekter i andre språk, inkludert svensk, tysk, engelsk, japansk og russisk.

NorKon bidrar til et nytt fremvoksende forskningsfelt innen kognitiv lingvistikk som heter konstruktikografi, altså bygging av konstruktikoner. Dette feltet ligger i grenselandet mellom konstruksjonsgrammatikk, leksikografi, språkteknologi, og bruksbaserte tilnærminger til språksystemet.

Det norske konstruktikonet er et stort gruppeprosjekt der språkvitere og undervisere i norsk fra både Norge og utlandet kan delta. Hvis du er interessert i å samarbeide med oss, vennligst send en e-post til anna.endresen@uit.no eller olaf.a.mikkelsen@uit.no.

Prosjektmedlemmer:

Hvordan sitere ressursen:

NorKon 2024 – Det norske konstruktikonet. Et digitalt nettverk av norske konstruksjoner. Tilgjengelig på https://constructicon.github.io/norwegian/

NorKon 2024 – The Norwegian Constructicon. A digital network of Norwegian constructions. Available at https://constructicon.github.io/norwegian/

Publikasjoner om prosjektet:

Endresen, Anna & Olaf Mikkelsen. 2024. Ten good reasons to build the Norwegian ConstructiCon, a dictionary of grammar. Lexicographica – International Annual for Lexicography 40(1), 121-145. https://doi.org/10.1515/lex-2024-0007 (open access).


HKdir logo
UiT logo