bild
Skolan för
elektroteknik
och datavetenskap

Välkommen till Språkteknologigruppen på KTH:s API för satsextraktion!

För fler verktyg, se sidan med Språkteknologigruppens verktyg

Program som använder satsextraktion

Om du skriver ett program som anropar vår parsningstjänst kan du använda POST och denna URL: "POST http://skrutten.csc.kth.se/granskaapi/clause.php" med texten i kroppen till postningen. För ett exempel på hur det kan se ut och vilka olika valmöjligheter som finns kan du titta på källkoden till denna hemsida och se hur formuläret nedan gör.

Om du istället för satser är intresserad av fraser finns en variant av denna tjänst som matar ut fraser istället tillgänglig här: http://skrutten.csc.kth.se/granskaapi/chunk. Det finns även en tjänst som matar ut all information från Granskas parser, inklusive fraser och satsgränser: http://skrutten.csc.kth.se/granskaapi/parse.php.

Vad betyder utmatningen?

Om vi analyserar meningen "Jag skriver text och datorn parsar meningarna." får vi tillbaka följande utmatning:

Jag, CLB
skriver, CLI
text, CLI
och, CLB
datorn, CLI
parsar, CLI
meningarna, CLI
., CLI

Det ska tolkas såhär:

  • CLB betyder att en sats ("CL" för clause) börjar på det ord taggen tillhör ("B" för begin).
  • CLI betyder att det ord taggen tillhör ingår i en sats som börjat tidigare i meningen ("I" för inside).

Det finns ingen explicit markör för att en sats är slut. Att en sats är slut anges implicit av att det inte följer fler taggar med "I" för inside.

I exemplet ovan finns det således en sats "Jag skriver text", eftersom "Jag" har en tagg "CLB" som alltså betyder "här börjar en sats" och orden "skriver text" har taggar "CLI" som alltså betyder "fortsättning på en redan påbörjad fras". Det finns också en fras "och datorn parsar meningarna", eftersom ordet "och" har taggen "CLB" ("här börjar en ny fras") och de följande orden alla har "CLI". Att ordet "och" inte har någon "CLI"-tagg indikerar också att den tidigare frasen ("Jag skriver text") är slut.

Utförlig information om Granskas parser finns i denna artikel (PDF).


Ett formulär att testa med

Mata ut XML
Mata ut JSON
Mata ut vanlig text
Mata ut HTML

Visa ordklasstaggar

Använd Granskas exempelmeningar som visar många olika typer av skrivfel

Ange en URL till en sida att analysera.

Skriv eller klistra in en egen text att analysera.


Uppdaterad 2020-07-21