Skip to content

Lennes, Mietta & Ahjoniemi, Sanna (2005). Puheen annotaatio eli nimikointi.

Notifications You must be signed in to change notification settings

lennes/puheen-annotaatio

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Tässä arkistossa sijaitsevat "Puheen annotaatio eli nimikointi" -oppaan työtiedostot. Oppaan ovat yhteistyönä kirjoittaneet Mietta Lennes ja Sanna Ahjoniemi. 

Opas on tarkoitettu kaikille, jotka käsittelevät puheaineistoa ja haluavat
nimikoida eli annotoida sitä. Oppaan ohjeita noudattamalla omat
annotaatioperiaatteet ja annotaatiossa käytetyt yksiköt ja luokittelut
tulevat selkeästi määritellyiksi ja dokumentoiduiksi, jolloin puheaineistoa on myös mahdollista jakaa muiden tutkijoiden kanssa.

Opasta voi lukea sekä html-muotoisena verkkoversiona osoitteessa https://lennes.github.io/puheen-annotaatio/,
 että pdf-dokumenttina (https://github.com/lennes/puheen-annotaatio/blob/master/annotation_guide.pdf).
 
Oppaan tuottaminen kuului osana Suomen Akatemian rahoittamaan SA-Puhe-konsortiohankkeeseen (Integrated resources for speech technology and spoken language research, vv. 2002-2004). Oppaan ensimmäinen versio julkaistiin vuonna 2004 ja viimeisin julkaistu versio on 1.01, joka on ollut verkossa saatavilla vuodesta 2005 alkaen. Pieniä merkistökorjauksia lukuunottamatta materiaali on siirretty GitHubiin 22.3.2018 lähes sellaisenaan.

Opas on jäänyt osittain keskeneräiseksi. Se oli alun perin tarkoitettu käytettäväksi sekä SA-Puhe-hankkeessa kehitetyn Puh-editorin että esim. Praatin ja muiden vastaavien ohjelmien kanssa. Perusajatuksena on ollut, että eri ohjelmissa tuetaan ja vahvistetaan samoja annotaatiokäytänteitä. Puh-editori poistettiin valitettavasti käytöstä pari vuotta hankkeen päättymisen jälkeen, mutta oppaassa esitetyt perusideat lienevät edelleen puheaineistojen tutkijoille hyödyllisiä.