Marginaalin avainsanasto esittelyssä
#22828. Torstai, 28. heinäkuuta 2011 klo 20.53.53, kirjoittanut Jani. 0
Olen organiseerannut arkistoja ihan homona tässä viime päivät. Siivosin avainsanastonkin siinä sivussa, ja nyt voin sen pohjalta esitellä muutamia luetteloita useimmin käyttämistäni. Kokonaistilaston lisäksi jaoin sanaston kahtia, eris- ja yleisnimiin. #
Sanaston luonnissa, eli tägäyksessä lähdin aikoinaan liikkeelle melko randomilla. Sanasto muodostui sitä myöten melko sekalaiseksi, ilman mitään kunnon johdonmukaisuutta. Vasta melko hiljattain olen päätynyt noudattamaan muutamia nyrkkisääntöjä: #
- Kirjoitan avainsanat yksikössä muutamia Wikipedian poikkeuskäytäntöön osuvia lukuunottamatta. Lasken sen varaan, että Google osaa taivuttaa (ja oppii jollei vielä osaa). WordPressiin ei kannattane suomeen taipuvaa semantiikkamoottoria aivan pian odotella.
- Tekstissä edes kuten miten keskeisenä esiintyvät erisnimet poimin avainsanoiksi pääsääntöisesti aina. Ehkä huomattavin poikkeus tästä ovat tähän mennessä olleet musiikkikappaleiden nimet: olen vetänyt rajan niiden ja albumien nimien välille (albumien nimet kelpuutan avainsanoiksi, kappaleiden nimiä en). Jamendo-musiikkia esittelevän sarjan merkintöjä en tähän mennessä ole tägännyt artistin tai albumin nimillä, koska niistä useimmat tulisivat varsin suurella todennäköisyydellä jäämään ainutkertaisiksi. Ainutkertaisuuden välttely ei silti kuitenkaan ole erisnimien kohdalla tärkeysjärjestyksessä yhtä korkealla kuin yleisnimissä.
- Yleisnimissä pyrin välttämään ainutkertaisuutta enemmän kuin erisnimissä. Käytännössä tämä merkitsee yleensä yläkäsitteiden (esimerkiksi “hyönteinen”) valitsemista spesifisempien alakäsitteiden (esimerkiksi “muurahainen”) sijasta. Mikäli aloittaisin uutta blogia ja tägäisin tätä säännöstöä noudattaen, tämä sääntö muodostuisi varmasti melko haasteelliseksi, sillä alussa on milteipä mahdotonta tietää, mitkä avainsanat osoittautuvat vähintäänkin tavanomaisiksi. Koska minä päädyin tähän sääntöön vasta paljon tägäystä jo tehtyäni, saatoin katsoa tähän mennessä käyttämiäni sanoja ja muodostaa niiden pohjalta sanaston, joka sopii useisiin tähänastisiin ja todennäköisesti myös useisiin tuleviin postauksiin. Tarvittaessa yhdistelin alakäsitteitä yläkäsitteisiin.
- Pyrin käyttämään suomenkielistä termiä mikäli sellainen on, myös erisnimissä. Esimerkiksi Elävien kuolleiden yö, Night of the Living Deadista.
- KISS. Mikäli vaikkapa erisnimestä on vakiintunut lyhenne, käytän sitä koko nimen sijasta. Esimerkiksi VR eikä Valtion Rautatiet. (Kuitenkin: Yhdysvallat eikä USA, kts. edellinen sääntö.) Mikäli voin valita pitemmän ja lyhyemmän sanan välillä, valitsen lyhyemmän.
Olen lisäksi (väärin)käyttänyt avainsanastoa tiettyjen postaussarjojen yhteiseen luokitteluun. Näin ei pidä tehdä, vaan minunkin pitäisi luoda räätälöity taksonomia, vaikkapa nimeltään “sarjat”. Nyt vielä tämä varsinaiseen avainsanastoon nähden eri funktiota palveleva sanasto esimerkiksi kummitteli raakadatassa, josta alla olevat luettelot sorvasin. #
Sitten itse luettelot. Ensin useimmin käyttämäni erisnimiavainsanat, top 20, ilman sarjasanastoa. Kunkin sanan perässä on siihen liittyvien postausten määrä. #
- Internet (50)
- Suomi (32)
- Yle (21)
- Citymarket (19)
- DVD (14)
WordPress (14) - Godzilla (13)
- Facebook (11)
Google (11) - Yhdysvallat (10)
- YouTube (9)
- Prisma (8)
VR (8) - Amerikan psyko (7)
Kirkkonummi (7)
Taru sormusten herrasta (7) - Blogger (6)
David Attenborough (6)
Discopress (6)
Elävien kuolleiden yö (6)
Sitten yleisnimisanasto, top 20. #
- uni (81)
- eläin (77)
- kieli (65)
terveys (65) - turvallisuus (54)
- masennus (49)
- blogaaminen (48)
- vanha media (46)
- oikeus (39)
- psykologia (38)
- sananvapaus (33)
uskonto (33)
valokuvaus (33) - lääke (32)
nisäkäs (32) - liikenne (27)
politiikka (27) - lapsi (25)
rikos (25) - ravinto (24)
Ja lopuksi vielä koko sanaston yhteinen top 20 (miinus sarjasanat): #
- uni (81)
- eläin (77)
- kieli (65)
terveys (65) - turvallisuus (54)
- Internet (50)
- masennus (49)
- blogaaminen (48)
- vanha media (46)
- oikeus (39)
- psykologia (38)
- sananvapaus (33)
uskonto (33)
valokuvaus (33) - lääke (32)
nisäkäs (32)
Suomi (32) - liikenne (27)
politiikka (27) - lapsi (25)