Tag: UTF-8

  • [Ratkaisu] Virheellinen merkistökoodaus DVD-levyllä olevien tiedostojen nimissä

    Lähtökohta
    Minulla on DVD-levy, jolle on poltettu tiedostoja Windowsissa. Tiedostojen joukossa on sellaisia, joiden nimissä on skandinaavisia kirjaimia.
    Lataan levyn tietokoneen DVD-asemaan, jolloin se liitetään tiedostojärjestelmään. Avaan levyn sisällön selailtavakseni Nautilus-tiedostoselaimella.
    Ongelma
    Skandinaavisia kirjaimia sisältävissä tiedostonimissä ne ovat korvautuneet kysymysmerkeillä, ja tiedostonimen perässä lukee (virheellinen merkistökoodaus). Tiedostonimen kopiointi avaamaani Pääte-ikkunaan ei toimi, jos poimin tiedoston Nautiluksen ikkunasta ja vedän ja pudotan sen Pääte-ikkunaan.
    Ongelman syy
    Levyä ei ole liitetty UTF-8 -merkistökoodausta käyttäen.
    Ratkaisu
    Muutan /etc/fstab -tiedostossa olevaa CD/DVD -asemani määrittelevää riviä. Ennen muutoksia rivi näyttää seuraavanlaiselta:

    /dev/scd0  /media/cdrom0  udf,iso9660  user,noauto,exec  0 0

    Lisään liittämisparametreihin merkistökoodauksen, jonka jälkeen rivi näyttää seuraavanlaiselta:

    /dev/scd0  /media/cdrom0  udf,iso9660  user,noauto,exec,utf8  0 0

    Otan levyn ulos DVD-asemasta, ja lataan sen sitten uudestaan sisään. Kun tämän jälkeen selaan levyn sisältöä Nautiluksella, tiedostonimissä olevat skandinaaviset kirjaimet näytetään kuten pitää, ja sellaisia sisältävien tiedostonimien kopionti Pääte-ikkunaan vetämällä ja pudottamalla toimii.

    Huomautus
    Tietokoneessa, johon olen asentanut Hardy Heronin siihen päivittämisen sijasta, utf8 -parametri oli fstab-tiedoston DVD-asemamäärittelyssä valmiina.
  • [Ratkaisu] Tekstitiedoston merkistökoodauksen muuntaminen ISO-8859-15:stä UTF-8:aan

    Lähtökohta
    Olen avannut Päätteen. Kotihakemistossani on esimerkki.txt -niminen tekstitiedosto. Olen saanut selville, että tiedostossa käytetty merkistökoodaus on ISO-8859-15.
    Ongelma
    Haluan muuntaa tiedoston merkistökoodauksen ISO-8859-15:stä UTF-8:aan.
    Ratkaisu
    Merkistökoodauksen muuntaminen tapahtuu iconv-komennolla seuraavasti:

    iconv -f ISO-8859-15 -t UTF-8 ~/esimerkki.txt -o ~/esimerkki-utf8.txt

    Tämän jälkeen kotihakemistossani on alkuperäisen tiedoston rinnalla uusi tiedosto, esimerkki-utf8.txt, jonka tekstisisältö on sama kuin alkuperäisen tiedoston, mutta merkistökoodauksena on käytetty UTF-8:aa.