Naprej Nazaj Kazalo

4. Posebni (specifični) programi

4.1 Programi za delo z mrežo

telnet

V nekaterih namestitvah telnet privzeto ni nastavljen na 8-bitni prenos. Da lahko pošiljate znake iz nabora Unicode na oddaljen računalnik, morate najprej nastaviti telnet na način "outbinary". To lahko storite na dva načina:

$ telnet -L <host>
in
$ telnet
telnet> set outbinary
telnet> open <host>

kermit

Komunikacijski program C-Kermit ( http://www.columbia.edu/kermit/ckermit.html), (interaktivno orodje za nastavljanje povezave, telnet, prenos datotek, s podporo za TCP/IP in serijske povezave) v različici 7.0 ali novejši pozna kodiranji UTF-8 in UCS-2 za prenos podatkov, ravno tako pozna tudi terminalsko kodiranje po UTF-8. Zna tudi pretvarjati med obema kodiranjema in še med mnogimi drugimi kodiranji. Dokumentacijo za te značilnosti lahko najdete na http://www.columbia.edu/kermit/ckermit2.html#x6.6.

4.2 Brskalniki

Netscape

Netscape 4.05 ali novejši lahko prikaže dokumente HTML, ki so kodirani po UTF-8. V dokumentu mora med oznakama <head> in </head> stati tudi:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

Netscape 4.05 ali novejši lahko prikaže tudi dokumente in tekstovne datoteke kodirane po UCS-2 z oznako o vrstnem redu zlogov.

Netscapova domača stran je: http://www.netscape.com/computing/download/.

Mozilla

Mozilla milestone M16 ima internacionalizacijo rešeno precej bolje kot Netscape 4. Prikaže lahko dokumente HTML, kodirane po UTF-8 s podporo za več jezikov. Zato pa obstaja manjša lepotna napaka glede pisav CJK. Nekateri simboli so lahko večji od višine vrstice, tako da prekrijejo prejšnjo oz. naslednjo vrstico.

Mozillina domača stran je: http://www.mozilla.org/.

Lynx

Lynx-2.8 ima zaslon z možnostmi (tipka 'O'), kjer se lahko nastavi nabor znakov za prikaz. Ko poganjate Lynx v xtermu ali konzoli v načinu UTF-8, nastavite to na "UNICODE UTF-8". Da ta nastavitev prične delovati v trenutnem teku brskalnika, jo morate potrditi na polju "Accept Changes" (sprejmi spremembe), da pa bo delovala vedno, morate izbrati polje "Save options to disk" (shrani možnosti na disk) in to potem potrditi s poljem "Accept Changes".

Tudi tokrat mora v dokumentu med oznakama <head> and </head> stati:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

Pri prikazovanju tekstovnih datotek, kodiranih po UTF-8, morate v ukazni vrstici podati možnost "-assume_local_charset=UTF-8" (deluje samo pri naslovih, ki se začnejo s 'file:/') ali "-assume_charset=UTF-8" (deluje pri vseh vrstah naslovov). V Lynxu 2.8.2 lahko tudi na zaslonu z možnostmi (tipka 'O') spremenite predpostavljen nabor znakov v "utf-8".

Na zaslonu z možnostmi je tudi možnost, da nastavite "priljubljen nabor znakov v dokumentu" (angl. preferred document character set). Vendar to ne deluje, če se URL začne s 'file:/...' oz. če se začne s 'http://...' in se na strežniški strani nahaja Apache 1.3.0.

Problem je tudi s presledki in s prelomom vrstic. Poglejte si razdelek o ruščini v x-utf8.html ali v utf-8-demo.txt.

Če je Lynx 2.8.2 nastavljen z --enable-prettysrc, barvna shema ne deluje več pravilno, ko nabor znakov na zaslonu nastavite na "UNICODE UTF-8". To popravite s preprostim popravkom lynx282.diff.

Razvijalci Lynxa pravijo: "Za vsako resno uporabo z izhodom na zaslon po UTF-8 se še vedno priporoča prevajanje s knjižnico slang in -DSLANG_MBCS_HACK."

Zadnja stabilna različica: ftp://ftp.gnu.org/pub/gnu/lynx/lynx-2.8.2.tar.gz

Izvorno kodo Lynxa dobite na: http://lynx.isc.org/.

Splošna domača stran: http://lynx.browser.org/

Novejše različice še v razvoju: http://lynx.isc.org/current/, ftp://lynx.isc.org/current/

W3M

W3m avtorja Akinorija Ita ( http://ei5nazha.yz.yamagata-u.ac.jp/~aito/w3m/eng/) je tekstovni brskalnik po straneh HTML. Njegov prikaz tabel, naštevanj ipd. v HTML je precej lepši kot pri Lynxu. Uporaben je tudi kot zelo dober pretvornik iz HTML v tekst.

W3m ima izbire iz ukazne vrstice za tri najpomembnejša japonska kodiranja, lahko pa ga uporabite tudi za datoteke, ki so kodirane po UTF-8. Če v ukazni vrstici ne vnesete nobene izbire, morate pogosto pritiskati Ctrl-L za osveževanje prikaza, prelom vrstic v odstavkih v cirilici in v CJK pa ni dober.

To odpravite s popravkom Hironorija Sakamota ( http://www2u.biglobe.ne.jp/~hsaka/w3m/), ki med kodiranja za prikaz doda UTF-8.

Strani za preizkušanje

Nekaj strani za preizkus brskalnikov lahko najdete na straneh Alana Wooda ( http://www.hclrss.demon.co.uk/unicode/#links) in Jamesa Kassa ( http://home.att.net/~jameskass/).

4.3 Urejevalniki

Yudit

Yudit avtorja Gáspárja Sinaia ( http://czyborra.com/yudit/ in http://www.yudit.org) je prvovrsten urejevalnik besedil, kodiranih po Unicode, za sistem X Window. Podpira hkratno obdelavo pri več jezikih, načinih vnosa in pretvorbah za lokalne standarde znakov. Ima pripomočke za vnos besedila v vseh jezikih z angleško tipkovnico, kjer se uporabljajo nastivitve za razporeditve tipk.

Prevesti ga je mogoče v treh različicah: Xlib GUI, KDE GUI ali Motif GUI.

Prilagoditev je zelo lahka. Ponavadi si najprej prilagodite pisavo tako, da iz menija pisave (angl. font) izberete "Unicode". Nato izberete pisavo z velikostjo 13 (pri ukazu "xlsfonts '*-*-iso10646-1'" še vedno prihaja do nekaterih zmešnjav), ki se ujema s 13-točkovno pisavo stalne širine Markusa Kuhna.

Zatem si prilagodite način vnosa. Najbolj značilni so "Straight", "Unicode" in "SGML". Za podrobnosti o ostalih vgrajenih načinih vnosa poglejte v /usr/local/share/yudit/data/.

Da bo sprememba postala privzeta ob vseh nadaljnjih zagonih programa, vnesite želene spremembe v datoteko $HOME/.yuditrc.

Splošne zmožnosti urejevalnika so omejene na urejanje, 'rezanje & lepljenje' (angl. cut & paste) ter iskanje & nadomeščanje. Možnosti razveljavitve (angl. undo) ni.

Yudit lahko prikaže besedilo z uporabo pisave TrueType, oglejte si razdelek "Pisave TrueType". Dobre rezultate da tudi pisava Bitstream Cyberbit. Da jo Yudit lahko najde, naredite povezavo nanjo na /usr/local/share/yudit/data/cyberbit.ttf.

Vim

Vim (pri različici 6.0b) dobro podpira UTF-8: ko ga poženete v UTF-8 locale, privzame kodiranje UTF-8 za konzolo in za tekstovne datoteke, ki jih urejate. Podpira znake z dvojno širino (npr. CJK) kot tudi kombiniranje znakov in se zato odlično prilega v Xterm z omogočenim UTF-8.

Namestitev: z naslova http://www.vim.org/ si naložite izvorno kodo. Ko odpakirate vse štiri dele, popravite datoteko src/Makefile tako, da bo vključeno tudi stikalo --with-features=big. Tako boste vključili značilnosti FEAT_MBYTE, FEAT_RIGHTLEFT in FEAT_LANGMAP. Zatem poženite "make" in "make install".

Emacs

Najprej si preberite razdelek o podpori mednarodnih naborov znakov (angl. "International Character Set Support") v priročniku za Emacs. Še posebej upoštevajte, da morate pognati Emacs z ukazom

$ emacs -fn fontset-standard
da se bo uporabila pisava s precej mednarodnimi znaki.

Na kratko povedano obstajata dva paketa za uporabo UTF-8 v Emacsu. Pri nobenem izmed njiju vam Emacsa ni potrebno še enkrat prrevajati.

Uporabljate lahko kateregakoli izmed njiju, lahko tudi oba skupaj. Prednosti kodiranja po "unicode-utf8" (paket emacs-utf) sta, da se naloži hitreje in da se bolje obnese pri kombiniranju znakov (to je pomembno pri tajščini). Prednost kodiranja po "utf-8" (paket Mule-UCS / oc-unicode) pa je, da lahko tudi obdeluje medpomnilnik (kot npr. M-x shell) in ne samo nalaga in shranjuje datoteke. Prav tako bolje obravnava širine znakov (pomembno pri etiopščini). Zato pa je manj zanesljivo: po obsežnem urejanju datoteke se lahko zgodi, da se po shranjevanju datoteke nekateri znaki iz Unicode zamenjajo z U+FFFD.

Da namestite paket emacs-utf, najprej prevedite program "utf2mule" in ga namestite v enega izmed imenikov, ki so našteti v spremenljivki PATH. Nekam namestite tudi unicode.el, muleuni-1.el in unicode-char.el. Nato v datoteko $HOME/.emacs dodajte vrstice:

(setq load-path (cons "/home/user/somewhere/emacs" load-path))
(if (not (string-match "XEmacs" emacs-version))
  (progn
    (require 'unicode)
    ;(setq unicode-data-path "..../UnicodeData-3.0.0.txt")
    (if (eq window-system 'x)
      (progn
        (setq fontset12
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard"))
        (setq fontset13
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard"))
        (setq fontset14
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard"))
        (setq fontset15
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard"))
        (setq fontset16
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard"))
        (setq fontset18
          (create-fontset-from-fontset-spec
            "-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard"))
       ; (set-default-font fontset15)
        ))))
Katerikoli nabor pisav lahko aktivirate preko menija Mule - Set Font/Fontset ali s kombinacijo Shift - dol - miška - 1. Trenutno so v Unicode najbolje pokrite pisave z višino 15 in 13, predvsem po zaslugi pisav 9x15 in 6x13 Markusa Kuhna. Da bo nabor pisav postal začetni nabor pisav za prvo okno ob zagonu, odkomentirajte vrstico set-default-font v zgornjih nastavitvah Emacsa.

Za namestitev paketa oc-unicode vnesite ukaz

$ emacs -batch -l oc-comp.el
in namestite nekam tako nastale datoteko un-define.elc kot tudi oc-unicode.el, oc-charsets.el in oc-tools.el. Nato v datoteko $HOME/.emacs dodajte vrstice:
(setq load-path (cons "/home/user/somewhere/emacs" load-path))
(if (not (string-match "XEmacs" emacs-version))
  (progn
    (require 'oc-unicode)
    ;(setq unicode-data-path "..../UnicodeData-3.0.0.txt")
    (if (eq window-system 'x)
      (progn
        (setq fontset12
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-12-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-12-*-iso10646-*"))
        (setq fontset13
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-13-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-13-*-iso10646-*"))
        (setq fontset14
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-14-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-14-*-iso10646-*"))
        (setq fontset15
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-15-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-15-*-iso10646-*"))
        (setq fontset16
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-16-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-16-*-iso10646-*"))
        (setq fontset18
          (oc-create-fontset
            "-misc-fixed-medium-r-normal-*-18-*-*-*-*-*-fontset-standard"
            "-misc-fixed-medium-r-normal-ja-18-*-iso10646-*"))
       ; (set-default-font fontset15)
        ))))
Ustrezen nabor pisav si nastavite enako kot pri paketu emacs-utf.

Da boste lahko naložili datoteko, kodirano v UTF-8, vtipkajte

M-x universal-coding-system-argument unicode-utf8 RET
M-x find-file datoteka RET
ali
C-x RET c unicode-utf8 RET
C-x C-f datoteka RET
(oz. utf-8 namesto unicode-utf8, če imate rajši oc-unicode/Mule-UCS).

Lupinsko okno z vhodom in izhodom v UTF-8 odprete, če vtipkate:

M-x universal-coding-system-argument utf-8 RET
M-x shell RET
(To deluje samo z oc-unicode/Mule-UCS.)

Upoštevajte, da vse to deluje samo z Emacsom v okenskem načinu, ne pa v terminalskem načinu.

Richard Stallman načrtuje, da bo dolgoročno dodal v Emacs integrirano podporo za UTF-8. Podobno načrtuje tudi skupina razvijalcev XEmacsa.

Xemacs

(Ta razdelek je napisal Gilbert Baumann.)

XEmacs (različica 20.4 nastavljena z MULE) si lahko prilagodite na UTF-8 na naslednji način. Žal boste potrebovali izvorno kodo, da boste lahko vnesli popravke.

Najprej potrebujete naslednji datoteki, ki ju je prispeval Tomohiko Morioka:

http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-21.0-b55-emc-b55-ucs.diff in http://turnbull.sk.tsukuba.ac.jp/Tools/XEmacs/xemacs-ucs-conv-0.1.tar.gz.

Končnica .diff se nanaša na izvirnik v C-ju. V paketih tar se nahaja koda v elispu, ki omogoča precej kodnih tabel za prenose v in iz Unicode. Kot je razvidno iz imena datoteke .diff, se nanaša na XEmacs-21. Potrebno je bilo nekaj 'popravkov'. Najbolj opazna razlika v izvirniku za XEmacs 20.4 je, da se je file-coding.[ch] preimenoval v mule-coding.[ch].

Nekaj hitrih napotkov za vse, ki se podobno kot avtor ne spoznajo preveč na XEmacs-MULE:

To, kar se imenuje kodiranje (angl. encoding), se v MULE imenuje 'coding-system'. Najpomembnejša ukaza sta:

M-x set-file-coding-system
M-x set-buffer-process-coding-system   [comint buffers]

in spremenljivka `file-coding-system-alist', ki ukazu `find-file' pomaga uganiti uporabljen način kodiranja. Ko zadevo poženete, morate najprej storiti tole.

Ta koda preveri posebno vrstico z načinom, ki se prične z -*- nekje med prvimi 600 zlogi datoteke, ki jo nameravate odpreti. Če se tam pojavi polje "Encoding: xyz;" in kodiranje 'xyz' obstaja, ga izberite. Sedaj lahko npr. storite

;;; -*- Mode: Lisp; Syntax: Common-Lisp; Package: CLEX; Encoding: utf-8; -*-

in XEmacs se preklopi v način utf.

Ko ste vse pognali, Lahko definirate \u03BB (grška lambda) kot makro:

(defmacro \u03BB (x) `(lambda .,x))

Nedit

Xedit

Če imate XFree86-4.0.1, lahko z Xeditom urejate datoteke, kodirane po UTF-8, če ste ustrezno nastavili locale (glejte zgoraj) in dodali vrstico "Xedit*international: true" v datoteko $HOME/.Xdefaults.

Axe

V različici 6.1.2 Axe podpira samo 8-bitne locale. Če v $HOME/.Xdefaults dodate vrstico "Axe*international: true", se bo preprosto 'sesul'.

Pico

Mined98

Mined98 ( http://www.inf.fu-berlin.de/~wolff/mined.html) je preprost urejevalnik avtorjev Michiela Huisjesa, Achima Müllerja in Thomasa Wolffa. V xtermu, ki podpira UTF-8 ali druga 8-bitna kodiranja, vam omogoča urejanje datotek, ki so kodirane po UTF-8 ali drugem 8-bitnem standardu. Ima tudi zelo dobre možnosti za vnos znakov iz nabora Unicode.

Mined vam omogoča urejanje 8-bitno kodiranih in po UTF-8 kodiranih datotek. Privzeto uporabi hevristično samozaznavo. Če se nočete zanašati na hevristiko, v ukazni vrstici podajte stikalo -u, kadar urejate datoteko po UTF-8, ali +u, kadar urejate 8-bitno kodirano datoteko. To lahko kadarkoli spremenite znotraj urejevalnika. V vrstici z menijem se prikaže kodiranje z "L:h" za 8-bitna kodiranja in "U:h" za UTF-8. Kliknite na prvega izmed teh znakov, da to spremenite.

Mined pozna znake z dvojno širino ter kombinirane znake in jih tudi pravilno prikaže.

Ima tudi lepo organizirane spuščajoče se menije, zato pa tipke, kot so Home, End ali Delete, ne delujejo.

4.4 Programi za elektronsko pošto

MIME: RFC 2279 definira UTF-8 kot nabor znakov MIME, ki se lahko prenaša pod 8-bitnimi kodiranji ter kodiranjema 'quoted-printable' in base64. Za starejši predlog MIME UTF-7 (RFC 2152) se šteje, da je v zatonu, zato se naj ga ne bi več uporabljalo.

Poštni odjemalci, ki so izšli po 1. januarju 1999, bi morali znati pošiljati in prikazovati po UTF-8 kodirana sporočila, sicer se upoštevajo kot neustrezni. Toda ta sporočila morajo nositi oznako MIME

Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
Enostavno pošiljanje po UTF-8 kodirane datoteke po cevi v "mail" brez popravka oznak MIME ne be uspešno.

Programerji odjemalcev za elektronsko pošto bi si morali ogledati strani http://www.imc.org/imc-intl/ in http://www.imc.org/mail-i18n.html.

Zdaj pa k posameznim poštnim odjemalcem (oz. "agentom za uporabo el. pošte"):

Pine

Situacija za nepopravljen Pine različice 4.10 je naslednja.

Pine ne izvaja pretvorb med nabori znakov. Omogoča pa vam, da si ogledate po UTF-8 kodirana sporočila v tekstovnem oknu, ki ima nastavljen UTF-8 (konzola za Linux ali xterm).

Ponavadi vas bo Pine opozoril o drugem naboru znakov vsakič, ko gledate po UTF-8 kodirano sporočilo. Teh opozoril se znebite, če izberete S (setup), zatem C (config), nato pa "character-set" nastavite na UTF-8. Na ta način ne boste storili nič posebnega, le opozoril ne bo več, saj Pine nima vgrajenega nobenega znanja o UTF-8.

Upoštevajte tudi, da je pri Pinu koncept znakov iz Unicode precej omejen. Prikazal bo znake v latinici in grške znake, preostalih znakov pa ne.

Popravek Roberta Bradyja (el. pošta: rwb197@ecs.soton.ac.uk, lokacija popravka: http://www.ents.susu.soton.ac.uk/~robert/pine-utf8-0.1.diff) doda Pinu podporo za UTF-8. S tem popravkom se zaglavja in telesa dekodirajo in prikažejo pravilno. Popravek je odvisen od knjižnice libunicode ( http://cvs.gnome.org/lxr/source/libunicode/) za GNOME.

Kljub vsemu poravnava ne deluje povsod pravilno, pri odgovarjanju se nabor znakov ne pretvori ustrezno, urejevalnik Pico pa sploh ne zna delati z večzložnimi znaki.

Kmail

Kmail (različica, ki se distribuira s KDE 1.0) sploh ne podpira UTF-8.

Netscape Communicator

Messenger (del Netscape Communicatorja) zna pošiljati in prikazati sporočila, ki so kodirana po UTF-8, vendar je potrebnega tudi nekaj malega ročnega posredovanja.

Pošiljanje po UTF-8 kodiranih sporočil: ko odprete okno za sestavljanje sporočila (Compose), morate še pred začetkom pisanja sporočila v meniju izbrati "View -> Character Set -> Unicode (UTF-8)". Potem lahko napišete sporočilo in ga odpošljete.

Ko prejmete tako kodirano sporočilo, ga Netscape žal ne bo takoj prikazal v pravem naboru znakov, niti vam ne bo tega vidno nakazal. V meniju morate ročno izbrati "View -> Character Set -> Unicode (UTF-8)". Nato izberite kategorijo pisav Unicode.

Emacs (Rmail, Vm)

Mutt

Mutt-1.0, ki ga lahko dobite na naslovu http://www.mutt.org/, ima zelo omejeno podporo za UTF-8. Za polno podporo je Edmund Grimley Evans naredil popravke, ki jih lahko dobite na naslovu http://www.rano.demon.co.uk/mutt.html.

Exmh

Exmh 2.1.2 s Tk 8.4a1 lahko prepozna in pravilno prikaže po UTF-8 kodirana sporočila (vendar brez znakov CJK), če v datoteko $HOME/.Xdefaults dodate naslednje vrstice:

!
! Exmh
!
exmh.mimeUCharsets:                     utf-8
exmh.mime_utf-8_registry:               iso10646
exmh.mime_utf-8_encoding:               1
exmh.mime_utf-8_plain_families:         fixed
exmh.mime_utf-8_fixed_families:         fixed
exmh.mime_utf-8_proportional_families:  fixed
exmh.mime_utf-8_title_families:         fixed

4.5 Obdelava besedil

Groff

Groff 1.16, GNU izvedba tradicionalnega sistema troff/nroff za obdelavo besedil na Unixih, lahko na izhodu doda oblikovano besedilo z znaki po UTF-8. Namesto 'groff -Tlatin1' ali 'groff -Tascii' enostavno vtipkajte 'groff -Tutf8'.

TeX

Distribucije TeTeX 0.9 in novejše vsebujejo prilagoditev Texa za Unicode, ki se imenuje Omega ( http://www.gutenberg.eu.org/omega/, ftp://ftp.ens.fr/pub/tex/yannis/omega). Skupaj z datoteko unicode.tex, ki se nahaja v utf8-tex-0.1.tar.gz vam omogoča, da kot vhod v TeX vnesete po UTF-8 kodirane izvirnike. Trenutno je podprtih na tisoče znakov iz Unicode.

Vse, kar se spremeni, je, da poženete `omega' (namesto `tex') ali `lambda' (namesto `latex') in v glavo vašega izvirnika vrinete naslednje vrstice:

\ocp\TexUTF=inutf8
\InputTranslation currentfile \TexUTF
\input unicode

Verjetno sta tej tematiki posvečeni tudi naslednji povezavi: http://www.dante.de/projekte/nts/NTS-FAQ.html in ftp://ftp.dante.de/pub/tex/language/chinese/CJK/.

4.6 Podatkovne baze

PostgreSQL

PostgreSQL 6.4 ali novejši lahko zgradite z naslednjo možnostjo nastavitve: --with-mb=UNICODE.

4.7 Ostali programi v tekstovnem načinu

Less

S programom Less, ki se ga dobi na naslovu http://www.flash.net/~marknu/less/less-358.tar.gz, lahko brskate po tekstovnih datotekah, ki so kodirane po UTF-8, če konzola ali xterm podpira ta način kodiranja. Prepričajte se, da spremenljivka okolja LESSCHARSET ni nastavljena (ali da je nastavljena na utf-8). Če je nastavljena tudi spremenljivka LESSKEY, se prepričajte, da datoteka, na katero kaže, ne definira spremenljivke LESSCHARSET. Če je potrebno, naredite to datoteko še enkrat z ukazom `lesskey' ali pa spremenljivko LESSKEY "prekličite".

Lv

Lv-4.21 ( http://www.mt.cs.keio.ac.jp/person/narita/lv/) avtorja Tomia Narite je pregledovalnik datotek z vgrajenim pretvornikom med nabori znakov. Če želite v z UTF-8 podprti konzoli pregledati po UTF-8 kodirane datoteke, vtipkajte "lv -Au8". Lahko pa ga uporabite tudi za pregledovanje po drugih kodiranjih CJK kodiranih datotek v konzoli s podporo za UTF-8.

Program ima tudi majhno napakico: utripač (kurzor) v xtermu izgine in se po koncu ne pokaže znova.

Expand, Wc

Priskrbite si GNU textutils-2.0 in uporabite popravek textutils-2.0.diff, nato si prilagodite nastavitve in v config.h dodajte vrstice "#define HAVE_MBRTOWC 1", "#define HAVE_FGETWC 1" in "#define HAVE_FPUTWC 1". V datoteki src/Makefile popravite CFLAGS in LDFLAGS tako, da vključujeta tudi imenike, kjer je nameščen libutf8. Zatem prevedite vse skupaj.

Col, Colcrt, Colrm, Column, Rev in Ul

Priskrbite si paket util-linux-2.9y, ga nastavite in zatem v datoteki defines.h definirajte ENABLE_WIDECHAR. V datoteki lib/widechar.h "#if 0" popravite v "if 1". V datoteki text-utils/Makefile, popravite CFLAGS in LDFLAGS tako, da vključujeta imenike, kjer je nameščen libutf8. Prevedite vse skupaj.

Figlet

Figlet 2.2 vsebuje stikalo za vnos po UTF-8: "figlet -C utf8"

Temeljni pripomočki

Seznam ukazov in pripomočkov Li18nux, ki bi moral biti povezljiv z UTF-8, je še vedno nepopoln in potrebuje še precej koristnih informacij. Avtorju to še ni uspelo :-).

Pri glibc-2.2 bodo delovali le regularni izrazi z 8-bitnimi znaki. Pri locale za UTF-8 regularni izrazi, ki vsebujejo ne-ASCII znake ali kjer naj bi primerjali posamezne večzložne znake s ".", ne bodo delovali. Posledice tega se bodo poznale v vseh ukazih in pripomočkih, ki so našteti spodaj.

alias

Na voljo še ni nobenih informacij

ar

Na voljo še ni nobenih informacij

arch

Na voljo še ni nobenih informacij

arp

Na voljo še ni nobenih informacij

asa

Na voljo še ni nobenih informacij

at

Pri at-3.1.8 sta dve uporabi isalnum v at.c neveljavni in ju je treba nadomestiti z uporabo quotearg.c ali s seznamom za izključevanje seznamov metaznakov iz lupine. Dve uporabi %8s v at.c in atd.c sta neveljavni in ju je treba popraviti na poljubno dolžino.

basename

Kot pri sh-utils-2.0i: vse je v redu.

batch

Na voljo še ni nobenih informacij

bc

Na voljo še ni nobenih informacij

bg

Na voljo še ni nobenih informacij

bunzip2

Na voljo še ni nobenih informacij

bzip2

Na voljo še ni nobenih informacij

bzip2recover

Na voljo še ni nobenih informacij

cal

Na voljo še ni nobenih informacij

cat

Na voljo še ni nobenih informacij

cd

Na voljo še ni nobenih informacij

cflow

Na voljo še ni nobenih informacij

chgrp

Kot pri fileutils-4.0u: vse v redu

chmod

Kot pri fileutils-4.0u: vse v redu

chown

Kot pri fileutils-4.0u: vse v redu

chroot

Kot pri sh-utils-2.0i: vse v redu

cksum

Kot pri textutils-2.0e: vse vredu

clear

Na voljo še ni nobenih informacij

cmp

Na voljo še ni nobenih informacij

col

Na voljo še ni nobenih informacij

comm

Na voljo še ni nobenih informacij

command

Na voljo še ni nobenih informacij

compress

Na voljo še ni nobenih informacij

cp

Kot pri fileutils-4.0u: vse v redu

cpio

Na voljo še ni nobenih informacij

csplit

Na voljo še ni nobenih informacij

ctags

Na voljo še ni nobenih informacij

crontab

Na voljo še ni nobenih informacij

cut

Na voljo še ni nobenih informacij

date

Kot pri sh-utils-2.0i: vse v redu

dd

Kot pri fileutils-4.0u: stikali conv=lcase in conv=ucase ne delujeta pravilno

depmod

Na voljo še ni nobenih informacij

df

Kot pri fileutils-4.0u: vse v redu

diff

Kot pri diffutils-2.7 (1994): diff se ne zaveda nastavitev locale, način --side-by-side zato ne izračuna pravilno širine stolpca, to velja celo za locale, ki temeljijo na ISO-8859-1

diff3

Na voljo še ni nobenih informacij

dirname

Kot pri sh-utils-2.0i: vse v redu

domainname

Na voljo še ni nobenih informacij

du

Kot pri fileutils-4.0u: vse v redu

echo

Kot pri sh-utils-2.0i: vse v redu

env

Kot pri sh-utils-2.0i: vse v redu

expand

Na voljo še ni nobenih informacij

expr

Kot pri sh-utils-2.0i: operatorji "match", "substr", "index" in "length" ne delujejo pravilno

false

Kot pri sh-utils-2.0i: vse v redu

fc

Na voljo še ni nobenih informacij

fg

Na voljo še ni nobenih informacij

file

Na voljo še ni nobenih informacij

find

Kot pri findutils-4.1.5: stikalo "-ok" še ne pozna mednarodnih nastavitev, popravek je že bil posredovan vzdrževalcu. Stikalo "-iregex" ne deluje pravilno, potreben je popravek v funkciji find/parser.c:insert_regex

fort77

Na voljo še ni nobenih informacij

ftp[BSD]

Na voljo še ni nobenih informacij

fuser

Na voljo še ni nobenih informacij

getconf

Na voljo še ni nobenih informacij

getopts

Na voljo še ni nobenih informacij

gunzip

Na voljo še ni nobenih informacij

gzip

Gzip je zmožen uporabljati UTF-8, vendar uporablja le angleška sporočila v naboru ASCII. Pri pravilni prilagoditvi bi bilo potrebno: uporabiti gettext, klicati setlocale. V funkciji check_ofname (datoteka gzip.c) namesto spraševanja tipa da/ne uporabite funkcijo rpmatch. Uporaba funkcije strlen v gzip.c:852 je napačna, potrebno je uporabiti funkcijo mbswidth.

hash

Na voljo še ni nobenih informacij

head

Na voljo še ni nobenih informacij

hostname

Kot pri sh-utils-2.0i: vse v redu

id

Kot pri sh-utils-2.0i: vse v redu

ifconfig

Na voljo še ni nobenih informacij

imake

Na voljo še ni nobenih informacij

insmod

Na voljo še ni nobenih informacij

ipchains

Na voljo še ni nobenih informacij

ipcrm

Na voljo še ni nobenih informacij

ipcs

Na voljo še ni nobenih informacij

ipmasqadm

Na voljo še ni nobenih informacij

jobs

Na voljo še ni nobenih informacij

join

Na voljo še ni nobenih informacij

kerneld

Na voljo še ni nobenih informacij

kill

Na voljo še ni nobenih informacij

killall

Na voljo še ni nobenih informacij

ksyms

Na voljo še ni nobenih informacij

ldd

Na voljo še ni nobenih informacij

less

Na voljo še ni popolnih informacij

lex

Na voljo še ni nobenih informacij

lilo

Na voljo še ni nobenih informacij

ln

Kot pri fileutils-4.0u: vse v redu

loadkeys

Na voljo še ni nobenih informacij

logger

Na voljo še ni nobenih informacij

Logname

Kot pri sh-utils-2.0i: vse v redu

lp

Na voljo še ni nobenih informacij

lpc[BSD]

Na voljo še ni nobenih informacij

lpr[BSD]

Na voljo še ni nobenih informacij

lprm[BSD]

Na voljo še ni nobenih informacij

lpq[BSD]

Na voljo še ni nobenih informacij

ls

Kot pri fileutils-4.oy: vse v redu

lsmod

Na voljo še ni nobenih informacij

m4

Na voljo še ni nobenih informacij

mailx

Na voljo še ni nobenih informacij

make

Na voljo še ni nobenih informacij

mesg

Na voljo še ni nobenih informacij

mkdir

Kot pri fileutils-4.0u: vse v redu

mkfifo

Kot pri fileutils-4.0u: vse v redu

mkfs

Na voljo še ni nobenih informacij

mkswap

Na voljo še ni nobenih informacij

modprobe

Na voljo še ni nobenih informacij

more

Na voljo še ni nobenih informacij

mount

Na voljo še ni nobenih informacij

mv

Kot pri fileutils-4.0u: vse v redu

netstat

Na voljo še ni nobenih informacij

newgrp

Na voljo še ni nobenih informacij

nice

Kot pri sh-utils-2.0i: vse v redu

nl

Na voljo še ni nobenih informacij

nohup

Kot pri sh-utils-2.0i: vse v redu

nslookup

Na voljo še ni nobenih informacij

nm

Na voljo še ni nobenih informacij

od

Na voljo še ni nobenih informacij

passwd[BSD]

Na voljo še ni nobenih informacij

paste

Na voljo še ni nobenih informacij

patch

Na voljo še ni nobenih informacij

pathchk

Kot pri sh-utils-2.0i: vse v redu

ping

Na voljo še ni nobenih informacij

printf

Kot pri sh-utils-2.0i: vse v redu

pr

Na voljo še ni nobenih informacij

ps

Na voljo še ni nobenih informacij

pwd

Kot pri sh-utils-2.0i: vse v redu

read

Na voljo še ni nobenih informacij

rdev

Na voljo še ni nobenih informacij

reboot

Na voljo še ni nobenih informacij

renice

Na voljo še ni nobenih informacij

rm

Kot pri fileutils-4.0u: vse vredu

rmdir

Kot pri fileutils-4.0u: vse vredu

rmmod

Na voljo še ni nobenih informacij

shar[BSD]

Na voljo še ni nobenih informacij

shutdown

Na voljo še ni nobenih informacij

sleep

Kot pri sh-utils-2.0i: vse v redu

split

Na voljo še ni nobenih informacij

strings

Na voljo še ni nobenih informacij

strip

Na voljo še ni nobenih informacij

stty

Kot pri sh-utils-2.o1: niza "<undef>" se ne bi smelo prevajati, potreben je popravek v funkciji stty.c:visible.

su[BSD]

Na voljo še ni nobenih informacij

sum

Kot pri textutils-2.0e: vse v redu

tac

Na voljo še ni nobenih informacij

tail

Na voljo še ni nobenih informacij

talk

Na voljo še ni nobenih informacij

tar

Kot pri tar-1.13.17: v redu če sta imeni uporabnika in skupine vedno zapisani v ASCII

tclsh

Na voljo še ni nobenih informacij

tee

Kot pri Sh-utils-2.0i: vse v redu

telnet

Na voljo še ni nobenih informacij

test

Kot pri sh-utils-2.0i: vse v redu

time

Na voljo še ni nobenih informacij

touch

Kot pri fileutils-4.0u: vse v redu

tput

Na voljo še ni nobenih informacij

tr

Na voljo še ni nobenih informacij

true

Kot pri Sh-utils-2.0i: vse v redu

tsort

Na voljo še ni nobenih informacij

tty

Kot pri sh-utils-2.0i: vse v redu

type

Na voljo še ni nobenih informacij

ulimit

Na voljo še ni nobenih informacij

umask

Na voljo še ni nobenih informacij

umount

Na voljo še ni nobenih informacij

unalias

Na voljo še ni nobenih informacij

uname

Kot pri sh-utils-2.0i: vse v redu

uncompress

Na voljo še ni nobenih informacij

unexpand

Na voljo še ni nobenih informacij

uniq

Na voljo še ni nobenih informacij

unlink

Na voljo še ni nobenih informacij

uudecode

Na voljo še ni nobenih informacij

uuencode

Na voljo še ni nobenih informacij

wait

Na voljo še ni nobenih informacij

wc

Kot pri textutils-2.oe: wc ne more prešteti znakov, popravek je že posredovan vzdrževalcu

who

Kot pri sh-utils-2.0i: vse v redu

wish

Na voljo še ni nobenih informacij

write

Na voljo še ni nobenih informacij

xargs

Kot pri findutils-4.1.5: program uporabi strstr, popravek je že posredovan vzdrževalcu

yacc

Na voljo še ni nobenih informacij

zcat

Na voljo še ni nobenih informacij

4.8 Preostali programi za X11

Owen Taylor trenutno razvija knjižnico pango za prikaz večjezičnih besedil. Več informacij na http://www.labs.redhat.com/~otaylor/pango/ in http://www.pango.org/.


Naprej Nazaj Kazalo