All rights reserved. Copyright (C) 1996,1997 by NARITA Tomio <narita@mt.cs.keio.ac.jp>
LV Homepage (in Japanese)
-
-
lv: a Powerful Multilingual File Viewer
The latest version is ver 4.21:
Download
page is
here
.
目次
-
- 著作権表示
- 特徴
- lvのダウンロード
- インストール
- 使用法
- 行の取扱い
- コード系について
- コード系について補足
- コード系の自動選択
- カラー化について
- カスタマイズ
- 知られているバグ
- バグレポート
- リリースノート
- 謝辞
- 参考文献
著作権表示
-
-
lvはフリーウェアです.
あなたは自由にlvとその書庫を使用することができます.
また,
あなたはlvに修正を加え,それを配布することができます.
ただし,
あなたの配布するソフトウェアのドキュメントにおいて,
それがlvのコードを含んでいることを明記することを条件とします.
lvにまつわる一切の保証はありません.
つまり,
あなたはあなた自身の責任においてlvを使用することができます.
配布した書庫に含まれるドキュメント,
および,プログラムの著作権は成田多良(narita@mt.cs.keio.ac.jp)
が全権保留中です.
特徴
-
多国語化ファイルビューア
lvは主にアジア圏の言語を含むテキストを読むために開発されつつある,
多国語化ファイルビューアです.
lvの使用方法は
UNIXにおける代表的なファイルビューアlessに大変よく似ているため,
多くの人にとって新しい操作方法を覚える煩わしさがありません.
現在,
lvはMSDOS ANSI端末, および, 各種 UNIX 上で使用することができます.
-
各種コード系に対応
lvは iso-2022-jpなどのISO 2022に従うコード系や
euc-japanのようなEUC (Extended Unix Code),
さらに shift-jis や big5 などの多くのコード系を
デコード/エンコードすることができます.
また,
lvはビューアとしてだけではなく,
それらのコード系の変換フィルタとして利用することもできます.
-
Unicode に対応
lv は Unicode に対応しており,
UTF-7 あるいは UTF-8 でエンコードされた
Unicodeテキストを表示することができます.
また,
異なる文字集合間で Unicode を経由して
文字コードを相互に変換することができるため,
Unicode を直接サポートしない端末においても
Unicode のテキストを表示することが可能です.
(ただし MSDOS版には Unicode を扱う機能はありません.)
-
各国語の文字列検索が可能
日本語や中国語の正規表現を入力してサーチすることが可能です.
-
カラー化に対応
ANSIエスケープシーケンスの中で,
文字の色や属性値を指定するシーケンスを出力に通すことができます.
これによってカラー化されたソースコードなどを見ることができます.
-
完全オリジナル
lv は完全オリジナルであり,
less などのコードは一切使用しておりません.
ダウンロード
-
-
lv ver 4.21 の書庫をダウンロードすることができます.
バージョン間の変更点はリリースノートに記してあります.
インストール
-
lv のソースは ANSI C で記述されています.
MSDOS 版 lv のコンパイルには LSI C-86 Compiler ver 3.30 [Aug 01 1991]
(試食版)を使用しました.
UNIX では gcc あるいは ANSI C 対応の cc を使って下さい.
-
UNIX 版では BSD 系と SYSV 系のどちらを使用するかで,
また端末制御にtermcapを使用するかterminfoライブラリを使用するかで
フラグが異なります.
自分の環境に合わせて Makefile を作って下さい.
SunOS, FreeBSD, NEWS-OS (RISC News, CISC News),
Solaris, HP-UX, Linux の各 gcc,
あるいは IRIX の cc を使用する場合,
Makefileの編集だけで lv を make できます.
-
DOS版ではtarget名がdosになっています. 注意してください.
インストール方法:
- 書庫を展開する. DOS版は LHa, UNIX版はgunzip とtarを使う.
- 御自分の環境に合せて ``CONFIG'' を編集し,
コンパイラフラグを設定する.
- UNIX では ``make'', MSDOS では ``make dos'' を実行する.
- ヘルプファイル ``lv.hlp'' を, UNIX では /usr/local/lib/lv/ に,
MSDOS では実行される lv.exe と同じディレクトリに置く.
日本語のヘルプ (help.ja) も用意しています. それらのファイルは
``lv.hlp'' と差し替えて使用してください.
ただし MSDOS 版の書庫にソースは含まれません.
コンパイル済みの ``lv.exe'' が添付されています.
DOS版はANSI端末用のエスケープシーケンスを出力します.
標準では ANSI.SYS という名のドライバ
(あるいはもっと高性能な奴)が必要です.
WindowsNTのDOS窓などでは,
デフォルトでANSI.SYSが入って・いない・ようですので,
もしlvがグシャグシャの出力をする場合などには,
そちらをご確認ください.
使用法
-
実行方法
ビューアとして実行する場合は, コマンドラインから:
-
-
% lv <オプション> <ファイル名>
あるいはパイプやリダイレクトを使って:
-
-
% <別のコマンド> | lv <オプション>
% lv <オプション> < <ファイル>
という形式で起動します.
ファイル名のサフィックスがgz, z, Zのファイルを引数として起動した場合,
lvは,それらのファイルをzcatを利用して展開してから読み込みます.
それらを全て展開できるzcatをインストールしてください.
(zcatの実体はgzipだそうです.
うちではgzipにzcatという名のシンボリックリンクを張って,
うまく行っています.)
lv の結果をパイプやリダイレクトに流す時は,
lv はビューアとしてではなく,
コーディングシステムの変換フィルタとして動作します.
-
実行時オプション
- -A<coding-system>
- すべてのコード系を coding-system とする
- -I<coding-system>
- 入力ファイルのコード系を coding-system とする
- -K<coding-system>
- キーボードのコード系を coding-system とする
- -O<coding-system>
- 出力のコード系を coding-system とする
-
コード系
-
- a: 自動選択 (入力ファイルのみ)
- c: iso-2022-cn
- j: iso-2022-jp
- k: iso-2022-kr
- e: Extended Unix Code
- ec: euc-china
- ej: euc-japan
- ek: euc-korea
- et: euc-taiwan
- u: UCS transformation format
- l: iso-8859-1〜9
- s: shift-jis
- b: big5
- r: rawモード
コード系の変換:
iso-2022-cn, -jp, -kr は, それぞれ euc-china か -taiwan, euc-japan,
euc-korea に変換することができます. 逆も同様です.
shift-jis は内部的には iso-2022-jp や euc-japan
と同じコード位置に置かれます.
また, 同様にlv の内部では big5 を
iso-2022-cn や euc-taiwan と同じように扱うことができます.
これらのコード系は相互に変換することが可能です.
コード変換 (コード系の変換ではなく, 文字コードの変換)
を行なった場合,
表示されるコードと内部コードが異なるために
文字列のサーチが正しく動作しません.
この問題は CNS の文字を big5 で出力するような場合や,
Unicode を経由した文字集合の変換の際に顕著に現われます.
そのような場合でも, 一旦,
コード変換したものをパイプで読み直せばうまく行きます.
例えば, big5 を UTF-8 端末で見る場合,
次のようにパイプを使うことで, そのような問題は回避できます:
``lv -Ib foo.big5 -Ou | lv -Au''
- -W<number>
- 画面の桁数(width)
- -H<number>
- 画面の行数(height)
- -z
- 端末制御に 1行削除, 1行挿入の機能がない.
MSDOS ANSI 端末で『行の挿入/削除』ができない端末では
このオプションを指定してください.
termcap, terminfo版では,これは自動的に行なわれますので,
ユーザが指定する必要はありません.
- -Ss<seq>
- スタンドアウト属性の ANSI シーケンス (デフォルト "7")
- -Sr<seq>
- 反転属性の ANSI エスケープシーケンス (デフォルト "7")
- -Sb<seq>
- 点滅属性の ANSI エスケープシーケンス (デフォルト "5")
- -Su<seq>
- 下線属性の ANSI エスケープシーケンス (デフォルト "4")
- -Sh<seq>
- 強調属性の ANSI エスケープシーケンス (デフォルト "1")
- -T<number>
-
Unicode を 2つの領域に分割するコードを指定します.
低位の領域は 1カラムの文字を含み,
高位の領域は 2カラムの文字を含むと仮定されます.
(デフォルトは 12288 です.)
- -m
-
Unicode を別の文字集合へ変換する際に,
iso-8859-* に対応する図柄を持つコードを,
iso-8859-* へ変換します.
特に, アジアの文字集合は 2バイト文字で
iso-8859-* と同型の文字を持ちますが,
そちらには変換しないことを意味します.
- -c
- 文字の属性を指定するANSIエスケープシーケンスを通す.
- -d
- 正規表現でサーチする際に, 大文字/小文字を区別しない.
- -f
- 正規表現ではなく固定文字列でサーチを行なう.
- -p
- 標準入力を読んでいる場合に,
ひと画面分の読み込みが完了する前に,
読み込んだ分を表示する.
- -s
- 古いページをスムーズに画面から掃き出す
- -u
- 特定の文字集合を同一視する. 例: 旧 JIS と 新 JIS.
さらに, このオプションによって JIS ローマ字や
lv が認識しない文字集合が ASCII として扱われます.
- -@
- すでに指定したオプションを全て無効にする.
オプションは ``+<option>'' で無効にすることができます.
例: +c, +d, ... +z.
- -
- `-' 以降の引数をファイル名として扱う
- -v
- lvのバージョンを表示する.
- -h
- 簡単な説明を表示する.
-
設定
オプションは設定ファイル ``.lv'' (MSDOS の場合は ``_lv'')
の中に書くことができます.
もし設定ファイルがホームディレクトリ,
あるいはカレントディレクトリにあれば,
起動時に読み込まれます.
また, オプションは環境変数 LV に設定することもできます.
これらの設定は次の順序で読み込まれます:
- ホームディレクトリの .lv
- カレントディレクトリの .lv
- 環境変数LV
- コマンドラインのオプション
環境変数LVの設定例:
- MSDOS の場合 (入力ファイルがshift-jis, 画面サイズが25行)
set LV=-Is -H25
- UNIX csh の場合 (キーボードも表示もeuc-japanという時)
setenv LV '-Kej -Oej'
-
コマンド
- 0〜9:
- 引数
- g, <:
- 指定された行へジャンプ(デフォルトでファイルの先頭へジャンプ)
- G, >:
- 指定された行へジャンプ(デフォルトでファイルの末尾へジャンプ)
- p:
- 指定パーセント(0〜100)位置にジャンプ.
ただしバイト数ではなく,行数で計算します.
- b, C-b:
- 前のページに戻る
- u, C-u:
- 前の半ページに戻る
- k, C-k, y, C-y, C-p:
- 前の行に戻る
- j, C-j, e, C-e, C-n, CR:
- 次の行に進む
- d, C-d:
- 次の半ページに進む
- f, C-f, C-v, SP:
- 次のページに進む
- /<string>:
- 文字列の前方検索
- ?<string>:
- 文字列の後方検索
- n:
- 前方検索を繰り返す
- N:
- 後方検索を繰り返す (``反対方向''ではありません)
- C-l:
- 画面の再表示
- r, C-r:
- 不要なメモリの解放と画面の再表示
- R:
- 現在のファイルを再び読み込んで表示
- C-g:
- ファイル情報の表示(ファイル名,位置,コード系)
- V:
- lvのバージョンの表示
- C-z:
- サスペンド (MSDOS では環境変数 SHELLの値,
それが設定されていなければ command.com を呼ぶ)
- q, Q:
- lv の終了
-
検索文字列の入力
正規表現で検索を行なうことができます.
lvの正規表現はMuleの正規表現に似せて作ってあります.
キーボードからの入力に関して,
次のキーは特殊な意味を持ちます:
- C-m (CR)
- 文字列を確定する
- C-h (BS)
- 1文字削除する
- C-u
- 入力をやりなおす
- C-p
- 過去の入力の履歴を表示する
- C-g
- 入力を止める
-
正規表現について
ここでは簡単にlvでの正規表現について説明しておきます.
(なお,以下の各特殊文字は全てASCII文字です.)
- 「. (ピリオド)」
どんな文字ともマッチします.
例えば「あ.は」は,
「あはは」「あひは」「あほは」などの,
「あ」で始まり「は」で終る3文字のストリングにマッチします.
- 「*」
文字の0回以上の繰り返しを構成します.
例えば「あは*」は,
「あ」「あは」「あはははは」などにマッチします.
- 「+」
文字の1回以上の繰り返しを構成します.
例えば「あは+」は,
「あは」「あはははは」などにマッチしますが,
「あ」にはマッチしません.
- 「?」
文字が1回現れるか,まったく現れない場合にマッチします.
例えば「あは?」は,
「あ」あるいは「あは」だけにマッチします.
- 「[ ... ]」
文字集合を作ります.
例えば,「[あは]+」は,
「あ」と「は」から成る全てのストリングにマッチします.
「-」を使って文字の範囲を指定して文字集合を作ることができます.
例えば,「[あ-は]+」は,
「あ」から「は」までの範囲の文字から成る
全てのストリングにマッチします.
複数文字集合の場合,バイト列を符号無し整数と見なして
順序関係を定めています.
相互に範囲が重複する文字集合は使用しないでください.
- 「[^ ... ]」
文字集合の補完集合を作ります.
例えば,「[^あは]+」は,
「あ」と「は」以外の文字から成る全てのストリングにマッチします.
補完集合の場合でも範囲を指定して集合を作ることができます.
例えば「[^あ-は]+」は,
「あ」から「は」までの範囲・以外・の文字から成る
全てのストリングにマッチします.
- 「^」
行頭にマッチします.
例えば,「^あ」は,
行頭にある「あ」にのみマッチします.
- 「$」
行末にマッチします.
例えば,「あ$」は,
行末にある「あ」にのみマッチします.
- 「\」
特殊な文字をクォートします.
- 「\1」
表示幅が1桁の文字にマッチします.
- 「\2」
表示幅が2桁の文字にマッチします.
- 「\|」
複数の選択肢から,いづれかを選択できるようにします.
例えば,「あは\|あひ」は,
「あは」あるいは「あひ」のいづれかのストリングにマッチします.
- 「\( ... \)」
文字列をグループ化します.
例えば,「\(でん\)*むし」は,
「むし」あるいは「でんむし」,
「でんでんむし」,「でんでんでんむし」などにマッチします.
行の取扱い
-
1 行は 1023 文字まで
lv では 1行を LF (ラインフィード) で区切って論理的に管理しています.
1行の長さには制限がありまして, 1行が 1023 文字以上になる場合,
強制的にLFが挿入されます.
この制限はコンパイル時に決まります.
なお,行に含まれるCR (キャリッジリターン)は全て無視して読み込まれます.
-
物理行は 64行まで
論理的な1行は画面サイズに合わせて物理的には複数行として表示されます.
この管理のために lv では物理行の数に制限を設けています.
この制限はコンパイル時に決まります.
現在,論理的な1行が64行以上になる場合,残りの物理行は表示されません.
-
論理行数には上限があります
lv で扱える論理行数には上限があります.
UNIX版では論理行で 50万行まで(MSDOS版では65000行まで)
扱えるようにコンパイルしてあります.
この値はコンパイル時に決まります.
最大行以上の論理行は無視されます.
コード系について
-
ISO 2022 に従うコード系
lvはISO 2022に従うコード系を行単位でステートレスとして扱っています.
そのため,デコードするコード系を予め指定する必要があります.
また,出力に際しても,
同様の制限から若干の冗長なコードを追加してしまうことがあります.
- iso-2022-cn
RFC 1922に従うコード系です.
| G0 | G1 | G2 | G3
|
Designation | ASCII | GB 2312-80, CNS 11643-1992 Plane 1, ISO-IR-165 | CNS 11643-1992 Plane 2 | CNS 11643-1992 Plane 3..7
|
- iso-2022-jp
RFC 1468, RFC 1554に従うコード系です.
lv では全ての 94文字集合が G0 を使い,
全ての 96文字集合が G2 とシングルシフトを使うとしています.
- iso-2022-kr
RFC 1557に従うコード系です.
lv では ASCII 以外の全ての文字集合が
G1 とロッキングシフトを使うとしています.
-
Extended Unix Code
コード系に euc-* を選択した場合は
euc-* と iso-2022-* が混っているファイルでも読むことが出来ます.
- euc-china
| G0 | G1 | G2 | G3
|
指示 | ASCII | GB 2312-80 | not used | not used
|
- euc-japan
| G0 | G1 | G2 | G3
|
指示 | ASCII | JIS X 0208 | JIS X 0201 Katakana | JIS X 0212
|
- euc-korea
| G0 | G1 | G2 | G3
|
指示 | ASCII | KS C 5601-1987 | not used | not used
|
- euc-taiwan
| G0 | G1 | G2 | G3
|
指示 | ASCII | CNS 11643 Plane 1 | CNS 11643 Plane 2-7 | not used
|
-
UCS transformation format
Unicodeは次の文字集合との間で相互に文字コードを変換することができます:
GB 2312-80, JIS X 0208, JIS X 0212, KSC 5601-1987,
Big Five, CNS 11643-1992 Plane 1-2, ISO 8859-1..9.
現在の lv のマッピングテーブルは Unicode 1.1 に基づいています.
Encoding | Charset used for mapping
|
iso-2022-cn | GB 2312-80 (primary), CNS 11643-1992 (secondary), (ISO 8859-*)
|
iso-2022-jp | JIS X0208, JIS X0212, JIS X0201, (ISO 8859-*)
|
iso-2022-kr | KSC 5601-1987, (ISO 8859-*)
|
euc-china | GB 2312-80
|
euc-japan | JIS X0208, JIS X0212, JIS X0201
|
euc-korea | KSC 5601-1987
|
euc-taiwan | CNS 11643-1992 Plane 1-2
|
shift-jis | JIS X0208, JIS X0201
|
big5 | Big Five
|
Unicode の CJK イデオグラフ部分を iso-2022-cn で出力する場合,
主として GB 2312-80 が使用されます.
GB に属さない残りの文字は CNS 11643-1992 へ変換されます.
-
その他のコード系
- iso-8859-*
G0にASCII,
G1に ISO 8859/1〜9 のいづれかを指示し,
G0とG1が,それぞれGLとGRに呼び出された状態で出力を行ないます.
- shift-jis
コード系に shift-jis を選択した場合は
shift-jis と iso-2022-jp が混っているファイルでも読むことが出来ます.
※ euc-japan と shift-jis
が混在するファイルはどちらか一方でしかデコードできません.
- big5
big5 は部分的にCNS 11643-1992 Plane1-2へ変換することができるため,
入力コード系としてbig5を指定して読み込んだテキストを
iso-2022-cnやeuc-taiwanで出力することが可能です.
しかし,
そのような場合,
内部コードと出力コードが異なるため,
lvの文字列検索が正しく機能しません.
これはCNSをbig5で出力する場合も同様です.
CNSにマッピングできない文字は``?'' (question mark)として出力されます.
- rawモード
エンコード/デコード共に,特定のコード系に従わないモードです.
コード系について補足
-
無効なコード
出力コード系で出力できない文字集合
(例えばshift-jisではJIS X0212を出力することができない)
に属する文字に関して,
その文字本来の表示幅までは文字コードそのものが出力されます.
指定されたコード系に従ってデコードしている最中に
誤り状態となったコードは
部分的に無視されることがあります.
表示できるものは制御文字として出力します.
-
バックスペース
ファイルに含まれる BS (バックスペース) は次のように解釈されます.
- BS を狭んで同じ文字が続いた時
ハイライトの属性が与えられたものとする.
- BS を狭んで, BS の直前の文字が _ (下線) の時
アンダーラインの属性が与えられたものとする
- それ以外の場合
BSの直前の文字を一文字削除する.
-
バイナリーファイル
バイナリーファイルに埋め込まれた文字列も,
デコードして表示することができます.
ただし,
特定のコード系に従ってデコードしている最中に,
部分的に無視されるコードが生じることがあります.
オプション-Irを与えると,
CR以外に,そのような削除されるコードは生じません.
コード系の自動選択
-
デフォルトのコード系
入力コード系のデフォルトは, 次に述べる自動選択です.
自動選択の状態において,
lv は入力を iso-2022-kr と見なしてデコードを行ないます.
出力コード系のデフォルトは, UNIX では iso-2022-jp,
MSDOS では shift-jis です.
入力ファイルのコード系を指定しなかった場合 (デフォルトの状態),
入力ファイルのコード系を自動判別するようにしてあります.
読み込むファイルが euc-japan なのか,
shift-jis なのかを自動的に選択します.
-
自動選択の方法
現在の自動選択の方法は簡単なものです.
ファイルを先頭から読み込んでいって,
8ビット目が立っている文字があった場合,
『その行』の中で
euc-japan で使用される領域のみを使っていれば euc-japan,
そうでなければ shift-jis です.
つまり,『漢字らしきものを含む最初の一行』で判断しています.
8ビット目が立っている文字が見つからなければ
いつまでも自動選択のままの状態が続き,
判断が必要になったときに判断します.
shift-jis の片仮名のみを使用した場合や,
運の悪いときは,
誤って euc-japan と認識されます.
コード系が分かっている場合,
あるいは自動選択の結果が正しくなかった場合,
実行時にオプションを指定してコード系を確定してください.
この時, 自動判別は機能しません.
カラー化について
- オプション-cを指定すると,
ESC [ ps ; ... ; ps m というシーケンスにおいて,
次のpsの値が有効になります.
- 1: 高輝度
- 4: 下線
- 5: 点滅
- 7: 反転
- 30: 黒
- 31: 赤
- 32: 緑
- 33: 黄色
- 34: 青
- 35: 紫
- 36: 水色
- 37: 白
- 40〜47: 30〜37の反転
- 各シーケンスは独立しています.
各シーケンスを読み込む前に,すべての値をリセットしています.
- 各シーケンスの有効範囲は一つの論理行の中だけです.
論理行をまたぐと,すべての値はリセットされます.
- 一度に指定できる色は一色だけです.
複数の色を指定した場合,
最後に指定した色が使われます.
- 反転文字に関して,
指定する色は『反転させる色』を意味します.
反対の『色抜きされる文字の色』を指定することはできません.
- 画面に出力されるシーケンスはカスタマイズ可能です.
オプション-Sを使用して個々のシーケンスを指定します.
カスタマイズ
- コマンドキーのカスタマイズ
keybind.h をご覧になってキーバインドのテーブルを書き換えて下さい.
- 端末制御のカスタマイズ
新しく端末制御を加える時は, console.c に修正を加えてください.
また,
エスケープシーケンスの解釈を変更する場合も
console.c を修正してください.
ただしANSIエスケープシーケンスの一部はオプションから変更可能です.
- MSDOS ansi 端末版の画面サイズの変更
デフォルトの画面サイズは80桁24行になっています.
これを変更するにはconsole.c の該当部分を修正して下さい.
ただし画面サイズはオプションから指定できます.
- デフォルトのコード系のカスタマイズ
現在はデフォルトで次のようなコード系を設定しています.
-
| MSDOS | UNIX
|
入力ファイル: | 自動判別 | 自動判別
|
キーボード: | shift-jis | iso-2022-jp
|
出力: | shift-jis | iso-2022-jp
|
これを変更する場合, lv.c の該当部分を修正してください.
ただし各コード系はオプションから指定できます.
- コード系のカスタマイズ
現在のところ
ISO 2022 と EUC, shift-jis, big5, UTF-7, UTF-8 の 6 種類を実装しています.
その他のコード系を加える場合,
ctable_t.h, ctable.c, encode.c, decode.c, iso2022.c などを参考にして
修正してください.
- 文字集合のカスタマイズ
itable_t.h, itable.c などを参考にして修正してください.
現在, 認識できる文字集合は次の通りです. 属性として,
文字集合のコード長 (1文字のバイト数),
1文字の表示幅を指定します.
コード長と文字幅が同一である必要はありません.
文字ごとに表示幅が異なる場合は対応していませんが,
最大値を指定すれば特に問題は起こりません.
コード長が3文字以上の文字集合を加えることは出来ません.
(どうしても,という場合は,
4文字までの集合ならば,ちょっとした修正で対応可能です.)
-
-
ISO 646 米国 (ANSI X3.4-1968)
JIS X0201-1976 ローマ字
JIS X0201-1976 片仮名
ISO 8859/1 ラテンアルファベット No.1 右部分
ISO 8859/2 ラテンアルファベット No.2 右部分
ISO 8859/3 ラテンアルファベット No.3 右部分
ISO 8859/4 ラテンアルファベット No.4 右部分
ISO 8859/5 キリルアルファベット
ISO 8859/6 アラビアアルファベット
ISO 8859/7 ギリシャアルファベット
ISO 8859/8 ヘブライアルファベット
ISO 8859/9 ラテンアルファベット No.5 右部分
JIS C 6226-1978 日本語漢字
GB 2312-80 中国語漢字
JIS X 0208-1983 日本語漢字
KS C 5601-1987 韓国図形文字集合
JIS X 0212-1990 日本語補助漢字
ISO-IR-165
CNS 11643-1992 Plane 1
CNS 11643-1992 Plane 2
CNS 11643-1992 Plane 3
CNS 11643-1992 Plane 4
CNS 11643-1992 Plane 5
CNS 11643-1992 Plane 6
CNS 11643-1992 Plane 7
Big5 Traditional Chinese
Unicode
ただし,これらの文字集合は単に認識されるだけで,
それが表示できるか否かは,ご利用になる端末
(それが受けつけるコード系と文字集合)によります.
逆に,上記に無い文字集合でも,
8単位系のコードの文字を8単位系で見るような場合
(コード変換が行なわれず,文字幅を1文字1桁と見なせるならば),
latin-1として読み込んで,
latin-1として出力すれば問題なく表示することができるでしょう.
知られているバグ
- UNIXで, shからlvを使用すると,サスペンドがうまく機能しない.
バグレポート
-
lvのバグを発見した時は,ぜひ
narita@mt.cs.keio.ac.jp
まで御連絡ください.
リリースノート
-
ここをクリックしてください.
謝辞
-
lvの誕生にかかわった皆様に感謝しております.
参考文献
- JIS X 0202-1991 情報交換用符号の拡張法
Information processing - ISO 7-bit and 8-bit coded character sets
- Code extension techniques
- JIS X 0208-1990 情報交換用漢字符号
Code of the Japanese graphic character set for information interchange
- JIS X 0212-1990 情報交換用漢字符号 - 補助漢字
Code of the supplementary Japanese graphic character set for
information interchange
- RFC 1922 Chinese Character Encoding for Internet Messages
- RFC 1642 (Experimental) UTF-7 - A Mail-Safe Transformation Format of Unicode
- RFC 1557 Korean Character Encoding for Internet Messages
- RFC 1554 ISO-2022-JP-2: Multilingual Extension of ISO-2022-JP
- RFC 1468 Japanese Character Encoding for Internet Messages
- Understanding Japanese Information Processing (『日本語情報処理』)
Ken Lunde O'Reilly & Associates, Inc. ISBN 1-56592-043-0
- CJK.INF Version 2.1 (July 12, 1996)
Online Companion to "Understanding Japanese Information Processing"
Ken Lunde
- UTF-7 Encoding Form
- UCS Transformation Format 8 (UTF-8)
- Compilers - Principles, Techniques, and Tools
Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman
Addison-Wesley, ISBN 0-201-10088-6
NARITA Tomio
email: narita@mt.cs.keio.ac.jp
Homepage: http://www.mt.cs.keio.ac.jp/person/narita.html