Newsgroups: osaka-u.tsaou.questions
Subject: TSAOU FAQ on CDeleGate (Ver 1.2)
TSAOU FAQ on CDeleGate [Ver1.2][本稿為初稿,有待大家補正]
本常問問題集回答下列有關 CDeleGate(轉碼服務) 的常問問題:
1.什麼是 CDeleGate 轉碼台?
2.我如何使用 CDeleGate 轉碼台?
3.聽說 CDeleGate 能自動辨識文件的語言編碼?
4.CDeleGate 的轉碼結果中有 [xue3] 之類的記號,這是什麼?
5.我對架設 CDeleGate 轉碼台有興趣,該如何著手?
本常問問題集存放於 news://133.1.96.57:1190/osaka-u.tsaou.questions
或 http://133.1.96.43/~seke/tsaou/faq/cdelefaq.html
有興趣者請至該處讀取.謝謝.
--------------------------------------------------------------------------
1.什麼是 CDeleGate 轉碼台?
CDeleGate 是一種轉碼服務台,由網路上某處電腦志願免費提供.
當您使用網路瀏覽軟體,如 Netscape,Mosaic,Omniweb 等時,
如果遇到亂碼,則您可以透過 CDeleGate 的幫忙,為您作線上轉碼.
目前(1998.7.)對外開放的有四處:
服務站住址 所在 CDeleGate版本 DeleGate版本
------------------------------ ------ -------------- ------------
http://133.1.96.57:1995/-/ 阪大1 1.4a 3.0.17
http://133.1.207.230:1995/-/ 阪大2 1.4a 3.1.1
http://157.82.16.162:1997/-/ 東大 1.4a 3.0.17
http://140.112.2.89:1995/-/ 台大 1.4a 5.3.3
CDeleGate Ver 1.4a 目前能處理中日文間,任意兩種碼的轉換:
中文方面包括 CN {Big5, HZ, GB}
日文方面包括 JP {EUC-Jis, Jis, Shift-Jis}
2.我如何使用 CDeleGate 轉碼台?
要使用 CDeleGate 轉碼台的服務,只須改寫您原有的 URL ,如下冠上
CDeleGate 轉碼台的住址和轉碼命令即可:
http://133.1.96.57:1995/-_-/cc.out_code.in_code/
^^^^^^^^^^^^^^^^^^^^^^^#########################
其中 ^^^ 部分指定 CDeleGate 轉碼台的電腦住址
### 部分指定轉碼命令,命令中的
in_code 來源碼包括 cn,big5,gb,hz
jp,euc,sjis,jis
out_code 目的碼包括 big5,gb,hz
euc,sjis,jis
舉例來說,譬如,您用日文瀏覽器在讀取 URL
http://133.1.96.43/~seke/test/song.b5時,
發現亂碼,則您可以改寫 URL 如下,
http://133.1.96.57:1995/-_-/cc.euc.big5/http://133.1.96.43/~seke/test/song.b5
這時,透過轉碼命令 cc.euc.big5, CDeleGate 先為您讀取 big5 文件,
把它轉成 euc 文件之後,再送回給您的瀏覽器軟體作正確顯示.
3.聽說 CDeleGate 能自動辨識文件的語言編碼?
以 CDeleGate Ver 1.4a 來說,若您只知道文件是中文或日文,卻不知道
其確切的編碼,則您在轉碼命令中,可以使用
.../cc.euc.cn/...
.../cc.big5.jp/...
這時, CDeleGate 會在 cn 的範圍內 {big5, gb, hz}, 以行為單位,
為您自動選定一種來源碼,再將之轉成您所指定的目的碼
同理, CDeleGate 會在 jp 的範圍內 {euc, jis, sjis}, 以行為單位,
為您自動選定一種來源碼,再將之轉成您所指定的目的碼
cn 自動辨識的準確率方面,由於 big5 和 gb 有一段編碼範圍重疊,因此偶爾
會有認錯情形發生.這時,您可以改用 big5 或 gb,要求只作其中一種碼的轉換.
另外,目前的自動辨識只能在有提示文件為中文(cn)或日文(jp)之下,作辨識.
至於完全無提示下,自動辨識中日文,目前尚沒有辦法.
4.CDeleGate 的轉碼結果中有 [xue3] 之類的記號,這是什麼?
由於 big5, gb, euc 3種漢字的字集並不相等, 因此轉碼過程中出現對應不到
的字時,就權宜以大陸通用的羅馬拼音系統作提示,以方便閱讀.
有關拼音系統和注音符號的對應表,請參考
gopher://dongpo.math.ncu.edu.tw/00/chinese/ZYvsPY
5.我對架設 CDeleGate 轉碼台有興趣,該如何著手?
架設 CDeleGate 轉碼台的系統基本要求如下:
1. 電腦必須是工作站, OS 為 Unix
2. 編譯過程中必須用到 15 M Byte, 但正常運行時只須 1.2 M Byte 的硬碟空間
3. 運行時每接受一個轉碼要求的過程中,就要用掉 1.2M - 1.6M 的記憶體,
直到轉碼結束,釋回記憶體為止
4. 執行時如果要加上 cache 功能,減少重複網路讀取, 最好有 20 M Byte
以上的額外硬碟空間
如果您的系統滿足上述條件,則請參考底下的架設說明:
http://133.1.96.43/~seke/software/cdelegate/cdelegate1.4b.note