PERLTW 7
PERLTW
NAMEDESCRIPTION
SEE ALSO
AUTHORS
NAME
perltw - æ£ä½ä¸æ Perl æå
DESCRIPTION
æ¬¢è¿æ¥å° Perl ç天å°!
ä» 5.8.0 çå¼å§, Perl å·å¤äºå®åç Unicode (ä¸å½ç ) æ¯æ´, ä¹è¿å¸¦æ¯æ´äºè®¸e夿ä¸è¯ç³»ä»¥å¤çç¼ç æ¹å¼; CJK (䏿¥é©) 便æ¯å¶ä¸- çä¸é¨ä»½. Unicode æ¯å½éæ§çæ å, è¯å¾æ¶µçeä¸ç䏿æçå符: 西æ¹ä¸ç, 䏿¹ä¸ç, 以å两èé´çä¸å (å¸èæ, åå©äºæ, é¿æä¼¯æ, å¸ä¼¯æ¥æ, å°åº¦æ, å°å°å®æ, çç). å®ä¹å®¹çº³äºå¤ç§ä½ä¸ç³»ç»ä¸å¹³å° (å¦ PC å麦éå¡).
Perl æ¬èº«ä»¥ Unicode è¿è¡æä½. è¿è¡¨ç¤º Perl åé¨çåä¸²èµæå¯ç¨ Unicode 表示; Perl çå½å¼ä¸ç®ç¬¦ (ä¾å¦æ£è§è¡¨ç¤ºå¼æ¯å¯¹) ä¹è½å¯¹ Unicode è¿è¡æä½. å¨è¾å¥åè¾åºæ¶, 为äºå¤ç以 Unicode ä¹åçç¼ç æ¹å¼å¨åçèµæ, Perl æä¾äº Encode è¿ä¸ªæ¨¡ç», å¯ä»¥è®©ä½ è½»æå°è¯»ååå奿§æçç¼ç èµæ.
Encode å»¶ä¼¸æ¨¡ç»æ¯æ´ä¸åæ£ä½ä¸æçç¼ç æ¹å¼ (’big5’ 表示 ’big5-eten’):
big5-eten Big5
ç¼ç
(å«å天延伸åå½¢)
big5-hkscs Big5 +
馿¸¯å¤åé,
2001 å¹´ç
cp950 åç 页 950 (Big5
+
微软添å çå符)
䏾便¥è¯´, å° Big5 ç¼ç çæ¡£æ¡è½¬æ Unicode, ç¥éé®å¥ä¸åæä»¤:
perl -Mencoding=big5,STDOUT,utf8 -pe1 < file.big5 > file.utf8
Perl ä¹åéäº "piconv", 䏿¯å®å¨ä»¥ Perl åæçå符转æ¢å·¥å·ç¨å¼, ç¨æ³å¦ä¸:
piconv -f big5
-t utf8 < file.big5 > file.utf8
piconv -f utf8 -t big5 < file.utf8 > file.big5
å¦å¤, å©ç¨ encoding 模ç», ä½ å¯ä»¥è½»æååºä»¥å符为åä½çç¨å¼ç , å¦ä¸æç¤º:
#!/usr/bin/env
perl
# å¯å¨ big5
å串解æ;
æ åè¾åºå¥åæ åé误é½è®¾ä¸º
big5 ç¼ç
use encoding ’big5’, STDIN =>
’big5’, STDOUT => ’big5’;
print
length("éªé©¼"); #
2
(åå¼å·è¡¨ç¤ºå符)
print
length(’éªé©¼’);
# 4
(åå¼å·è¡¨ç¤ºä½åç»)
print
index("è°è°æè¯²",
"å½å¸¢"); # -1
(ä¸å嫿¤åå串)
print
index(’è°è°æè¯²’,
’å½å¸¢’); # 1
(ä»ç¬¬äºä¸ªä½åç»å¼å§)
卿åä¸åä¾åé, "è°" ç第äºä¸ªä½åç»ä¸ "è°" ç第ä¸ä¸ªä½åç»ç»åæ Big5 ç ç "å½"; "è°" ç第äºä¸ªä½åç»åä¸ "æ" ç第ä¸ä¸ªä½åç»ç»åæ "帢". è¿è§£å³äºä»¥å Big5 ç æ¯å¯¹å¤çä¸å¸¸è§çé®é¢.
é¢å¤ç䏿ç¼ç
妿éè¦æ´å¤ç䏿ç¼ç , å¯ä»¥ä» CPAN (<http://www.cpan.org/>) ä¸è½½ Encode::HanExtra 模ç». å®ç®åæä¾ä¸åç¼ç æ¹å¼:
cccii 1980
å¹´æå»ºä¼ç䏿èµè®¯äº¤æ¢ç
euc-tw Unix
延伸å符é,
åå« CNS11643
å¹³é¢ 1-7
big5plus
䏿æ°ä½åææ¯æ¨å¹¿åºéä¼ç
Big5+
big5ext
䏿æ°ä½åææ¯æ¨å¹¿åºéä¼ç
Big5e
å¦å¤, Encode::HanConvert 模ç»åæä¾äºç®ç¹è½¬æ¢ç¨ç两ç§ç¼ç :
big5-simp Big5
æ£ä½ä¸æä¸
Unicode
ç®ä½ä¸æäºè½¬
gbk-trad GBK
ç®ä½ä¸æä¸
Unicode
æ£ä½ä¸æäºè½¬
è¥æ³å¨ GBK ä¸ Big5 ä¹é´äºè½¬, 请åè该模ç»åéç b2g.pl ä¸ g2b.pl 两æ¯ç¨å¼, æå¨ç¨å¼å使ç¨ä¸ååæ³:
use
Encode::HanConvert;
$euc_cn = big5_to_gb($big5); # ä» Big5
转为 GBK
$big5 = gb_to_big5($euc_cn); # ä» GBK
转为 Big5
è¿ä¸æ¥çèµè®¯
请åè Perl åéç大é说ææä»¶ (ä¸å¹¸å¨æ¯ç¨è±æåç), æ¥å¦ä¹ æ´å¤å³äº Perl çç¥è¯, 以å Unicode çä½¿ç¨æ¹å¼. ä¸è¿, å¤é¨çèµæºç¸å½ä¸°å¯:
æä¾
Perl
èµæºçç½å
<http://www.perl.com/>
Perl çé¦é¡µ (ç±æ¬§è±ç¤¼å¬å¸ç»´æ¤)
<http://www.cpan.org/>
Perl 综åå¸èç½ (Comprehensive Perl Archive Network)
<http://lists.perl.org/>
Perl é®é论åä¸è§
å¦ä¹
Perl çç½å
<http://www.oreilly.com.tw/chinese/perl/index.html>
æ£ä½ä¸æççæ¬§è±ç¤¼ Perl 书è
<http://groups.google.com/groups?q=tw.bbs.comp.lang.perl>
å°æ¹¾ Perl è¿çº¿è®¨è®ºåº (ä¹å°±æ¯å大 BBS ç Perl è¿çº¿ç)
Perl
使ç¨èéä¼
<http://www.pm.org/groups/asia.shtml#Taiwan>
å°æ¹¾ Perl æ¨å¹¿ç»ä¸è§
<http://irc.elixus.org/>
èºç«å线ä¸è天室
Unicode
ç¸å³ç½å
<http://www.unicode.org/>
Unicode 妿¯å¦ä¼ (Unicode æ åçå¶å®è)
<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
Unix/Linux ä¸ç UTF-8 å Unicode ç客é®
䏿åèµè®¯
为ä»ä¹å«
"æ£ä½ä¸æ"
ä¸å«
"ç¹ä½ä¸æ"?
<http://www.csie.ntu.edu.tw/˜b7506051/mozilla/faq.html#faqglossary>
䏿å软ä½èç
<http://www.cpatch.org/>
Linux 软ä½ä¸æå计å
<http://www.linux.org.tw/CLDP/>
SEE ALSO
Encode, Encode::TW, encoding, perluniintro, perlunicode
AUTHORS
Jarkko Hietaniemi <jhi@iki.fi>
Autrijus Tang (å宿±) <autrijus@autrijus.org>
è·
æ¬é¡µé¢ä¸æçç±ä¸æ
man
æå页计åæä¾ã
䏿 man
æå页计åï¼https://github.com/man-pages-zh/manpages-zh