ぱぱネット（仮）

2007-04-28 有権者諸君！

_ この国は最悪だ！

むしろ俺が最悪だ！

[ツッコミを入れる]

TrackBack(0)

2009-04-28 もう全部バイトストリームでいいじゃないか

_ 俺が馬鹿なだけなの

Perl 5.8.x における日本語コード変換のメモ。 Perl 5.8.x Unicode関連。 perl5.8のUnicodeサポート。もーこれで理解できます?

俺はもうあきらめました...

元々 ARIB8単位符号体系の追加記号集合(ARIB STD-B24 p1v2 Table7-20とか)を、 Webアプリ上で正しく扱うためにUnicodeサポートが必要だっただけなのに。

_ よくわからんが

既存のPerlモジュールもCGI.pm内部コード問題みたいなのが普通に放置されている現状。

とりあえずuse Encode;しただけで各モジュールの動作が変わってしまうとかマジでやめてくれないだろうか。 Perl 5.8以前でJcode.pmを使っていたように、明示的に呼び出した部分だけ適切な文字コード変換を行ってくれるだけでいいんだが、こんな簡単なことさえ実現することができない俺。PerlIOムッ殺す。

use open IO  => ":utf8";
use open ":std";

しててもCGI上でprintすると Wide character in printって怒られる。

頼みの綱のEncode::Guessは、検索用のform文に入力されるような短い単語だと頻繁に例外吐いて落ちる... 。 Encode::Guess::guess_encodingで候補リストチェックしてると結構長い単語でも2つ以上候補があるし。

shiftjis or utf8 at /usr/lib/perl/5.8/Encode.pm line 186

これはほっとけば時間が解決するのか?もういっそ別のプラットホームに移行した方が早い気がしてきた。

本日のツッコミ(全6件) [ツッコミを入れる]

Before...

_ こにしか [とりあえず、 sub unk2uni::utf8 { my ($str) = @_; my $de..]

_ もぽ [ちょろっと実験してみたけど、guess_encodingを2パラメータ形式で使って、一段目はshiftjis抜き、そ..]

_ もぽ [大雑把には my $decoder = guess_encoding($str, qw/utf8 euc-jp/)..]

TrackBack(0)

2001|04|

2006|07|08|09|10|11|12|

2007|01|02|03|04|05|06|07|08|09|10|11|12|

2008|01|02|03|04|05|06|07|08|09|10|11|12|

2009|01|02|03|04|05|06|07|08|09|10|11|12|

2010|01|02|03|04|05|06|07|08|09|10|11|12|

2011|01|02|03|04|05|06|07|08|09|10|11|12|

2012|01|02|03|04|05|06|07|08|09|10|11|12|

2013|01|03|04|05|06|07|08|09|10|11|12|

2014|01|03|04|05|10|

このサーバーをもう12年も維持しているかと思うとめまいがしますよ。
ツッコミ機能は、ハンドル名が完全日本語じゃないと登録できません。
また、本文にURLが含まれていても登録できません。
いずれもSPAM対策です。

訪問者数：(11777+2560143)

2009-04-28
- 俺が馬鹿なだけなの
- よくわからんが
2007-04-28
- この国は最悪だ！