2013年3月28日木曜日

org.w3c.dom.Document の XML parse で Exception あるある


Double-Byteの文字が入っているXMLファイルをParseする際に良くある失敗

Invalid byte 1 of 1-byte UTF-8 sequence.


XMLにDouble-Byteが入っているなら、対応するEncodingを指定してあげましょう
上の例であれば、読み込み対象のXMLファイルのEncodingがUTF-8になっているはずなのでこれをShift-JISに変えます。

<?xml version="1.0" encoding="UTF-8"?> 
 -->
<?xml version="1.0" encoding="Shift-JIS"?>

そもそもDouble-Byteが入っているのにEncodingがUTF-8であるXMLファイルは、それ自体XMLファイルとしてFormatが成立していない訳なんですが、自分の場合は、強引にXMLファイルを作成するケースが多いので、なんども同じ過ちを繰り返してしまう。。。

あるよね~ (え?ないですか?)

0 件のコメント:

コメントを投稿