Safari で入力すると文字化けする漢字 - ポエツ | poets

Logs

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

wikipedia などから文章を引用しようとコピーペーストすると、Safari では「?」と文字化けしてしまうことがあります。バックスラッシュが文字化けするのと似た現象です。

wikipedia などは文字コードが UTF-8 なので、多言語に対応していますが、日本のブログの多くは Shift-JIS か EUC-JP を採用しているため、外字をそのままでは使うことはできません。
 [参照]絵文録ことのは.「多国語で書けるブログはどこ?ブログ124サービス【文字コード】全チェック」

ちなみに繁體字というのは、日本でも戦後の教育改革前に使われていたいわゆる旧字とほぼ同じで、京極夏彦センセイがやたら使いたがるアレです。
簡体字とは、共産党中国が誕生したときに、画数の多い漢字を簡素化するために導入されたものです。ただし漢字の「つくり」の概念をばっさり切り捨ててしまっているので、字源を辿る(漢字の作りから意味を推測する)ことがしにくいです。
「麗」は大胆に省略して「丽」になったり、「穀」は音が同じ「谷」になります。穀物を谷物とか書かれると意味不明なわけです。

「鄧」は unicode で、Shift-JIS にはない文字だとわかります。

それで、Shift-JIS や EUC-JP のブログでは文字実体参照を使いますが、Firefox や Windows IE など、大概ブラウザが自動的に実体参照化してくれるようです。
「登β」のように、ギリシア文字と組文字にして表現するアラワザもよく見かけますが、これは決して「ノボル・ベータ」…ではありません。「耳呈」は「みみてい」ではなく「聖」です(わざわざ分解すんなヨ)。

Safari では、あらかじめ unicode の文字を実体参照化しておく必要があります。 MSWord ではウェブテキストとして保存すると、わざわざspanで囲んで言語指定してくれるようです。しかしなかなか実体参照化に使い勝手のいいエディタがありません。と言うか、それならFirefox使った方が早そうです。
が、なんとか Safari だけでがんばってみましょう。

Googleで、「鄧 + FC2」、「鄧 + EUC」のように検索して、その文字を使ったサイトを見つけます。このとき「キャッシュ」で開くと、当該の文字がマーキングされているので探しやすいです。これをさらにソース表示させます。
するとブラウザ上では「鄧」と表示されている字は、文字参照で「鄧」なのだとわかります。
これをそのまま入力すれば Safari からでも文字化けは回避ことができます。

これで「我愛イ尓」なんて珍妙な書き方をしていたのも、スマートに「我愛你」と言えるようになります。

comment


  管理者にだけ表示を許可する

trackback

用FC2,寫部落格日誌也都簡單阿!

検索語抽出

ポップアップ・コメント

poets designed

Ajax検索
AD

台湾留学 完全サポート

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。