- rawurlencode: documentation ( source)
- str_replace: documentation ( source)
- htmlspecialchars: documentation ( source)
<?php
function test($input) {
$output = htmlspecialchars($input, ENT_QUOTES, 'UTF-8');
$code = str_replace('%', '\\x', rawurlencode($input));
if (validate_utf8($input)) {
echo "【{$output}】({$code}) は有効なUTF-8シーケンスです。\n";
} else {
echo "({$code}) は無効なUTF-8シーケンスです。\n";
}
}
test("☝( ◠‿◠ )☝");
test("ゔ〲〰");
test("\x0a\x92\xff"); // てきとー
test("\xef\xbb\xbf"); // BOMだっけ
test(""); // 空文字列
echo "\n";
test("\x2f"); // スラッシュ(1バイト)
test("\xc0\xaf"); // スラッシュ(冗長2バイト)
test("\xe0\x80\xaf"); // スラッシュ(冗長3バイト)
test("\xf0\x80\x80\xaf"); // スラッシュ(冗長4バイト)