<?php
// タグの条件
define("PAT_TAG", "(^|[\\s])([##]\\S+)");
// $str1
$str1 = 'タグは #1 #2 です';
echo "$str1\n";
var_dump( extract_tag_arr($str1) ); // -> `1`と`2`が得られる
// str2
$str2 = 'タグは #1 #2 です';
echo "$str2\n";
var_dump( extract_tag_arr($str2) ); // -> `1`と`2`が得られる
// $str3
$str3 = 'タグは #1\20001#2 です';
echo "$str3\n";
var_dump( extract_tag_arr($str3) ); // -> `1\\20001#2`が得られてしまう
// $str からタグ配列を得る
function extract_tag_arr($str){
// タグ抽出のために、特殊な空白文字を半角スペースへ変換
$str = replace_to_space($str);
// タグ抽出
$tag_arr = [];
//preg_match_all('['.PAT_TAG.']' , $str, $ms);
preg_match_all('/'.PAT_TAG.'/u' , $str, $ms);
foreach ( $ms[0] as $m ) {
//$tag_arr[] = ltrim(trim($m), '#');
$tag_arr[] = preg_replace('/\A[\p{Cc}\p{Cf}\p{Z}]++|[\p{Cc}\p{Cf}\p{Z}]++\z/u', '', $m);
}
return $tag_arr;
}
// 特殊な空白文字を半角スペースへ変換
function replace_to_space($str){
$encoded = json_encode($str);
$table = [
'\u2000'=>' ', '\u2001'=>' ', '\u2002'=>' ', '\u2003'=>' ', '\u2004'=>' ', '\u2005'=>' ', '\u2006'=>' ', '\u2007'=>' ', '\u2008'=>' ', '\u2009'=>' '
,'\u200A'=>' '
,'\u00a0'=>' '
];
$search = array_keys($table);
$replace = array_values($table);
return str_replace($search,$replace,$encoded);
}
preferences:
65.63 ms | 402 KiB | 5 Q