02-11-2007, 11:04
|
|
|
|
חבר מתאריך: 02.10.05
הודעות: 2,355
|
|
מה שאני מכין מורכב יותר מאנגלית ועברית, צריך להיות משהו כמו 27 שפות, אז אני חושב שלהריץ 27 ביטויים רגולארים, זה רעיון גרוע.
לכל המעוניינים, הנה רשימת הטווחים:
http://www.unicode.org/Public/UNIDATA/Blocks.txt
עכשיו אני צריך לחרוש עליה..
לגבי להפוך את התווים למספרים, מצאתי את זה באתר של php
מה לגבי זה?:
קוד PHP:
<?php
function ordUTF8($c, $index = 0, &$bytes = null) { $len = strlen($c); $bytes = 0;
if ($index >= $len) return false;
$h = ord($c{$index});
if ($h <= 0x7F) { $bytes = 1; return $h; } else if ($h < 0xC2) return false; else if ($h <= 0xDF && $index < $len - 1) { $bytes = 2; return ($h & 0x1F) << 6 | (ord($c{$index + 1}) & 0x3F); } else if ($h <= 0xEF && $index < $len - 2) { $bytes = 3; return ($h & 0x0F) << 12 | (ord($c{$index + 1}) & 0x3F) << 6 | (ord($c{$index + 2}) & 0x3F); } else if ($h <= 0xF4 && $index < $len - 3) { $bytes = 4; return ($h & 0x0F) << 18 | (ord($c{$index + 1}) & 0x3F) << 12 | (ord($c{$index + 2}) & 0x3F) << 6 | (ord($c{$index + 3}) & 0x3F); } else return false; }
?>
חשוב שזה יעבוד בהרבה שפות
_____________________________________
נערך לאחרונה ע"י tnadav1 בתאריך 02-11-2007 בשעה 11:20.
|