לוגו אתר Fresh          
 
 
  אפשרות תפריט  ראשי     אפשרות תפריט  צ'אט     אפשרות תפריט  מבזקים     אפשרות תפריט  צור קשר     חץ שמאלה ‎print ‎"Hello World!"; if‎ ‎not rules.‎know ‎then rules.‎read(); חץ ימינה  

לך אחורה   לובי הפורומים > מחשבים > תכנות ובניית אתרים
שמור לעצמך קישור לדף זה באתרי שמירת קישורים חברתיים
תגובה
 
כלי אשכול חפש באשכול זה



  #4  
ישן 02-11-2007, 11:04
צלמית המשתמש של tnadav1
  משתמש זכר tnadav1 tnadav1 אינו מחובר  
 
חבר מתאריך: 02.10.05
הודעות: 2,355
שלח הודעה דרך MSN אל tnadav1
בתגובה להודעה מספר 3 שנכתבה על ידי netaneldj שמתחילה ב "אני חושב שזה רעיון גרוע, אבל..."

מה שאני מכין מורכב יותר מאנגלית ועברית, צריך להיות משהו כמו 27 שפות, אז אני חושב שלהריץ 27 ביטויים רגולארים, זה רעיון גרוע.

לכל המעוניינים, הנה רשימת הטווחים:
http://www.unicode.org/Public/UNIDATA/Blocks.txt

עכשיו אני צריך לחרוש עליה..
לגבי להפוך את התווים למספרים, מצאתי את זה באתר של php
מה לגבי זה?:
קוד PHP:
<?php

function ordUTF8($c$index 0, &$bytes null)
{
  
$len strlen($c);
  
$bytes 0;

  if (
$index >= $len)
    return 
false;

  
$h ord($c{$index});

  if (
$h <= 0x7F) {
    
$bytes 1;
    return 
$h;
  }
  else if (
$h 0xC2)
    return 
false;
  else if (
$h <= 0xDF && $index $len 1) {
    
$bytes 2;
    return (
$h 0x1F) <<  | (ord($c{$index 1}) & 0x3F);
  }
  else if (
$h <= 0xEF && $index $len 2) {
    
$bytes 3;
    return (
$h 0x0F) << 12 | (ord($c{$index 1}) & 0x3F) << 6
                             
| (ord($c{$index 2}) & 0x3F);
  }           
  else if (
$h <= 0xF4 && $index $len 3) {
    
$bytes 4;
    return (
$h 0x0F) << 18 | (ord($c{$index 1}) & 0x3F) << 12
                             
| (ord($c{$index 2}) & 0x3F) << 6
                             
| (ord($c{$index 3}) & 0x3F);
  }
  else
    return 
false;
}

?>

חשוב שזה יעבוד בהרבה שפות
_____________________________________



נערך לאחרונה ע"י tnadav1 בתאריך 02-11-2007 בשעה 11:20.
תגובה ללא ציטוט תגובה עם ציטוט חזרה לפורום
  #6  
ישן 03-11-2007, 19:37
  DCD DCD אינו מחובר  
 
חבר מתאריך: 17.05.05
הודעות: 7,321
בתגובה להודעה מספר 5 שנכתבה על ידי tnadav1 שמתחילה ב "אחרי שבדקתי כל קוד אפשרי..."

יש הבדל בין יוניקוד לקידוד UTF-8.

יוניקוד זה צורה גלובאלית להגדרת תו מסויים. לכל תו יש קוד מצביע שהוא "תעודת הזהות" שלו.
הקידודים השונים, ביניהן UTF-8, מקודדים בצורה שונה את התוים. הם יכולים לשנות את הערך של הקוד מצביע לגמרי. ביוניקוד לאות א' יש קוד מצביע (הקסדצימלי) של 05D0, אך UTF-8 משנה את זה ל-D790.

ראה מידע נוסף כאן, כולל על האות א' (מתחת לטבלה):
http://en.wikipedia.org/wiki/UTF-8#Description

בהתאם תוכל לדעת איזה תו הוא בעברית ואיזה לא...

[עריכה]

ד"א אתה לא חייב לבודד כל תו בניפרד באמצעות הפונקציה שהצגת באשכול אחר, אלא אפשר להיעזר בביטוי רגולרי. אני לא בטוח איזה מהם יעיל יותר - הביטוי או דרך אחרת שאפשר להיעזר בה בפונקציה שהצגת. אבל בהחלט אפשר לבנות ביטוי רגולרי יעיל יחסית כמו:

קוד:
[\x0000-\x1111]{1}


(צינתי בביטוי תחום תוים החוזר פעם אחת (פעם אחת מספיקה...)

נערך לאחרונה ע"י DCD בתאריך 03-11-2007 בשעה 19:40.
תגובה ללא ציטוט תגובה עם ציטוט חזרה לפורום
תגובה

כלי אשכול חפש באשכול זה
חפש באשכול זה:

חיפוש מתקדם
מצבי תצוגה דרג אשכול זה
דרג אשכול זה:

מזער את תיבת המידע אפשרויות משלוח הודעות
אתה לא יכול לפתוח אשכולות חדשים
אתה לא יכול להגיב לאשכולות
אתה לא יכול לצרף קבצים
אתה לא יכול לערוך את ההודעות שלך

קוד vB פעיל
קוד [IMG] פעיל
קוד HTML כבוי
מעבר לפורום



כל הזמנים המוצגים בדף זה הם לפי איזור זמן GMT +2. השעה כעת היא 14:14

הדף נוצר ב 0.05 שניות עם 12 שאילתות

הפורום מבוסס על vBulletin, גירסא 3.0.6
כל הזכויות לתוכנת הפורומים שמורות © 2024 - 2000 לחברת Jelsoft Enterprises.
כל הזכויות שמורות ל Fresh.co.il ©

צור קשר | תקנון האתר