מהו טקסט ASCII וכיצד משתמשים בו?

מהו טקסט ASCII וכיצד משתמשים בו?

ASCII הוא ראשי תיבות שאולי שמעתם ביחס לטקסט במחשב, אבל זה מונח שיוצא במהירות משימוש בזכות עולה חדש יותר. אבל מהו ASCII, ולמה הוא משמש?





למה ASCII מייצג?

אולי המקום הקל ביותר להתחיל הוא ראשי התיבות עצמם, אז בואו נרחיב אותו:





ל מריקני ס tandard ג אודה עבור אני מידע אני החלפה





הפה הזה של ביטוי לא באמת נותן את התמונה השלמה, אבל חלקים מסוימים מציעים מיד כמה רמזים, בעיקר שתי המילים הראשונות. ASCII הוא תקן אמריקאי, שמשמעותו תתברר בקרוב.

קוד להחלפת מידע מציע שאנחנו מדברים על פורמט להעברת נתונים הלוך ושוב. באופן ספציפי, ASCII עוסק בנתונים טקסטואליים: תווים המרכיבים מילים בשפה בדרך כלל קריאה אנושית.



ASCII פותר את הבעיה כיצד להקצות ערכים לאותיות ולדמויות אחרות כך שכאשר הם מאוחסנים כאחד ואפס בקובץ, ניתן לתרגם אותם בחזרה לאותיות כאשר הקובץ נקרא מאוחר יותר. אם מערכות מחשב שונות מסכימות על אותו קוד לשימוש, ניתן להחליף מידע כזה באופן אמין.

כיצד לנהל כבל שולחן

קָשׁוּר: כיצד למצוא סמלים ולחפש את משמעויותיהם





ההיסטוריה של ASCII

לפעמים המכונה US-ASCII, ASCII היה חידוש אמריקאי שפותח בשנות השישים. התקן עבר שינויים רבים מאז, בעיקר בשנים 1977 ו -1986, כאשר עודכנה לאחרונה ASCII.

הרחבות וריאציות נבנו על ASCII לאורך השנים, בעיקר כדי לספק את העובדה ש- ASCII משמיט תווים רבים המשמשים, או אפילו נדרשים, שפות שאינן אנגלית אמריקאית. ASCII אפילו לא מספק את סמל המטבע הבריטי (£), למרות שהלירה קיימת בלטינית -1, הרחבה של 8 סיביות שפותחה בשנות השמונים, המקודדת גם למספר מטבעות אחרים.





ASCII הורחב מאוד והצליח על ידי Unicode, תקן מקיף ושאפתני הרבה יותר, אשר יידון להלן. בשנת 2008 עקפה יוניקוד את הפופולריות של ASCII לשימוש מקוון.

אילו דמויות מייצג ASCII?

למחשב, האות א 'לא מוכרת בדיוק כמו הצבע הסגול או תחושת הקנאה. מחשבים עוסקים באפסים ובאפסים, ובאדם להחליט כיצד להשתמש באותם ובאפסים לייצוג מספרים, מילים, תמונות וכל דבר אחר.

אתה יכול לחשוב על ASCII כקוד המורס של העולם הדיגיטלי - הניסיון הראשון, בכל מקרה. בעוד קוד מורס משמש לייצוג 36 תווים שונים בלבד (26 אותיות ו -10 ספרות), ASCII תוכנן לייצג עד 128 תווים שונים ב -7 סיביות נתונים.

ASCII הוא תלוי-רישיות, כלומר מייצג 52 אותיות גדולות וקטנות מהאלף-בית האנגלי. לצד אותן 10 ספרות, זה בערך מחצית השטח המשמש.

פיסוק, סמלים מתמטיים וטיפוגרפיים תופסים את היתר, ואוסף של תווי שליטה, שהם קודים מיוחדים שאינם ניתנים להדפסה עם משמעויות פונקציונאליות-ראה להלן עוד.

להלן מספר תווים אופייניים ש- ASCII מקודד:

בינארינקודהאופי
010 000133!
011 0000480
011 1001579
011 101159;
100 000165ל
100 001066ב
101 101090עם
101 101191[
110 000197ל
110 001098ב
111 1101125}

שים לב שלערכים שנבחרו יש כמה תכונות שימושיות, בפרט:

  • תמיד ניתן למיין אותיות של אותו מקרה מספרית מכיוון שהן בסדר. לדוגמה, ל- A יש ערך נמוך יותר מ- B, בעל ערך נמוך יותר מ- Z.
  • אותיות של מקרים שונים מתקזזות על ידי 32 בדיוק. הדבר מקל מאוד על התרגום בין אותיות קטנות לגדולות מכיוון שצריך להחליף סיבית אחת לכל אות, בכל מקרה.

שליטה בדמויות

מלבד אותיות, סימני פיסוק וספרות, ASCII יכול לייצג מספר תווי שליטה, נקודות קוד מיוחדות שאינן מייצרות פלט של תו יחיד אלא מספקות משמעויות חלופיות לגבי הנתונים לכל מה שעשוי לצרוך אותו.

למה האייפון שלי אומר שלא נמצא מיקום?

לדוגמה, ASCII 000 1001 הוא תו הכרטיסייה האופקית. הוא מייצג את המרחב שתקבל בעת לחיצה על מקש TAB. בדרך כלל לא תראה תווים כאלה ישירות, אך לעתים קרובות יוצג השפעתם. להלן מספר דוגמאות נוספות:

בינארינקודהאופי
000 10019כרטיסייה אופקית
000 101010הזנת שורה
001 01112. 3סוף בלוק השידור

מה עם דמויות אחרות?

ASCII הצליח מאוד בימי המחשוב הראשונים מכיוון שהיה פשוט ומאומץ באופן נרחב. עם זאת, בעולם עם השקפה בינלאומית יותר, מערכת כתיבה אחת פשוט לא תפסיק אותה. התקשורת המודרנית צריכה להיות אפשרית בצרפתית, יפנית - למעשה, בכל שפה שתרצה לאחסן בה טקסט.

מערך התווים של Unicode יכול להתייחס לסך של 1,112,064 תווים שונים, אם כי רק כעשירית מהם מוגדרים למעשה כיום. זה אולי ישמע הרבה, אבל הקידוד נועד לא רק לספק עשרות אלפי תווים סיניים, הוא מכסה גם אמוג'י (כמעט אלף וחצי) ואפילו מערכות כתיבה שנכחדו כמו יורצ'ן.

קָשׁוּר: 100 האמוג'ים הפופולריים ביותר שמוסברים

יוניקוד הכירה בדומיננטיות של ASCII בבחירה של 128 התווים הראשונים: הם זהים לחלוטין ל- ASCII. זה מאפשר להשתמש בקבצים המקודדים ASCII במצבים בהם צפוי Unicode, ומספק תאימות לאחור.

סיכום

הטקסט ASCII מייצג את 26 האותיות של האלף בית האנגלי, עם ספרות, סימני פיסוק וכמה סמלים אחרים.

כעת הוא הוחלף על ידי Unicode, התומך במספר עצום של שפות וסמלים אחרים, כולל אמוג'י. UTF-8 הוא, לכל מטרה מעשית, הקידוד שיש להשתמש בו לייצוג תווים של Unicode ברשת.

לַחֲלוֹק לַחֲלוֹק צִיוּץ אימייל האם כדאי לשדרג ל- Windows 11?

Windows עוצב מחדש. אבל האם זה מספיק כדי לשכנע אותך לעבור מ- Windows 10 ל- Windows 11?

כיצד למחוק הכל מכונן קשיח למעט מערכת ההפעלה
קרא הבא נושאים קשורים
  • הסבר על הטכנולוגיה
  • ז'רגון
  • תרבות אינטרנט
  • Unicode
על הסופר בובי ג'ק(58 מאמרים פורסמו)

בובי הוא חובב טכנולוגיה שעבד כמפתח תוכנה במשך רוב שני העשורים. הוא נלהב משחקים, עובד כעורך ביקורות במגזין Switch Player, והוא שקוע בכל ההיבטים של פרסום באינטרנט ופיתוח אתרים.

עוד מאת בובי ג'ק

הירשם לניוזלטר שלנו

הצטרף לניוזלטר שלנו לקבלת טיפים, סקירות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!

לחצו כאן להרשמה