صفحه نخست » مقالات » برنامه نویسی » آموزش HTML » رمزگذاری کاراکترها در HTML

رمزگذاری کاراکترها در HTML

دسته بندی : آموزش HTML سطح مقاله : متوسط زمان مطالعه : 2 دقیقه 01 آذر 1399
رمزگذاری کاراکترها در HTML

رمزگذاری کاراکترها در HTML از نمایش مرورگرهای خاص توسط مرورگر جلوگیری می کند.

درک رمزگذاری کاراکترها در HTML

نیاز به رمزگذاری کاراکترها از تعداد زیادی شخصیت موجود است. به غیر از حروف لاتین معمول و اعداد عربی ، حروف الفبا ، علائم ریاضی و سایر حروف خاص نیز وجود دارد. با این حال ، اسنادی که رمزگذاری های مختلف HTML تعریف شده اند ، می توانند آن ها را متفاوت نمایش دهند.

یک متن تفسیر نادرست منجر به موضوعات مختلفی می شود:

  • کاربران نمی توانند متن را به درستی بخوانند.
  • موتورهای جستجو نمی توانند داده ها را پیدا کنند.
  • ماشین ها نمی توانند اطلاعات را پردازش کنند.

همه نویسه های موجود در مجموعه های خاصی گروه بندی می شوند (که به اختصار به آنها charsets نیز گفته می شود). با تعریف رمزگذاری HTML ، به مرورگر اجازه می دهید تا به مجموعه خاصی دسترسی پیدا کند و نویسه های آن را به درستی نمایش دهد.

توجه: ژاپنی ها حتی یک اصطلاح خاص برای یک دسته از شخصیت های ضعیف تفسیر شده دارند – موجیبک (文字 化 け)

ASCII: اصلی ترین مجموعه

اولین و ساده ترین رمزگذاری کاراکترهای HTML را ASCII می نامند. اکثر مجموعه های مدرن از آن به عنوان پایه استاندارد استفاده می کنند.

ASCII مخفف کد استاندارد آمریکا برای تبادل اطلاعات است. در اوایل دهه 1960 از طریق کد تلگرافی ساخته شده است و شامل 128 حرف است که 95 مورد قابل چاپ هستند:

  • حروف لاتین کوچک
  • حروف بزرگ لاتین
  • علائم علائم نگارشی
  • اعداد از 0 تا 9

به 33 نویسه غیر قابل چاپ ، نویسه کنترل نیز گفته می شود. این نمادها شفاف هستند – به عنوان مثال ، نمادهایی که اجازه جدا کردن کلمات یا پاراگراف ها را می دهند.

با این حال ، محبوبیت ASCII با بین المللی شدن هرچه بیشتر اینترنت کاهش یافت. فقط پشتیبانی از حروف لاتین به سرعت کافی نبود.

 بهترین گزینه شما: UTF-8

Unicode استاندارد صنعتی است که برای سازگاری رمزگذاری کاراکتر استفاده می شود. این کتاب در اوایل دهه 1990 منتشر شد و دارای چند بخش از جمله UTF-8 ، UTF-16 و UTF-32 است.

UTF-8 مخفف Unicode Transform Format 8-bit است و از سال 2008 عنوان محبوب ترین رمزگذاری کاراکتر HTML را به خود اختصاص داده است. تا سال 2019 ، بیش از 90 درصد از کل وب سایت ها از UTF-8 استفاده می کنند. همچنین توصیه می شود به عنوان رمزگذار نویسه پیش فرض HTML توسط کنسرسیوم جهانی وب استفاده شود.

چندین دلیل قانع کننده برای استفاده از UTF-8 وجود دارد:

  • از بسیاری از زبان ها پشتیبانی می کند.
  • کاملاً با ASCII سازگار است.
  • بومی آن توسط XML استفاده می شود.
  • از فضای کمتری نسبت به سایر رمزگذاری های Unicode استفاده می کند.

برای اعلام UTF-8 به عنوان رمزگذاری کاراکتر HTML مورد نظر خود ، باید از تگ <meta> به همراه ویژگی charset و UTF-8 به عنوان مقدار آن استفاده کنید:

<meta charset = "UTF-8">

کدگذاری جایگزین HTML

شما می توانید یک تن کدگذاری جایگزین را در استاندارد زندگی رمزگذاری ایجاد شده توسط گروه کار فناوری برنامه کاربردی ابر متن (WHATWG) پیدا کنید. با این حال ، ما اکیداً به شما توصیه می کنیم که با UTF-8 همراه باشید ، زیرا سایر مجموعه ها شامل تعداد کمتری شخصیت هستند و این ممکن است در نمایش وب سایت شما مشکل ایجاد کند.

نکات مهم کدگذاری کاراکترها در HTML:

  • نمایش مناسب کاراکترهای شما نه تنها به کاراکتر بلکه به قلم انتخابی نیز بستگی دارد: همه آن ها نسخه هایی برای هر کاراکتر ندارند. اگر قلم انتخابی شما نماد مورد نیاز شما را نداشته باشد ، یا به جستجوی موارد با قلم های دیگر می پردازد یا یک کاراکتر دیگر (به عنوان مثال ، یک علامت سوال) را نشان می دهد.
  • فراموش نکنید که هنگام ذخیره سند خود نیز باید کدگذاری HTML را مشخص کنید.

دوره رایگان html را در دویکس دنبال کنید.

چه امتیازی به این مقاله می دید؟

5 / 0
[ 0 رای ]
مطالب مشابه

Related Posts