XML مخفف زبان نشانه‌گذاری قابل گسترش می‌باشد. این زبان یک زبان نشانه‌گذاری جدید است که توسط کنسرسیوم وب برای غلبه بر محدودیتهای زبان HTML بوجود آمده است. کنسرسیوم وب سازمانی است که مسئول نگهداری استاندارهای موجود در زمینه وب می‌باشد که از مهمترین این استاندارها می‌توان به HTML اشاره کرد.

XML زیر مجموعه ساده شده‌ای از زبان SGML می‌باشد. SGML یک زبان عمومی و پیچیده برای نشانه‌گذاری داده‌هاست که در دهه 80 بوجود آمد و پدر زبانهای نشانه‌گذاری محسوب می‌شود. قابلیتهای زیاد این زبان آن را بیش از اندازه پیچیده کرده است بطوری که کنسرسیوم وب آن را بعنوان جانشین HTML مناسب ندانسته و تصمیم گرفت زیر مجموعه ساده شده‌ای از آن را با نام XML جانشین HTML کند. XML را در واقع یک ابر زبان نامیده میشود چرا که کاربر بسته به نیازهایی که دارد می‌تواند با استفاده از آن زبان نشانه‌گذاری جدیدی برای نشانه‌گذاری داده‌هایش ایجاد کند.

XML همچنین قادر است ساختار داده‌های ذخیره شده را نیز بهمراه معنای آنها حفظ کند. این زبان دارای هیچ برچسب از پیش تعریف شده‌‌ای نیست و تمامی برچسب‌ها برحسب نیاز توسط کاربر تعریف می‌شوند. قابلیتهای XML و اجزاء همراه آن، این زبان را به زبان قابل حمل و استاندارد برای کاربردهای مختلف تبدیل کرده است.

فایلهای XML دارای قابلیت متنی هستند طوری که می‌توان آنها را در ویرایشگرهای متنی ویرایش کرد. یک فایل در XML از دو قسمت متن و علائم نشانه گذاری تشکیل شده است که قسمت متن آن داده‌های اصلی ذخیره شده و علائم نشانه‌گذاری و ابرداده‌ توصیف کننده متن را در بر دارد. XML از یک سو با ذخیره فایلهایش در قالب متنی و استفاده از علائم نشانه‌گذاری‏ فهم معنای داده‌های ذخیره شده را برای انسان ممکن می‌سازد و از سوی دیگر با در اختیار قرار دادن این فایلها در یک قالب ساختیافته برای برنامه‌ها، پردازش آن را برای کامپیوتر ساده می‌کند.

جزء اصلی تشکیل دهنده XML ، عنصر نام دارد که شامل نام و محتوی می‌باشد. محتوای یک عنصر بین دو علامت نشانه‌گذاری خاص با نامهای برچسب شروع و برچسب پایان محصور می‌شود. روش برچسب‌گذاری XML همانند HTML است که در اصل HTML و XML این روش را از SGML به ارث برده‌اند.

باید توجه داشت که کاراکترها در یک فایل XML مطابق استاندارد Unicode 2 می‌باشند و بنابراین فایلهای XML قادر به نمایش کاراکترهای تمام زبانهای زنده دنیا می‌باشند که این یکی از مزایای XML برای کاربردهای مبادله داده می‌باشد. البته به این دلیل که کاراکترها در استاندارد Unicode به صورت دوبایتی کد می‌شوند می‌توان برای جلوگیری از افزایش حجم فایلهای XMl آنها را با استفاده از استانداردهای دیگر مانند ISO 8859-1 , UTF-8 که اولی مخصوص کاراکترهای انگلیسی و دیگری مخصوص کاراکترهای لاتین است، نیز کد کرد.

(بر گرفته از سایت برنامه نویس)
پس از ایجاد XML توسط كنسرسیوم وب جهان‌شمول در سال ۱۹۹۶ دست‌اندركاران بسیاری از پروژه‌های محاسبات گسترده به آن روی آورده‌اند.
به عنوان نمونه، تقریباً تمامی فناوری‌های خدمات وب، گرافیك برداری مقیاس‌پذیری، RDF و بسیاری از موارد دیگر تنها با XML انجام‌پذیر است. بر خلاف سندهای HTML و XHTML كه در آنها از عناصر و بر چسب‌های از پیش تعبیه‌یافته استفاده می‌كنیم، در سندهای XML تمامی بر چسب‌ها را خود نامگذاری و انتخاب می‌كنیم. اگر چه برچسب‌های متعددی می‌تواند در هر سند موجود باشد، فقط یكی از آنها نقش ریشه و در خود گیرنده سایر برچسب‌ها را بر عهده دارد.
XML به دو دلیل استاندارد می‌شود:
۱. تمام News Feederها (تغذیه‌كننده‌های خبری) با زبان رسمی XML كار می‌كنند. این News Feederها به RSS معروفند.
۲. XML به زبان جهانی فرمت‌های چاپ تبدیل می‌شود (CIP۳).
● چگونه می‌توان XML ر ا بكار برد؟
با XML می‌توان:
▪ داده‌ها را خارج از HTML ذخیره كرد
▪ داده‌ها را بین دو سیستم ناهمسان مبادله كرد
▪ اطلاعات مالی را از طریق اینترنت مبادله كرد
▪ فایل‌های متن ساده را برای به اشتراك گذاشتن داده‌ها به كار برد
▪ فایلهای متن ساده را برای ذخیره داده‌ها به كار گرفت
▪ داده‌ها را در دسترس كاربران بیشتری قرار داد
▪ زبانهای جدید طراحی كرد
▪ داده‌های برنامه‌نویسان را از طریق اینترنت مبادله كرد
● باز هم در این باره كه XML چیست؟
▪ علائم اختصاری برای زبان نشانه‌گذاری قابل گسترش
▪ زبانی شبیه HTML
▪ طراحی شده برای توصیف داده‌ها
▪ تگ‌های از پیش تعریف شده ندارد
▪ از نوع سند یا شمای XML برای تعریف داده‌ها استفاده می‌كند
▪ برای برنامه‌نویسی تحت وب توصیه می‌شود.