ภายในปี 1991 การใช้ SGML ถูกจำกัดอยู่เพียงโปรแกรมธุรกิจและฐานข้อมูล และเครื่องมือ WYSIWYG (ซึ่งจัดเก็บเอกสารในรูปแบบไบนารีที่เป็นกรรมสิทธิ์) ถูกนำมาใช้สำหรับโปรแกรมประมวลผลเอกสารอื่นๆ สถานการณ์เปลี่ยนไปเมื่อ Sir Tim Berners-Lee ได้เรียนรู้เกี่ยวกับ SGML จาก Anders Bergland เพื่อนร่วมงานของเขา แอนเดอร์ส เบิร์กลันด์) และผู้ร่วมงานคนอื่นๆ ที่ CERN ใช้ไวยากรณ์ SGML เพื่อสร้าง HTML ภาษามีความคล้ายคลึงกับภาษามาร์กอัปที่ใช้ไวยากรณ์ SGML อื่นๆ แต่เริ่มต้นได้ง่ายกว่ามาก แม้แต่สำหรับนักพัฒนาที่ไม่เคยทำมาก่อนก็ตาม Steven DeRose แย้งว่า HTML ที่ใช้มาร์กอัปเชิงอธิบาย (และโดยเฉพาะ SGML) เป็นปัจจัยสำคัญในการพัฒนาเว็บเนื่องจากได้รับการออกแบบให้มีความยืดหยุ่นและความสามารถในการขยายได้ (เช่นเดียวกับปัจจัยอื่น ๆ รวมถึงแนวคิดของ URL และการใช้งานฟรีโดยเบราว์เซอร์) . ปัจจุบัน HTML เป็นภาษามาร์กอัปที่น่าดึงดูดและใช้กันมากที่สุดในโลก
อย่างไรก็ตาม สถานะของ HTML ในฐานะภาษามาร์กอัปถูกโต้แย้งโดยนักวิทยาศาสตร์คอมพิวเตอร์บางคน ข้อโต้แย้งหลักของพวกเขาคือ HTML จำกัดตำแหน่งของแท็ก โดยกำหนดให้ทั้งสองแท็กซ้อนกันภายในแท็กอื่นหรือภายในแท็กหลักของเอกสาร ด้วยเหตุนี้ นักวิชาการเหล่านี้จึงถือว่า HTML เป็นภาษาคอนเทนเนอร์ที่เป็นไปตามโมเดลแบบลำดับชั้น
XML
XML (Extensible Markup Language) เป็นภาษาเมตามาร์กอัปที่ใช้กันอย่างแพร่หลายในปัจจุบัน XML ได้รับการพัฒนาโดย World Wide Web Consortium ในคณะกรรมการที่นำโดย Jon Bosak วัตถุประสงค์หลักของ XML คือเพื่อให้ง่ายกว่า SGML และมุ่งเน้นไปที่ปัญหาเฉพาะ - เอกสารบนอินเทอร์เน็ต XML เป็นภาษาเมตาเช่น SGML ผู้ใช้สามารถสร้างแท็กใดๆ ที่พวกเขาต้องการได้ (ดังนั้นจึง "ขยายได้") การเพิ่มขึ้นของ XML ได้รับการช่วยเหลือเนื่องจากเอกสาร XML ทุกฉบับสามารถเขียนได้ในลักษณะเดียวกับเอกสาร SGML และโปรแกรมและผู้ใช้ที่ใช้ SGML สามารถโยกย้ายไปยัง XML ได้อย่างง่ายดาย
XML ได้รับการออกแบบมาเพื่อสภาพแวดล้อมแบบกึ่งโครงสร้างเป็นหลัก เช่น เอกสารและสิ่งพิมพ์ อย่างไรก็ตาม มันเป็นสื่อกลางที่น่าพึงพอใจระหว่างความยืดหยุ่นและความเรียบง่าย และผู้ใช้จำนวนมากก็นำไปใช้อย่างรวดเร็ว ขณะนี้ XML ถูกนำมาใช้กันอย่างแพร่หลายในการถ่ายโอนข้อมูลระหว่างโปรแกรม เช่นเดียวกับ HTML มันสามารถกำหนดลักษณะเป็นภาษา "คอนเทนเนอร์" ได้
XHTML
เริ่มตั้งแต่เดือนมกราคม พ.ศ. 2543 คำแนะนำ W3C ทั้งหมดอิงตาม XML แทนที่จะเป็น SGML และเสนอตัวย่อ XHTML (Extensible HyperText Markup Languge) ข้อกำหนดด้านภาษากำหนดให้เอกสาร XHTML ต้องได้รับการจัดรูปแบบเป็นเอกสาร XML ซึ่งช่วยให้สามารถใช้ XHTML สำหรับเอกสารที่ชัดเจนและแม่นยำยิ่งขึ้นโดยใช้แท็กจาก HTML
ความแตกต่างที่น่าสังเกตที่สุดประการหนึ่งระหว่าง HTML และ XHTML คือกฎที่ต้องปิดแท็กทั้งหมด เช่น แท็กว่าง เป็นต้น<พี่ชาย/> ทั้งคู่ต้องปิดด้วยแท็กปิดมาตรฐานหรือรายการพิเศษ:<พี่ชาย/> (ช่องว่างก่อน "/" ในแท็กปิดเป็นทางเลือก แต่มักใช้เนื่องจากเบราว์เซอร์ก่อน XML และโปรแกรมแยกวิเคราะห์ SGML บางตัวใช้ช่องว่างนี้) คุณลักษณะอื่นๆ ในแท็กจะต้องอยู่ในเครื่องหมายคำพูด สุดท้ายนี้ ชื่อแท็กและแอตทริบิวต์ทั้งหมดจะต้องเขียนด้วยตัวพิมพ์เล็กเพื่อให้อ่านได้อย่างถูกต้อง HTML ไม่คำนึงถึงขนาดตัวพิมพ์
การพัฒนาอื่น ๆ ที่ใช้ XML
ขณะนี้มีการใช้งานการพัฒนาที่ใช้ XML จำนวนมาก เช่น RDF (Resource Description Framework), XFORMS, DocBook, SOAP และ OWL (Ontology Web Language)
HTML (จากภาษาอังกฤษ) ภาษามาร์กอัปไฮเปอร์เท็กซ์-- "ภาษามาร์กอัปไฮเปอร์เท็กซ์") - พัฒนาโดยนักวิทยาศาสตร์ชาวอังกฤษ Tim Berners-Lee ประมาณปี 1986-1991 ที่ศูนย์วิจัยนิวเคลียร์แห่งยุโรปในเมืองเจนีวา (สวิตเซอร์แลนด์) HTML ถูกสร้างขึ้นเป็นภาษาสำหรับการแลกเปลี่ยนเอกสารทางวิทยาศาสตร์และทางเทคนิค เหมาะสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญในด้านการจัดวาง HTML ประสบความสำเร็จในการจัดการกับความซับซ้อนของ SGML โดยการกำหนดชุดเล็กๆ ขององค์ประกอบโครงสร้างและความหมายที่เรียกว่า descriptors ตัวอธิบายมักเรียกว่า "แท็ก" เมื่อใช้ HTML คุณสามารถสร้างเอกสารที่ค่อนข้างเรียบง่ายแต่ได้รับการออกแบบอย่างสวยงามได้อย่างง่ายดาย นอกเหนือจากการทำให้โครงสร้างเอกสารง่ายขึ้นแล้ว ยังมีการเพิ่มการรองรับไฮเปอร์เท็กซ์ใน HTML ความสามารถด้านมัลติมีเดียถูกเพิ่มเข้ามาในภายหลัง
ในขั้นต้น ภาษา HTML ได้รับการคิดและสร้างขึ้นเพื่อใช้เป็นวิธีการจัดโครงสร้างและการจัดรูปแบบเอกสารโดยไม่ต้องเชื่อมโยงกับเครื่องมือการทำซ้ำ (การแสดงผล) ตามหลักการแล้ว ข้อความที่มีมาร์กอัป HTML ควรได้รับการทำซ้ำโดยไม่มีการบิดเบือนรูปแบบและโครงสร้างบนอุปกรณ์ที่มีอุปกรณ์ทางเทคนิคที่แตกต่างกัน (หน้าจอสีของคอมพิวเตอร์สมัยใหม่ หน้าจอขาวดำของผู้จัดงาน หน้าจอขนาดจำกัดของโทรศัพท์มือถือหรืออุปกรณ์ และโปรแกรมสำหรับเสียง การเล่นข้อความ) อย่างไรก็ตาม การใช้ HTML สมัยใหม่ยังห่างไกลจากจุดประสงค์เดิมมาก ตัวอย่างเช่น แท็ก
ซึ่งใช้หลายครั้งในการจัดรูปแบบหน้า มีวัตถุประสงค์เพื่อสร้างตารางทั่วไปในเอกสาร ในช่วงหลายปีที่ผ่านมา แนวคิดหลักของความเป็นอิสระของแพลตฟอร์ม HTML ได้รับการเสียสละเพื่อสนับสนุนความต้องการด้านมัลติมีเดียและกราฟิกสมัยใหม่
XML(ภาษาอังกฤษ) จเอ็กซ์ตึงเครียดมอาร์คอัพลแองเกจ-- ภาษามาร์กอัปที่ขยายได้ เด่นชัด [ อดีต em-eml]) เป็นภาษามาร์กอัปที่แนะนำโดย World Wide Web Consortium (W3C) ข้อมูลจำเพาะ XML อธิบายเอกสาร XML และอธิบายลักษณะการทำงานของตัวประมวลผล XML บางส่วน (โปรแกรมที่อ่านเอกสาร XML และให้การเข้าถึงเนื้อหา) XML ได้รับการออกแบบให้เป็นภาษาที่มีไวยากรณ์อย่างเป็นทางการที่เรียบง่าย สะดวกสำหรับการสร้างและประมวลผลเอกสารโดยโปรแกรม และในขณะเดียวกันก็สะดวกสำหรับมนุษย์ในการอ่านและสร้างเอกสาร โดยเน้นการใช้งานบนอินเทอร์เน็ต ภาษานี้เรียกว่าขยายได้เนื่องจากไม่ได้แก้ไขมาร์กอัปที่ใช้ในเอกสาร นักพัฒนามีอิสระในการสร้างมาร์กอัปตามความต้องการของโดเมนเฉพาะ ซึ่งจำกัดโดยกฎวากยสัมพันธ์ของภาษาเท่านั้น การรวมกันของไวยากรณ์อย่างเป็นทางการที่เรียบง่าย ความเป็นมิตรต่อมนุษย์ ความสามารถในการขยาย รวมถึงการใช้การเข้ารหัส Unicode เพื่อแสดงเนื้อหาของเอกสาร ได้นำไปสู่การใช้ทั้ง XML เองและภาษาเฉพาะทางอนุพันธ์จำนวนมากที่ใช้ XML ในวงกว้าง ซอฟต์แวร์ที่หลากหลาย
XHTML(ภาษาอังกฤษ) อีxตึงเครียดชมใช่แล้วทีต่อมอาร์คอัพลแองเกจ-- Extensible Hypertext Markup Language) เป็นตระกูลภาษามาร์กอัปหน้าเว็บที่ใช้ XML ซึ่งจำลองและขยายขีดความสามารถของ HTML 4 ข้อกำหนด XHTML 1.0 และ XHTML 1.1 เป็นคำแนะนำของ World Wide Web Consortium แต่การพัฒนานั้น ขณะนี้หยุดด้วยคำแนะนำให้ใช้ HTML XHTML เวอร์ชันใหม่ยังไม่ออก
ความแตกต่างที่สำคัญระหว่าง XHTML และ HTML คือวิธีการประมวลผลเอกสาร เอกสาร XHTML ได้รับการประมวลผลโดยโมดูลของตัวเอง (ตัวแยกวิเคราะห์) ในลักษณะเดียวกับเอกสาร XML ในระหว่างการประมวลผลนี้ ข้อผิดพลาดที่เกิดจากนักพัฒนาจะไม่ได้รับการแก้ไข
XHTML เป็นไปตามข้อกำหนด SGML เนื่องจาก XML เป็นส่วนย่อยของมัน HTML มีคุณสมบัติมากมายในกระบวนการประมวลผล และจริงๆ แล้วไม่ได้อยู่ในตระกูล SGML ซึ่งประดิษฐานอยู่ในข้อกำหนด HTML 5 แบบร่าง
โดยทั่วไปแล้ว มันเป็นความนิยมอย่างไม่น่าเชื่อของเวิลด์ไวด์เว็บและส่วนสำคัญของ HTML ซึ่งกลายเป็นสาเหตุของความสนใจที่เพิ่มขึ้นอย่างมากต่อโครงสร้างของมาร์กอัปไฮเปอร์เท็กซ์ของเอกสาร
แนวคิดเรื่องไฮเปอร์เท็กซ์ถูกนำมาใช้ครั้งแรกโดย V. Bush ย้อนกลับไปในปี 1945 อย่างไรก็ตาม แอปพลิเคชันจริงที่ใช้โครงสร้างข้อมูลดังกล่าวเริ่มถูกนำมาใช้ตั้งแต่ทศวรรษที่ 60 เท่านั้น และกิจกรรมที่เพิ่มขึ้นอย่างรวดเร็วรอบ ๆ เทคโนโลยีนี้เริ่มต้นเมื่อมีความต้องการที่แท้จริงสำหรับกลไกในการรวมทรัพยากรข้อมูลหลาย ๆ อย่างเข้าด้วยกัน โดยให้ความสามารถในการสร้างและ ดูข้อความที่ไม่ใช่เชิงเส้น และตัวอย่างของการนำกลไกนี้ไปใช้ก็คือ WWW เดียวกัน
ข้อเสียเปรียบที่สำคัญอีกประการหนึ่งของแนวคิดนี้ซึ่งนำไปใช้ใน HTML ก็คือชุดแท็กที่จำกัด กฎ DTD สำหรับ HTML กำหนดชุดคำอธิบายที่ตายตัว ดังนั้นนักพัฒนาจึงไม่มีโอกาสป้อนแท็กพิเศษของตนเอง แม้ว่าส่วนขยายภาษาใหม่จะปรากฏขึ้นเป็นครั้งคราว (ปัจจุบัน HTML เวอร์ชันล่าสุดคือ HTML 4.0) เส้นทางที่ยาวไกลไปสู่มาตรฐานของพวกเขาพร้อมกับความขัดแย้งอย่างต่อเนื่องระหว่างผู้ผลิตเบราว์เซอร์หลักทำให้แทบเป็นไปไม่ได้เลยที่จะปรับภาษาอย่างรวดเร็ว การใช้งาน สำหรับแสดงข้อมูลเฉพาะทาง (เช่น มัลติมีเดีย คณิตศาสตร์ สูตรเคมี ฯลฯ)
เพื่อสรุปทั้งหมดที่กล่าวมา อาจเป็นที่ถกเถียงกันอยู่ว่าปัจจุบัน HTML ไม่ตรงตามข้อกำหนดที่กำหนดโดยนักพัฒนาสมัยใหม่สำหรับภาษาประเภทนี้อย่างสมบูรณ์ และถูกแทนที่ด้วยภาษามาร์กอัปไฮเปอร์เท็กซ์ใหม่: ทรงพลัง ยืดหยุ่น และในขณะเดียวกันก็เป็นภาษา XML ที่สะดวกสบาย
XML (Extensible Markup Language) เป็นภาษามาร์กอัปที่อธิบายออบเจ็กต์ข้อมูลทั้งหมดที่เรียกว่าเอกสาร XML ภาษานี้ใช้เป็นวิธีอธิบายไวยากรณ์ของภาษาอื่นและควบคุมความถูกต้องของเอกสาร เหล่านั้น. XML เองไม่มีแท็กใดๆ ที่มีไว้สำหรับมาร์กอัป เพียงกำหนดลำดับที่สร้างขึ้น ตัวอย่างเช่น ถ้าเราคิดว่าเราควรใช้แท็กเพื่อระบุองค์ประกอบดอกกุหลาบในเอกสาร จากนั้น XML ช่วยให้เราใช้แท็กที่เรากำหนดได้อย่างอิสระ และเราสามารถรวมส่วนต่างๆ ดังต่อไปนี้ในเอกสารได้:
นอกจากนี้ ข้อดีประการหนึ่งของ XML ก็คือโปรแกรมประมวลผลเอกสาร XML นั้นเรียบง่าย และปัจจุบันผลิตภัณฑ์ซอฟต์แวร์ทุกประเภทที่ออกแบบมาเพื่อทำงานกับเอกสาร XML ได้รับการเผยแพร่อย่างอิสระ ปัจจุบันรองรับ XML ในทุกเบราว์เซอร์ของตระกูล Microsoft Internet Explorer โดยเริ่มตั้งแต่เวอร์ชัน 4.0 มีการประกาศว่าจะได้รับการสนับสนุนในแอปพลิเคชัน Netscape Communicator, Oracle DBMS, DB-2 และ MS-Office เวอร์ชันต่อๆ ไป ทั้งหมดนี้ให้เหตุผลให้สันนิษฐานว่าในอนาคตอันใกล้นี้ XML จะกลายเป็นภาษาแลกเปลี่ยนข้อมูลหลักสำหรับระบบข้อมูลซึ่งแทนที่ HTML ภาษามาร์กอัปเฉพาะที่รู้จักกันดีเช่น SMIL, CDF, MathML, XSL ได้ถูกสร้างขึ้นแล้วบนพื้นฐานของ XML และรายการแบบร่างการทำงานของภาษาใหม่ภายใต้การพิจารณาของ W3C มีการเติบโตอย่างต่อเนื่อง
เอกสาร XML มีลักษณะอย่างไร
หากคุณคุ้นเคยกับ HTML การเรียนรู้ XML จะไม่ต้องใช้ความพยายามมากนัก แม้ว่า XML จะมีความแตกต่างอย่างมากในด้านความสามารถและจุดประสงค์จาก HyperText Markup Language แต่ทั้งสองภาษาเป็นส่วนย่อยของ SGML และดังนั้นจึงสืบทอดหลักการพื้นฐานของมัน
โครงสร้างเอกสาร
เอกสาร XML แบบธรรมดาอาจมีลักษณะเหมือนตัวอย่างที่ 1
อันดับแรก
ที่สอง ย่อหน้าย่อย 1
ที่สาม
ล่าสุด
โปรดทราบว่าเอกสารนี้คล้ายกับหน้า HTML ทั่วไปมาก เช่นเดียวกับใน HTML คำแนะนำที่อยู่ในวงเล็บมุมจะเรียกว่าแท็กและทำหน้าที่มาร์กอัปเนื้อหาของเอกสาร ใน XML มีแท็กเปิด ปิด และว่างเปล่า (ใน HTML แนวคิดของแท็กว่างเปล่าก็มีอยู่เช่นกัน แต่ไม่จำเป็นต้องกำหนดพิเศษ)
เนื้อความของเอกสาร XML ประกอบด้วยองค์ประกอบมาร์กอัปและเนื้อหาจริงของเอกสาร - ข้อมูล (เนื้อหา) แท็ก XML ได้รับการออกแบบมาเพื่อกำหนดองค์ประกอบของเอกสาร คุณลักษณะ และโครงสร้างภาษาอื่นๆ เราจะพูดถึงรายละเอียดเพิ่มเติมเกี่ยวกับประเภทของมาร์กอัปที่ใช้ในเอกสารในภายหลัง
เอกสาร XML ใดๆ จะต้องเริ่มต้นด้วยคำสั่งเสมอภายในซึ่งคุณสามารถตั้งค่าหมายเลขเวอร์ชันภาษา หมายเลขหน้าโค้ด และพารามิเตอร์อื่น ๆ ที่จำเป็นสำหรับโปรแกรมวิเคราะห์ในกระบวนการแยกวิเคราะห์เอกสาร
กฎสำหรับการสร้างเอกสาร XML
โดยทั่วไป เอกสาร XML จะต้องเป็นไปตามข้อกำหนดต่อไปนี้:
ส่วนหัวของเอกสารมีการประกาศ XML ที่ระบุภาษามาร์กอัปของเอกสาร หมายเลขเวอร์ชัน และข้อมูลเพิ่มเติม
แท็กเปิดแต่ละแท็กที่กำหนดพื้นที่ข้อมูลบางส่วนในเอกสารจะต้องมี "พันธมิตร" ปิดของตัวเอง กล่าวคือ ไม่สามารถละเว้นแท็กปิดได้ ซึ่งต่างจาก HTML
การซ้อนแท็กใน XML ได้รับการควบคุมอย่างเข้มงวด ดังนั้นจึงจำเป็นต้องตรวจสอบลำดับการเปิดและปิดแท็ก
ข้อมูลทั้งหมดระหว่างแท็กเริ่มต้นและแท็กสิ้นสุดจะถือเป็นข้อมูลใน XML ดังนั้นอักขระการจัดรูปแบบทั้งหมดจึงถูกนำมาพิจารณาด้วย (เช่น การเว้นวรรค ตัวแบ่งบรรทัด แท็บจะไม่ถูกละเว้นเช่นเดียวกับใน HTML)
หากเอกสาร XML ไม่ละเมิดกฎข้างต้น จะเรียกว่าถูกต้องอย่างเป็นทางการ และผู้วิเคราะห์ทั้งหมดที่ออกแบบมาเพื่อแยกวิเคราะห์เอกสาร XML จะสามารถทำงานได้อย่างถูกต้อง
อย่างไรก็ตาม นอกเหนือจากการตรวจสอบการปฏิบัติตามไวยากรณ์ของภาษาอย่างเป็นทางการแล้ว เอกสารอาจมีวิธีการควบคุมเนื้อหาของเอกสาร การปฏิบัติตามกฎที่กำหนดความสัมพันธ์ที่จำเป็นระหว่างองค์ประกอบและสร้างโครงสร้างของเอกสาร ตัวอย่างเช่น ข้อความต่อไปนี้ แม้ว่าจะเป็นเอกสาร XML ที่ถูกต้องสมบูรณ์ แต่ก็จะไม่มีความหมายโดยสิ้นเชิง:
รัสเซียโนโวซีบีสค์
เพื่อให้มั่นใจว่ามีการตรวจสอบความถูกต้องของเอกสาร XML จำเป็นต้องใช้เครื่องวิเคราะห์ที่ทำการตรวจสอบดังกล่าวและเรียกว่าเครื่องตรวจสอบ
ภาษา HTML เป็นแอปพลิเคชั่นภาษาเอสจีเอ็มแอล เพื่อใช้ในอินเทอร์เน็ต ด้วยโครงสร้างคงที่ ชุดองค์ประกอบคงที่ (ตัวอธิบาย) และคุณลักษณะ ตลอดจนชุดเอนทิตีคงที่ ภาษามาร์กอัปขั้นสูง XML (ภาษามาร์กอัปที่ขยายได้) ภาษาเอ็กซ์เอ็มแอล เป็นส่วนย่อยของภาษาเอสจีเอ็มแอล เข้ากันได้อย่างสมบูรณ์กับมัน
XML มีฟังก์ชันการทำงานที่หลากหลายซึ่งไม่มีในนั้น HTML
4
.
3
.2. เวอร์ชันและส่วนขยาย HTML XML
รุ่นแรก ภาษามาร์กอัปไฮเปอร์เท็กซ์ HTML (HyperText Markup Language) เช่นเดียวกับเทคโนโลยีเว็บ ได้รับการพัฒนาโดย Tim Berners Lee ในปี 1991 ภาษา HTMLเป็นการดำเนินการตามกฎภาษา SGML สำหรับประเภทเอกสารที่ได้รับการตั้งชื่อเอกสาร HTML. ภาษาระบุโครงสร้างคงที่ ชุดแท็กและคุณลักษณะคงที่ และชุดเอนทิตีคงที่ โปรแกรมประมวลผลเอกสาร HTML เรียกว่าเว็บ-เบราว์เซอร์ - ผลลัพธ์ของการประมวลผลเอกสารคือเว็บ-หน้าหนังสือ ปรากฏบนหน้าจอแสดงผล
ในปี 1994 กลุ่มสนับสนุนอินเทอร์เน็ต IETF (คณะทำงานเฉพาะกิจวิศวกรรมอินเทอร์เน็ต) พัฒนาข้อกำหนด HTML 2.0 ซึ่งเริ่มใช้ HTML อย่างแพร่หลายบนอินเทอร์เน็ตอินเทอร์เน็ต - ในปีเดียวกันนั้น กลุ่ม W3C (World Wide Web Corporation) ได้ถูกสร้างขึ้น โดยรวบรวมองค์กรเชิงพาณิชย์และวิชาการ นักพัฒนา และผู้ใช้ 165 แห่ง (ตั้งแต่ก่อตั้งจนถึงปัจจุบัน องค์กรนี้นำโดย T.B. Lee) ข้อกำหนด HTML เวอร์ชันล่าสุดคือ HTML 4.01 ถูกนำมาใช้โดยสมาคมในเดือนธันวาคม พ.ศ. 2542
XML มีฟังก์ชันการทำงานมากมายที่ HTML ไม่มี
ข้อกำหนดภาษา XML เวอร์ชันล่าสุด XML 1.1 ถูกนำมาใช้ในเดือนเมษายน พ.ศ. 2547
จากภาษา XML นั้น W3C ได้พัฒนาการพัฒนาภาษาเพิ่มเติมภาษา HTML XHTML (ขยาย HTML HTML แบบขยาย) เวอร์ชันแรกของภาษานี้ XHTML 1.0 ถูกนำมาใช้ในเดือนมกราคม พ.ศ. 2543 เวอร์ชันนี้เป็นการปรับปรุง HTML 4 ให้เป็นแอปพลิเคชันของ XML 1.0 คาดว่าการพัฒนาภาษา HTML เพิ่มเติมจะดำเนินการตามข้อกำหนด XHTML