किसी भी .jpg फ़ाइल को हेक्स एडिटर में खोलें। पहले दो बाइट्स:
FF D8
यह स्टार्ट ऑफ़ इमेज (Start of Image) मार्कर है। हर JPEG फ़ाइल इसी से शुरू होती है। पृथ्वी पर हर JPEG डिकोडर इसे ढूंढता है। अगले बाइट्स डिकोडर को बताते हैं कि यह JPEG का कौन सा फ़्लेवर है, कौन सा कलर स्पेस एक्सपेक्ट करना है, और पिक्सल डेटा कहाँ शुरू होता है। यह प्रारूप वेब ब्राउज़र से भी पुराना है, फिर भी यह आधुनिक वेब पर सर्व की गई लगभग 57% छवियों को कैरी करता है, 2025 Web Almanac के अनुसार।
वह स्टोरेज संकट जिसने JPEG को जन्म दिया
1986 में, एक raw 640 × 480 ग्रेस्केल इमेज 307 KB डिस्क स्पेस खाती थी। उसी रिज़ॉल्यूशन पर एक कलर इमेज को 921 KB चाहिए होता था। उस समय जब 20 MB हार्ड ड्राइव सैकड़ों डॉलर में आती थीं और 1.44 MB फ्लॉपी डिस्क स्टैंडर्ड एक्सचेंज मीडियम थी, एक अनकंप्रेस्ड फोटो पूरे डिस्क का दो-तिहाई हिस्सा भर सकती थी।
ज़रूरत साफ़ थी: कंटीन्यूअस-टोन इमेज के लिए एक स्टैंडर्ड कंप्रेशन फॉर्मैट — फोटोग्राफ़्स के लिए, लाइन आर्ट नहीं। कई ग्रुप इस समस्या पर काम कर रहे थे। 1986 में ISO/IEC और ITU-T द्वारा गठित Joint Photographic Experts Group ने बेहतरीन आइडियाज़ को एक ही ड्राफ्ट में मर्ज किया। छह साल रिफाइनमेंट के बाद, 1992 में इसे ISO/IEC 10918-1 के रूप में पब्लिश किया गया।
JPEG कभी भी एकमात्र इमेज फॉर्मैट बनने का इरादा नहीं रखता था। इसे एक ही काम के लिए डिज़ाइन किया गया था: फोटोग्राफ़्स को इतना छोटा बनाना कि स्टोर और ट्रांसमिट किया जा सके। यह उस काम को एक बहुत ही स्पेसिफिक ऑर्डर में जानकारी फेंककर करता है।
JPEG इतना अच्छा क्यों कंप्रेस करता है
JPEG कंप्रेशन एक पाइपलाइन है, कोई सिंगल एल्गोरिदम नहीं। हर स्टेज वह डेटा हटाता है जिसे ह्यूमन विजुअल सिस्टम सबसे कम मिस करने की संभावना रखता है।
1. कलर स्पेस कन्वर्जन (RGB → YCbCr)
आपकी स्क्रीन RGB दिखाती है। JPEG YCbCr स्टोर करता है। Y चैनल ल्यूमिनेंस (brightness) ले जाता है। Cb और Cr क्रोमिनेंस (blue-difference और red-difference) ले जाते हैं। यह इसलिए मायने रखता है क्योंकि मानव आंख में लगभग 2.5 मिलियन कोन सेल्स ब्राइटनेस के लिए ट्यून हैं और केवल 100,000 कलर के लिए। हम ल्यूमिनेंस डिटेल को कलर डिटेल से बेहतर देखते हैं।
2. क्रोमा सबसैंपलिंग (Chroma Subsampling)
ज़्यादातर JPEGs 4:2:0 सबसैंपलिंग का इस्तेमाल करते हैं। हर 4 ल्यूमिनेंस सैंपल के लिए, 1 Cb सैंपल और 1 Cr सैंपल होता है। इसका मतलब है कि क्रोमा चैनल्स को ल्यूमा चैनल के चौथाई रिज़ॉल्यूशन पर स्टोर किया जाता है। 4000 × 3000 इमेज के लिए, Y प्लेन फुल रिज़ॉल्यूशन में है। Cb और Cr प्लेन 2000 × 1500 के हैं। आपने असली कंप्रेशन शुरू होने से पहले ही raw डेटा को लगभग 50% काट दिया, और ज़्यादातर दर्शक इसे कभी नोटिस नहीं करते।
3. डिस्क्रीट कॉसाइन ट्रांसफॉर्म (DCT)
इमेज को 8 × 8 पिक्सल ब्लॉक्स में बांटा जाता है। हर ब्लॉक को DCT से गुजारा जाता है, जो स्पेशियल डेटा (पिक्सल वैल्यूज़) को फ़्रीक्वेंसी डेटा (ब्लॉक में वैल्यूज़ कितनी तेज़ी से बदलती हैं) में बदलता है। नतीजा 8 × 8 का कोएफिशिएंट मैट्रिक्स है। ऊपर-बाएँ की वैल्यू DC कोएफिशिएंट है — ब्लॉक की एवरेज ब्राइटनेस। बाकी 63 AC कोएफिशिएंट्स हैं जो बढ़ती हुई हाई-फ़्रीक्वेंसी डिटेल को दर्शाते हैं।
हाई-फ़्रीक्वेंसी कोएफिशिएंट्स फाइन टेक्सचर को एन्कोड करते हैं: बाल, घास, शोर। लो-फ़्रीक्वेंसी कोएफिशिएंट्स ब्रॉड शेप्स को एन्कोड करते हैं: आसमान, दीवारें, स्किन टोन्स।
4. क्वांटाइजेशन (Quantization)
यहाँ पर loss होती है। JPEG हर DCT ब्लॉक पर एक क्वांटाइजेशन टेबल लगाता है। यह टेबल एक दूसरी 8 × 8 डिवाइज़र मैट्रिक्स है। हर DCT कोएफिशिएंट को अपने मैचिंग क्वांटाइज़र से डिवाइड किया जाता है और निकटतम पूर्णांक में राउंड किया जाता है।
स्टैंडर्ड क्वांटाइजेशन टेबल हाई-फ़्रीक्वेंसी कोएफिशिएंट्स को सबसे ज़ोर से मारती है:
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
14 17 22 29 51 87 80 62
18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 92
49 64 78 87 103 121 120 101
72 92 95 98 112 100 103 99
मान लीजिए, एक हाई-फ़्रीक्वेंसी कोएफिशिएंट 7 है, उसे 121 से डिवाइड करके 0 में राउंड किया जाता है। वह गया। अनरिवर्सिबल। डिकोडर उसे कभी नहीं देखता। यही lossy compression है: डेटा नष्ट होता है, सिर्फ़ re-encode नहीं होता।
क्वालिटी 90 पर, क्वांटाइज़र्स को एक छोटे स्केलिंग फैक्टर से डिवाइड किया जाता है। क्वालिटी 50 पर, स्केलिंग फैक्टर ज़्यादा होता है। ज़्यादा कोएफिशिएंट्स ज़ीरो हो जाते हैं। फ़ाइल छोटी हो जाती है। इमेज सॉफ्टर हो जाती है।
5. एन्ट्रॉपी कोडिंग (Entropy Coding)
क्वांटाइजेशन के बाद, बचे हुए कोएफिशिएंट्स को zig-zag स्कैन किया जाता है, run-length encoded किया जाता है, और Huffman coding से कंप्रेस किया जाता है। यह स्टेज lossless है। यह पहले से नष्ट हुए डेटा को बस और कुशलता से पैक करता है।
नतीजा: 12 MP अनकंप्रेस्ड RGB इमेज 36 MB होती है। इसे JPEG क्वालिटी 90 में 4:2:0 सबसैंपलिंग के साथ सेव करें और यह ~3.5 MB हो जाती है। यह 10:1 रिडक्शन है, और magnification के बिना विज़िबल क्वालिटी लॉस नहीं होता।
यह असल में कितना Lossy है?
नुकसान बराबर नहीं बंटा है।
| क्वालिटी | सामान्य साइज़ (12 MP) | विज़ुअल असर |
|---|---|---|
| 95+ | ~8 MB | लगभग अदृश्य; आर्काइविंग के लिए पसंदीदा |
| 90 | ~3.5 MB | हल्का सॉफ्टनिंग; कैमरों के लिए स्टैंडर्ड |
| 75 | ~1.8 MB | फाइन डिटेल में दिखने वाला ब्लर; वेब डिफ़ॉल्ट |
| 50 | ~1.0 MB | 100% ज़ूम पर ब्लॉकिंग आर्टिफैक्ट साफ़ दिखते हैं |
| 30 | ~600 KB | कलर बैंडिंग, मॉस्किटो नॉइज़, प्रिंट के लिए बेकार |
क्वालिटी गिरने पर तीन अलग-अलग आर्टिफैक्ट्स सामने आते हैं:
- ब्लॉकिंग: स्मूथ ग्रेडिएंट्स जैसे आसमान में 8 × 8 ग्रिड एज दिखाई देते हैं।
- रिंगिंग (Ringing): हाई-कंट्रास्ट एजेज़ (टेक्स्ट के बगल बैकग्राउंड) के आसपास ऑसिलेटिंग हेलोज़।
- कलर ब्लीडिंग: क्रोमा सबसैंपलिंग रंग को शार्प बाउंड्रीज़ के पार फैला देती है।
असली खतरा जनरेशन लॉस (generation loss) है। JPEG खोलें, एडिट करें, फिर से JPEG में सेव करें। हर सेव पूरा पाइपलाइन दोबारा चलाता है: RGB → YCbCr → सबसैंपल → DCT → क्वांटाइज़। राउंडिंग एरर्स बढ़ते हैं। 10 जनरेशन के बाद, इमेज ऐसी लगती है जैसे वॉटरकलर में बनी हो। 50 के बाद, वह पहचान में नहीं आती।
ग्रीन शिफ्ट और अन्य री-कंप्रेशन क्विर्क्स
JPEG को बार-बार फिर से सेव करें और आपको कलर टेम्परेचर में ड्रिफ्ट नोटिस हो सकती है। कुछ इमेज में हल्की हरी झलक आ जाती है। दूसरी मैजेंटा की ओर जाती हैं। वजह क्रोमा चैनल्स में दबी है।
JPEG Cb और Cr को कम रिज़ॉल्यूशन पर स्टोर करता है और उन्हें आक्रामक रूप से क्वांटाइज़ करता है। हर सेव दोनों चैनल्स में राउंडिंग एरर लाती है। RGB में वापस कन्वर्जन यह मैट्रिक्स इस्तेमाल करता है:
R = Y + 1.402 × (Cr - 128)
G = Y - 0.344136 × (Cb - 128) - 0.714136 × (Cr - 128)
B = Y + 1.772 × (Cb - 128)
ध्यान दें कि ग्रीन Cb और Cr दोनों से कैलकुलेट होता है。 जब दोहराया हुआ क्वांटाइजेशन Cb को ऊपर और Cr को नीचे धकेलता है, भले ही सिर्फ़ एक क्वांटाइजेशन स्टेप से, G चैनल ड्रिफ्ट कर जाता है। Cb में पॉज़िटिव बायस ग्रीन को नीचे धकेलता है। Cr में नेगेटिव बायस ग्रीन को ऊपर धकेलता है। इंटरैक्शन सममित (symmetric) नहीं है क्योंकि -0.344136 और -0.714136 कोएफिशिएंट्स की मैग्नीट्यूड अलग-अलग है। नतीजा: कुछ इमेज रीजन में धीरे-धीरे हरा बढ़ता है, खासकर जहाँ ओरिजिनल क्रोमा वैल्यूज़ पहले से ही क्वांटाइजेशन बाउंड्रीज़ के पास थीं।
यह कोई गारंटीड इफ़ेक्ट नहीं है। यह एन्कोडर की क्वांटाइजेशन टेबल्स, सबसैंपलिंग मोड, और इमेज कंटेंट पर निर्भर करता है। लेकिन यह रियल, रिप्रोड्युसिबल है, और यही एक कारण है कि प्रोफेशनल वर्कफ्लोज़ JPEG को दोबारा सेव करने से बचते हैं।
अगर JPEG इतना Flawed है, तो सब कुछ इसे क्यों इस्तेमाल करता है?
JPEG पॉपुलर नहीं है क्योंकि यह परफ़ेक्ट है। यह पॉपुलर है क्योंकि यह सफ़िशिएंट और यूनिवर्सल है।
- नो पेटेंट लॉक-इन: बेसलाइन JPEG पेटेंट (Forgent Networks के पास था) 2006 में एक्सपायर हो गया। यह प्रारूप रॉयल्टी-फ्री है।
- हार्डवेयर डिकोड: हर कैमरा, फोन, प्रिंटर, और ब्राउज़र में सिलिकॉन या हाईली ऑप्टिमाइज़्ड C में JPEG डिकोडर है। रेंडर करना लगभग कुछ नहीं लगता।
- गुड एनफ: सोशल मीडिया, न्यूज़ साइट्स, और ईमेल अटैचमेंट के लिए, क्वालिटी 75 JPEG फोन स्क्रीन पर सोर्स से अलग नहीं लगता।
- इकोसिस्टम इनर्शिया: कंटेंट मैनेजमेंट सिस्टम्स, CDN, इमेज लाइब्रेरीज़, और लेगसी आर्काइव्स सब JPEG बोलते हैं। उन्हें बदलने के लिए सिर्फ़ एक बेहतर फॉर्मैट नहीं चाहिए। एक बेहतर फॉर्मैट प्लस पेटाबाइट्स मौजूदा एसेट्स को माइग्रेट करने का एक कारण चाहिए।
वह फॉर्मैट जिन्हें जीतना चाहिए था
कई फॉर्मैट्स ने JPEG को हटाने की कोशिश की। कोई पूरी तरह सफल नहीं हुआ।
| फॉर्मैट | Lossy | Lossless | ट्रांसपैरेंसी | एनिमेशन | मैक्स बिट डेप्थ | मुख्य फ़ायदा |
|---|---|---|---|---|---|---|
| JPEG | हाँ | नहीं | नहीं | नहीं | 8-bit | यूनिवर्सल सपोर्ट |
| PNG | नहीं | हाँ | हाँ | नहीं | 16-bit | परफ़ेक्ट lossless, alpha |
| WebP | हाँ | हाँ | हाँ | हाँ | 8-bit | JPEG से 25–35% छोटा, ब्राउज़र-नेटिव |
| HEIC | हाँ | हाँ | हाँ | हाँ | 16-bit | JPEG से ~50% छोटा, Apple का डिफ़ॉल्ट |
| AVIF | हाँ | हाँ | हाँ | हाँ | 12-bit | आज का बेस्ट कंप्रेशन, रॉयल्टी-फ्री |
| JPEG XL | हाँ | हाँ | हाँ | हाँ | 32-bit | Lossless JPEG रीकंप्रेशन, प्रोग्रेसिव डिकोड |
PNG ने lossless प्रॉब्लम हल किया लेकिन फोटो के लिए JPEG से 5–10 गुना बड़ी फ़ाइलें देता है। यह स्क्रीनशॉट, UI एसेट्स, और ग्राफ़िक्स पर राज करता है।
WebP (Google, 2010) साइज़ में JPEG से बेहतर है और ट्रांसपैरेंसी और एनिमेशन जोड़ता है। यह अब हर मेजर ब्राउज़र में आता है। 2025 Web Almanac WebP को LCP इमेज का 11% बताता है, 2024 के 7% से बढ़कर। यह आज का सेफ़ अपग्रेड पाथ है।
HEIC (Apple, 2017) ISOBMFF कंटेनर के अंदर HEVC कंप्रेशन इस्तेमाल करता है। यह JPEG से ~40–50% छोटा है और एक फ़ाइल में कई इमेज रख सकता है। यह Apple इकोसिस्टम पर हावी है और HEVC पेटेंट पूल्स की वजह से बाकी हर जगह रुका हुआ है।
AVIF (AOM, 2019) AV1 वीडियो से निकला है। यह किसी भी वाइडली सपोर्टेड फॉर्मैट में सबसे अच्छे कंप्रेशन रेशियो देता है — इक्विवेलेंट क्वालिटी पर WebP से लगभग 30% छोटा। नुकसान है डिकोड स्पीड。 मोबाइल डिवाइस पर AVIF इमेज JPEG से 2–3 गुना ज़्यादा समय लेती हैं रेंडर होने में, बैटरी खाती हैं, और Largest Contentful Paint में देरी करती हैं।
JPEG XL (ISO/IEC 18181, 2021) तकनीकी रूप से सबसे ऊपर है। यह JPEG से 50–60% छोटा कंप्रेस करता है। तेज़ डिकोड करता है। प्रोग्रेसिव डिकोडिंग सपोर्ट करता है: ~1% फ़ाइल डाउनलोड करने के बाद ही यूज़ेबल इमेज दिखती है। सबसे ज़रूरी, यह मौजूदा JPEGs को lossless रीकंप्रेस कर सकता है ~20% साइज़ बचत के साथ, ओरिजिनल की bit-for-bit रिकवरी। कोई दूसरा फॉर्मैट यह नहीं कर सकता।
अभी हम कहाँ हैं
JPEG XL का बचपन मुश्किल रहा। Google ने 2021 में Chrome में एक्सपीरिमेंटल सपोर्ट जोड़ा, फिर 31 अक्टूबर 2022 को हटा दिया — "हैलोवीन डिसिजन"। कहा गया कारण: मौजूदा फॉर्मैट्स पर इनेफिशिएंट इंक्रीमेंटल बेनेफ़िट। प्रतिक्रिया तुरंत आई। Chromium issue प्रोजेक्ट के इतिहास में दूसरा सबसे ज़्यादा स्टार्ड बन गया। Google पर AVIF की रक्षा करने का आरोप लगा, जो Alliance for Open Media से जुड़ा फॉर्मैट है जिसे Google ने सह-स्थापित किया था।
2025 के अंत में, Chromium ने रुख बदला। एक नया Rust डिकोडर (jxl-rs) Chrome Canary में आया। Chrome 145, फरवरी 2026 में रिलीज़ हुआ, ने JPEG XL सपोर्ट एक फ्लैग के पीछे शिप किया। Safari 2023 से सपोर्ट करता है। Firefox Nightly वही Rust डिकोडर इंटिग्रेट कर रहा है। JPEG XL अभी डिफ़ॉल्ट पर एनेबल्ड नहीं है, लेकिन यह कोडबेस में वापस है।
AVIF, इस बीच, 2026 का प्रैग्मैटिक चॉइस है। ब्राउज़र सपोर्ट वाइड है। एन्कोडर्स बेहतर हो रहे हैं। Cloudinary और Cloudflare दोनों Accept हेडर निगोसिएशन के ज़रिए AVIF ऑटोमैटिकली सर्व करते हैं। AVIF या WebP सर्व करने वाली मीडियन पेज 81% गुड LCP रेट्स दिखाती है, JPEG-ओनली पेज के 64% के मुकाबले, CoreDash डेटा के अनुसार।
निष्कर्ष
JPEG 33 साल का समझौता है। यह कलर रिज़ॉल्यूशन, हाई-फ़्रीक्वेंसी टेक्सचर, और न्यूमेरिकल प्रिसिजन फेंकता है, बदले में फ़ाइल साइज़ के जो 1990s में डिजिटल फोटोग्राफ़ी को जीवित किया। आर्टिफैक्ट्स अच्छी तरह समझे जाते हैं। जनरेशन लॉस रियल है। ग्रीन ड्रिफ्ट होता है।
फिर भी JPEG इसी कारण टिका है जिस कारण QWERTY टिका है: स्विचिंग कॉस्ट रुकने की पीड़ा से ज़्यादा है।
प्रैक्टिकल आगे का रास्ता लेयर्ड है:
- हाई-क्वालिटी मास्टर्स रखें。 ओरिजिनल्स को PNG, TIFF, या क्वालिटी 95+ JPEG के रूप में आर्काइव करें। कभी क्वालिटी 75 वेब एक्सपोर्ट से री-एडिट न करें।
- मॉडर्न फॉर्मैट्स डाइनामिकली सर्व करें。 एक CDN या इमेज सर्विस का इस्तेमाल करें जो ब्राउज़र के
Acceptहेडर के आधार पर AVIF, WebP, या JPEG XL निगोसिएट करे। एक मास्टर स्टोर करें; एज को डिमांड पर कन्वर्ट करने दें। - JPEGs को बैच में री-एनकोड न करें。 हर जनरेशन डेटा नष्ट करती है। अगर छोटी फ़ाइलें चाहिए, मास्टर से री-एनकोड करें, किसी दूसरे JPEG से नहीं।
JPEG अचानक नहीं मरेगा। यह GIF की तरह फीका पड़ेगा: हर जगह सपोर्टेड, हर व्यूअर में खुलता, लेकिन लगातार उन फॉर्मैट्स से पछाड़ा जा रहा है जो कम बाइट्स और कम आर्टिफैक्ट्स में वही काम करते हैं। फ़र्क यह है कि इस बार, रिप्लेसमेंट फॉर्मैट्स सच में जीत रहे हैं।


