เครื่องมือแปลงรูปภาพสากล
ลากและวาง หรือ คลิก เพื่อเลือก
ส่วนตัวและปลอดภัย
ทุกอย่างเกิดขึ้นในเบราว์เซอร์ของคุณ ไฟล์ของคุณไม่เคยสัมผัสเซิร์ฟเวอร์ของเรา
เร็วสุดขีด
ไม่มีการอัปโหลด ไม่ต้องรอ แปลงทันทีที่คุณวางไฟล์
ฟรีจริงๆ
ไม่ต้องใช้บัญชี ไม่มีค่าใช้จ่ายแอบแฝง ไม่มีล ูกเล่นขนาดไฟล์
1. แท้จริงแล้ว ภาพดิจิทัลคืออะไร?
โดยแก่นแท้แล้ว ภาพดิจิทัลก็เป็นเพียงตารางตัวเลขขนาดใหญ่เท่านั้นเอง ในเชิงคณิตศาสตร์ คุณอาจมองมันเป็นฟังก์ชันที่แม็ปพิกัดเชิงไม่ต่อเนื่อง (ตำแหน่งพิกเซล) ไปยังค่าความเข้มหนึ่งค่าหรือหลายค่า (แชนเนล) ดังที่อธิบายใน Basics of Image Processing และตำราการประมวลผลภาพดิจิทัลแบบคลาสสิก
สำหรับภาพระดับเทา แต่ละตำแหน่ง (m, n) จะเก็บตัวเลขหนึ่งค่าที่อธิบายความสว่าง ส่วนภาพสีทั่วไป แต่ละพิกเซลจะเก็บค่าจำนวนสามค่า มักเป็นสีแดง เขียว และน้ำเงิน การตั้งค่าที่พบได้บ่อยคือ 8 บิตต่อหนึ่งแชนเนล ซึ่งให้สีที่เป็นไปได้มากกว่า 16 ล้านสี ดังที่อธิบายไว้ใน บทความเกี่ยวกับการสุ่มตัวอย่างและการควอนไทซ์ของภาพ.
อาร์เรย์ของตัวเลขเหล่านี้เองคือสิ่งที่เราเซฟเป็น JPEG, PNG, AVIF และฟอร์แมตไฟล์อื่น ๆ ส่งผ่านเครือข่าย และเรนเดอร์บนหน้าจอ สาขาการประมวลผลภาพดิจิทัลว่าด้วยการได้มาซึ่งอาร์เรย์เหล่านี้ การแปลงและการวิเคราะห์ และการเปลี่ยนให้กลายเป็นสิ่งที่ใช้การได้ ไม่ว่าจะเป็นภาพถ่าย ภาพสแกนทางการแพทย์ แผนที่ดาวเทียม หรืออินพุตให้กับโมเดลแมชชีนเลิร์นนิง ตามที่สรุปไว้ใน ตำรา Gonzalez & Woods.
2. จากแสงสู่ตัวเลข: ฉากจริงกลายเป็นภาพดิจิทัลได้อย่างไร
2.1. เซ็นเซอร์รับภาพและพิกเซล
ก่อนที่ทุกอย่างจะกลายเป็นพิกเซล จะต้องมีระบบเชิงออปติคและเซ็นเซอร์รับภาพเสียก่อน กล้องสมัยใหม่โดยมากใช้เซ็นเซอร์ CCD หรือ CMOS ซึ่งเป็นวงจรรวมที่มีโฟโตไซต์ขนาดเล็กจำนวนนับล้าน ที่ตอบสนองต่อแสง บทภาพรวมเกี่ยวกับการออกแบบเซ็นเซอร์และอาร์เรย์ฟิลเตอร์สีใน บทความด้านอิมเมจเซ็นเซอร์ และ บทความเชิงเทคนิคเกี่ยวกับเซ็นเซอร์ลาย Bayer แสดงให้เห็นว่าอุปกรณ์เหล่านี้สุ่มตัวอย่างภาพเชิงออปติคอย่างไร
กล้องและโทรศัพท์สำหรับผู้บริโภคส่วนใหญ่ใช้ Bayer filter mosaic ซึ่งเป็นอาร์เรย์ฟิลเตอร์สีที่วางฟิลเตอร์สีแดง เขียว และน้ำเงินลงบนตำแหน่งเซ็นเซอร์แต่ละจุดในแพตเทิร์นที่ซ้ำกัน โดยมักมีฟิลเตอร์สีเขียวมากกว่าแดงหรือสีน้ำเงินประมาณสองเท่า เพื่อให้ใกล้เคียงกับความไวต่อการมองเห็นของตามนุษย์ แพตเทิร์นแบบคลาสสิกนี้บันทึกไว้ใน บทความ Bayer filter และเอกสารวิศวกรรมที่เกี่ยวข้อง จากนั้นอัลกอริทึม demosaicing จะคำนวณค่าแทรกเพ ื่อสร้างค่าภาพ RGB ครบทั้งสามช่องสำหรับแต่ละพิกเซล คุณภาพของขั้นตอนนี้ส่งผลอย่างมากต่อความคมชัด สัญญาณรบกวน และอาร์ติแฟกต์จาก aliasing ในภาพสุดท้าย ดังที่เน้นไว้ใน งานวิเคราะห์คุณภาพการ demosaicing.
2.2. การสุ่มตัวอย่างและการควอนไทซ์
การทำให้เป็นดิจิทัลมีสองขั้นตอนสำคัญคือ การสุ่มตัวอย่าง (sampling) และ การควอนไทซ์ (quantization) การสุ่มตัวอย่างกำหนดว่าเราจะวัดฉากที่ตรงไหน —เราวางพิกเซลหนาแน่นแค่ไหนในเชิงพื้นที่ นั่นคือความละเอียดเชิงพื้นที่ของคุณ เช่น 4000×3000 พิกเซล ส่วนการควอนไทซ์กำหนดว่าเราจะแทนค่าความเข้มแสงหรือสีได้ละเอียดแค่ไหน —แต่ละพิกเซลสามารถมีระดับค่าได้กี่ระดับ เช่น 256 ระดับต่อช่องในภาพ 8 บิต แนวคิดทั้งสองนี้อธิบายไว้อย่างชัดเจนใน บทความแนะนำการสุ่มตัวอย่างและการควอนไทซ์ของภาพ และ บทเรียนเกี่ยวกับการแปลงภาพต่อเนื่องให้เป็นเมทริกซ์ของจำนวนเต็ม.
เมื่อรวมกัน การสุ่มตัวอย่างเชิงพื้นที่และการควอนไทซ์ความเข้มจะเปลี่ยนฉากต่อเนื่อง ให้กลายเป็นเมทริกซ์สองมิติของจำนวนเต็ม ซึ่งเป็นรากฐานของการประมวลผลภาพดิจิทัล สำหรับภาพถ่ายสีทั่วไป RGB 24 บิตให้ขั้นของสีมากพอจนแทบไม่เห็น banding ในฉากส่วนใหญ่ แต่ในงานวิทยาศาสตร์และเวิร์กโฟลว์ HDR มักใช้ช่อง 10, 12 หรือ 16 บิตเพื่อมี headroom มากขึ้น ดังที่กล่าวถึงใน บทความเรื่องความลึกของสี และ สเปก PNG ที่อธิบายความลึกของตัวอย่างตั้งแต่ 1–16 บิต.
2.3. ทฤษฎีการสุ่มตัวอย่างของ Nyquist–Shannon และอาลิเอซิง
ทฤษฎีการสุ่มตัวอย่างของ Nyquist–Shannon ระบุว่า หากต้องการสร้างสัญญาณกลับได้อย่างสมบูรณ์ จำเป็นต้องสุ่มตัวอย่างด้วยความถี่อย่างน้อยสองเท่าของความถี่สูงสุดของสัญญาณ มิฉะนั้นรายละเอียดความถี่สูงจะถูกพับ (alias) ลงมาเป็นความถี่ต่ำกว่าและก่อให้เกิดความเพี้ยน หลักการนี้ซึ่งอธิบายไว้ใน บทความทฤษฎี Nyquist–Shannon และบทเรียนอย่าง บทสรุป Nyquist จาก GeeksforGeeksมีผลโดยตรงกับการสร้างภาพดิจิทัล
ในภาพ เมื่อการสุ่มตัวอย่างเชิงพื้นที่ไม่เพียงพอ จะเกิด aliasing เช่น ลาย moiré บนผ้าละเอียดหรือกำแพงอิฐ หรือขอบแบบขั้นบันไดเมื่อซูมเข้าใกล้ ๆ ตัวอย่างและคำอธิบายเพิ่มเติมสามารถพบได้ใน บทเกี่ยวกับการสุ่มตัวอย่างและ aliasing ในตำราวิชาคอมพิวเตอร์วิชั่น และในบทเรียนเกี่ยวกับการเก็บสัญ ญาณจาก แหล่งข้อมูลด้าน measurement fundamentals.
ระบบกล้องรับมือกับปัญหานี้ด้วยฟิลเตอร์ low-pass เชิงออปติค เซ็นเซอร์ความละเอียดสูงขึ้น และการประมวลผลภายหลัง การควบคุม anti-aliasing และ moiré ในระบบกล้องอธิบายไว้อย่างละเอียดใน ส่วนที่ว่าด้วยการสร้างภาพในเอกสาร Nyquist ต่าง ๆ และใน บันทึกการสอนเกี่ยวกับการสุ่มตัวอย่างในคอมพิวเตอร์วิชั่น.
3. แรสเตอร์กับเวกเตอร์: สองวิธีในการแทนภาพ
ภาพส่วนใหญ่ที่คุณพบในชีวิตประจำวันเป็นภาพแบบ แรสเตอร์ (raster) คือกริดของพิกเซลคงที่ ที่แต่ละพิกเซลเก็บค่าสีหนึ่งค่า กราฟิกแบบแรสเตอร์เหมาะอย่างยิ่งสำหรับการจับรายละเอียดต่อเนื่อง ที่ซับซ้อน เช่น ภาพถ่ายและงานวาดสไตล์เพนต์ ตามที่อธิบ ายไว้ใน บทความเปรียบเทียบ raster กับ vector ของ Adobe และ บทเรียนคอมพิวเตอร์กราฟิกอย่างไรก็ตาม คุณภาพของภาพจะผูกติดกับความละเอียด—หากซูมมากเกินไป คุณก็จะเห็นพิกเซลชัดเจน
กราฟิกแบบเวกเตอร์ (vector) ทำงานต่างออกไป มันเก็บรูปร่าง—จุด เส้น โค้ง และพื้นที่ระบายสีที่อธิบายเชิงคณิตศาสตร์ มักอยู่ในฟอร์แมตอย่าง SVG, EPS หรือ PDF คู่มือ SVG บน MDN และ บทสรุป SVG ของ W3C อธิบายว่า SVG ใช้ XML เพื่อแทนรูปร่าง ข้อความ และทรานสฟอร์มต่าง ๆ อย่างไร เนื่องจากตัวเรนเดอร์จะคำนวณรูปร่างเหล่านี้ใหม่ทุกครั้งตามขนาดที่ต้องการ กราฟิกแบบเวกเตอร์จึงไม่ขึ้นกับความละเอียด: โลโก้หนึ่งภาพสามารถคมชัดเท่ากันได้ทั้งบนการ์ดเล็ก ๆ และป้ายโฆษณาขนาดใหญ่ ดังที่เน้นใน บทความเชิงดีไซน์ที่เปรียบเทียบ raster และ vector และ คู่มือ SVG ยุคใหม่.
ในทางปฏิบัติ ฟอร์แมตภาพแบบแรสเตอร์ (JPEG, PNG, TIFF, GIF, AVIF, WebP และอื่น ๆ) ถูกใช้กับภาพถ่าย เอกสารสแกน และภาพที่มีรายละเอียดซับซ้อนเป็นหลัก ขณะที่ฟอร์แมตเวกเตอร์อย่าง SVG และ PDF มักใช้กับโลโก้ ไอคอน แผนภาพ และกราฟิกที่มีข้อความเป็นหลัก บทความเปรียบเทียบอย่าง คำอธิบายฟอร์แมตไฟล์ภาพ และ คู่มือฟอร์แมตรูปภาพสมัยใหม่ แสดงให้เห็นบทบาทเหล่านี้ในสถานการณ์จริง
4. สีในภาพดิจิทัล
4.1. แบบจำลองสีและปริภูมิสี
แบบจำลองสี (color model) คือวิธีการเชิงคณิตศาสตร์ในการแทนสี —เช่น RGB, CMYK, HSV, YCbCr เป็นต้น บทนำเกี่ยวกับแบบจำลองสี และ บทความเปรียบเทียบ RGB, CMYK, HSV และ YIQ อธิบายว่าระบบเหล่านี้ถูกใช้ในฮาร์ดแวร์และซอฟต์แวร์อย่างไร ปริภูมิสี (color space) จะนำแบบจำลองสีมาผูกกับค่าจุดสีพื้นฐาน (primaries) และ white point ที่เฉพาะเจาะจง เช่น sRGB หรือ Adobe RGB พร้อมด้วยฟังก์ชันโอนถ่าย (transfer function)
RGB เป็นระบบสีหลักสำหรับจอภาพและภาพของผู้บริโภคทั่วไป ขณะที่ CMYK ใช้ในการพิมพ์ YCbCr แยกช่องสัญญาณสว่าง (luma) ออกจากช่องสีสองช่อง (chroma) และถูกใช้กันอย่างแพร่หลายในวิดีโอดิจิทัลและการบีบอัด JPEG ตามที่อธิบายใน บทความ YCbCr และ บทอธิบายการบีบอัด JPEG.
4.2. แกมมาและการสร้างโทน
ภาพส่วนใหญ่ไม่ได้เก็บในรูปแสงเชิงเส้นอย่างเคร่งครัด แ ต่จะใช้พื้นที่สีที่เข้ารหัสแกมมา (gamma-encoded) เช่น sRGB ซึ่งจัดสรรโค้ดค่าให้แน่นขึ้นในโทนมืดที่ตาเรามีความไวมาก และให้โค้ดค่าน้อยลงในโทนสว่าง นี่เป็นส่วนหนึ่งของสายโซ่การประมวลผลสีที่อธิบายไว้ใน บทเรียนเกี่ยวกับปริภูมิสี และในบันทึกเชิงเทคนิคเกี่ยวกับ luma และ RGB ที่แก้แกมมาแล้ว.
5. ฟอร์แมตแรสเตอร์หลัก: JPEG, PNG, GIF, TIFF
5.1. JPEG: การบีบอัดแบบสูญเสียข้อมูลสำหรับภาพถ่าย
มาตรฐาน JPEG ดั้งเดิม (JPEG 1, ISO/IEC 10918-1 / ITU-T T.81) มีมาตั้งแต่ต้นทศวรรษ 1990 และยังคงเป็นฟอร์แมตภาพถ่ายที่ใช้กันมากที่สุดบนเว็บ และในกล้องผู้บริโภค มาตรฐานนี้อธิบายไว้ใน บทสรุปของคณะกรรมการ JPEG และ ข้อแนะนำ ITU-T T.81.
โดยทั่วไปแล้ว JPEG แบบ baseline จะ:
- แปลงจาก RGB ไปเป็นปริภูมิสีแบบ luma–chroma เช่น YCbCr และมักสุ่มตัวอย่างช่อง chroma ให้หยาบลง
- แบ่งภาพออกเป็นบล็อก 8×8 และใช้ discrete cosine transform (DCT) กับแต่ละบล็อก
- ควอนไทซ์ค่าสัมประสิทธิ์ DCT ด้วยตารางควอนไทซ์ ทำให้ค่าสัมประสิทธิ์ความถี่สูงจำนวนมากกลายเป็นศูนย์
- บีบอัดผลลัพธ์ด้วยการเข้ารหัสเชิงเอนโทรปี เช่น Huffman coding
คำอธิบายโดยละเอียดสามารถพบได้ใน บันทึกการบีบอัด JPEG ของ Stanford, บทเรียนเกี่ยวกับมาตรฐาน JPEGและเอกสารประกอบการสอนด้านการเข้ารหัสแบบทรานส์ฟอร์มและการควอนไทซ์ ขั้นตอนการควอนไทซ์ของ JPEG คือสาเหตุที่ทำให้เป็นการบีบอัดแบบสูญเสียข้อมูล และเป็นแหล่งกำเนิดหลักของอาร์ติแฟกต์อย่าง block และ ringing ในบิตเรตต่ำ
5.2. PNG: การบีบอัดแบบไม่สูญเสียข้อมูลและความโปร่งใส
PNG (Portable Network Graphics) ถูกสร้างขึ้นในช่วงกลางทศวรรษ 1990 ในฐานะฟอร์แ มตปลอดค่าลิขสิทธิ์เพื่อมาแทน GIF หลังจากมีข้อพิพาทเรื่องสิทธิบัตรการบีบอัด LZW ใน GIF ฟอร์แมตนี้ระบุไว้ใน สเปก PNG ของ W3C และมีบริบททางประวัติศาสตร์ใน เรื่องราวว่าข้อพิพาทเรื่องค่าลิขสิทธิ์ GIF นำไปสู่การกำเนิด PNG อย่างไร.
PNG รองรับภาพระดับเทา ภาพสีแบบ indexed และภาพ truecolor พร้อมตัวเลือกช่องอัลฟาสำหรับความโปร่งใส และความลึกบิตตั้งแต่ 1 ถึง 16 บิตต่อแชนเนล มันใช้การบีบอัดแบบไม่สูญเสียข้อมูลด้วยอัลกอริทึม DEFLATE ซึ่งรวม LZ77 และ Huffman coding เข้าด้วยกัน ตามที่อธิบายใน คู่มือการบีบอัด PNG และ บทความเกี่ยวกับการปรับแต่งการบีบอัด PNGทำให้ PNG เหมาะอย่างยิ่งสำหรับกราฟิก UI โลโก้ ภาพหน้าจอ และภาพที่มีขอบและตัวหนังสือคม ๆ
การอัปเดตสเปก PNG ครั้งล่าสุดได้เพิ่มการรองรับ HDR แอนิเมชัน (APNG) และเมทาดาทา Exif ที่ฝังในไฟล์ ตามรายงานใน ข่าวการอัปเดตครั้งใหญ่ของ PNG เป็นครั้งแรกในรอบกว่า 20 ปีสิ่งนี้ช่วยให้ PNG ยังคงแข่งขันกับฟอร์แมตที่ใหม่กว่าได้ พร้อมทั้งรักษาจุดแข็งในฐานะฟอร์แมตแบบไม่สูญเสียข้อมูล
5.3. GIF: สี 256 ระดับและแอนิเมชันน้ำหนักเบา
GIF (Graphics Interchange Format) เป็นฟอร์แมตบิตแมปที่เปิดตัวในปี 1987 แต่ละเฟรมใช้พาเลตต์สีได้สูงสุด 256 สีโดยเข้ารหัสด้วยการบีบอัด LZW ตามที่อธิบายใน บทความอธิบายฟอร์แมต GIF และ การแยกส่วนข้อมูลรูปภาพ GIF เชิงเทคนิคจุดเด่นของ GIF คือแอนิเมชันแบบเฟรมง่าย ๆ พร้อมตัวเลือกความโปร่งใส จึงยังเป็นฟอร์แมตหลักสำหรับมีมและภาพปฏิกิริยาบนออนไลน์
ข้อจำกัดของ GIF—เช่น ส ีได้เพียง 256 สีต่อเฟรม การขาดการบีบอัดแบบข้ามเฟรมสมัยใหม่ และขนาดไฟล์ที่ใหญ่สำหรับฉากที่ซับซ้อน—ทำให้ GIF ไม่เหมาะกับเนื้อหาที่คล้ายวิดีโอ คู่มือการเพิ่มประสิทธิภาพ เช่น บทความสอนลดขนาดไฟล์ GIF และ เครื่องมือบีบอัด GIFแสดงให้เห็นว่าการครอปภาพ การลดจำนวนเฟรม และการลดจำนวนสีช่วยได้อย่างไร แต่โดยทั่วไปฟอร์แมตใหม่ ๆ หรือโค้ดเช็กวิดีโอจะมีประสิทธิภาพดีกว่า
5.4. TIFF: มีดอเนกประสงค์แห่งโลกบิตแมป
TIFF (Tagged Image File Format) เป็นคอนเทนเนอร์แบบยืดหยุ่นที่ใช้โครงสร้างแท็ก สามารถเก็บภาพหลายภาพ เมทาดาทา และสกีมการบีบอัดที่หลากหลาย (ทั้งไม่บีบอัด LZW PackBits JPEG และอื่น ๆ) ฟอร์แมตนี้อธิบายไว้ใน บทความสารานุกรม TIFF, คู่มือ TIFF สำหรับงานจัดการสินท รัพย์ดิจิทัลและเอกสารฟอร์แมตอย่างเป็นทางการ เช่น โปรไฟล์ TIFF_UNC ของหอสมุดรัฐสภาสหรัฐ.
TIFF ถูกใช้กันอย่างกว้างขวางในงานสิ่งพิมพ์ การถ่ายภาพระดับมืออาชีพ และการดิจิทัลเอกสารมรดกทางวัฒนธรรม เพราะสามารถเก็บภาพที่มีความลึกบิตสูงและปรับแต่งน้อย พร้อมเมทาดาทาที่ละเอียด และมีอาร์ติแฟกต์จากการบีบอัดน้อยหรือไม่มีเลย แนวปฏิบัติด้านการสงวนรักษา เช่น Recommended Formats Statement สำหรับภาพนิ่งของหอสมุดรัฐสภาสหรัฐ และ การเปรียบเทียบฟอร์แมตสำหรับการดิจิทัลภาพนิ่งของหน่วยงานรัฐ มักจัดให้ TIFF อยู่ในกลุ่มฟอร์แมตที่แนะนำ
6. ฟอร์แมตสมัยใหม่สำหรับเว็บ: WebP, AVIF, HEIF และเพื่อน ๆ
ในช่วงทศวรรษที่ผ่านมา เกิดฟอร์แมตรูปภาพรุ่นใหม่ที่ออกแบบมาเพื่อให้ไ ด้คุณภาพสูงขึ้นในจำนวนบิตที่น้อยลง โดยเฉพาะสำหรับการส่งบนเว็บและอุปกรณ์พกพา บทความอย่าง การเปรียบเทียบฟอร์แมตรูปภาพอย่างครอบคลุม และ การทดสอบเปรียบเทียบ WebP กับ AVIF กับ JPEG ให้ข้อมูลเชิงตัวเลขว่าฟอร์แมตเหล่านี้ทำงานอย่างไร
WebP รองรับทั้งการบีบอัดแบบสูญเสียข้อมูลและไม่สูญเสียข้อมูล พร้อมทั้งช่องอัลฟาและแอนิเมชัน สำหรับภาพถ่ายจำนวนมาก WebP แบบสูญเสียข้อมูล สามารถมีขนาดเล็กกว่า JPEG ราว 25–30% ในคุณภาพที่รับรู้ใกล้เคียงกัน AVIF ใช้เครื่องมือภายในเฟรมของตัวแปลงวิดีโอ AV1 เพื่อให้ประสิทธิภาพการบีบอัดสูงขึ้นไปอีก โดยในการทดสอบจำนวนมาก พบว่ามักลดขนาดไฟล์ได้ 40–50% เมื่อเทียบกับ JPEG การเปรียบเทียบละเอียดปรากฏใน คู่มือฟอร์แมตรูปภาพปี 2024–2025, การวิเคราะห์ AVIF, WebP และ JPEG XLและ สถิติเปรียบเทียบฟอร์แมตรูปภาพ.
HEIF/HEIC บรรจุภาพโดยใช้การเข้ารหัส HEVC และได้รับความนิยมในบางระบบโทรศัพท์มือถือ ขณะที่ JPEG XL มีเป้าหมายจะผสานการบีบอัดที่มีประสิทธิภาพเข้ากับฟีเจอร์อย่าง การบีบอัด JPEG เดิมซ้ำแบบไม่สูญเสียข้อมูล บทความใน ภาพรวมฟอร์แมตรุ่นถัดไป และ คู่มือฟอร์แมตที่เน้นประสิทธิภาพ อธิบายว่าฟอร์แมตเหล่านี้เข้ากับกลยุทธ์ด้านประสิทธิภาพเว็บสมัยใหม่อย่างไร
แม้จะมีข้อได้เปรียบเหล่านี้ การนำไปใช้ยังขึ้นกับการรองรับของเบราว์เซอร์และระบบปฏิบัติการ เครื่องมือ และข้อพิจารณาด้านการสงวนรักษาระยะยาว สถาบันต่าง ๆ ยังคงเน้นฟอร์แมตที่เก่ากว่าแต่มีเอกสารครบถ้วนอย่าง TIFF, PNG และ JPEG ใน Recommended Formats Statements และ เอกสารระบุฟอร์แมตภาพนิ่งที่พึงประสงค์.
7. เมทาดาทา การสงวนรักษา และความแท้จริงของเนื้อหา
7.1. EXIF และเมทาดาทาของภาพชนิดอื่น
นอกเหนือจากพิกเซลแล้ว ไฟล์ภาพมักมี เมทาดาทา (metadata) ติดมาด้วย มาตรฐานระดับต่ำที่แพร่หลายที่สุดคือ EXIF (Exchangeable Image File Format) ที่ออกแบบมาสำหรับกล้องถ่ายรูปดิจิทัล สเปกและประวัติของ EXIF ถูกบันทึกไว้ใน บทความ EXIF และ คู่มือเมทาดาทา EXIF สำหรับช่างภาพ.
แท็ก EXIF สามารถเก็บข้อมูลรุ่นกล้อง เลนส์ ค่าการรับแสง เวลาและวันที่ พิกัด GPS และอื่น ๆ โดยฝังอยู่ใน JPEG, TIFF และฟอร์แมตอื่นบางชนิด ภาพรวมเช่น EXIF ในบริบทของระบบจัดการสินทรัพย์ดิจิทัล และ คู่มือเมทาดาทาของภาพถ่าย ชี้ให้เห็นว่ามีการใช้ EXIF ในทางปฏิบัติอย่างไร และระบุว่าถึงแม้ PNG และ WebP จะสามารถเก็บบล็อกเมทาดาทาได้ แต่ EXIF ที่หลากหลายมักพบใน JPEG และ TIFF เป็นหลัก
7.2. ฟอร์แมตเพื่อการสงวนรักษาและแนวทางจากสถาบัน
องค์กรอย่างหอสมุดรัฐสภาสหรัฐจะเผยแพร่ Recommended Formats Statements ที่จัดลำดับฟอร์แมตสำหรับการรับเข้า และการสงวนรักษา โดยชั่งน้ำหนักความเปิดกว้าง เอกสารประกอบ ความรองรับเมทาดาทา และความแข็งแรงทางเทคนิค เอกสาร RFS สำหรับภาพนิ่ง และการอัปเดตล่าสุดสำหรับ ปี 2025–2026 สรุปฟอร์แมตที่พึงประสงค์และยอมรับได้สำหรับภาพนิ่ง
เอกสารเหล่านี้มักเน้นฟอร์แมต TIFF แบบ ไม่บีบอัดหรือบีบอัดแบบไม่สูญเสียข้อมูล JPEG คุณภาพสูง PNG และ JPEG 2000 ว่าอยู่ในกลุ่มฟอร์แมตที่พึงประสงค์หรือยอมรับได้ และเน้นคุณสมบัติอย่างความลึกบิต ความละเอียดเชิงพื้นที่ และเมทาดาทา หน้าความพึงประสงค์ของฟอร์แมตภาพนิ่ง ระบุอย่างชัดเจนว่าการรองรับเมทาดาทาทางเทคนิคมาตรฐาน เช่น EXIF และสคีมาอื่นที่เกี่ยวข้องเป็นสิ่งสำคัญ
7.3. ที่มาของเนื้อหา (provenance) และความแท้จริง
เมื่อสื่อสังเคราะห์สร้างได้ง่ายขึ้นเรื่อย ๆ ความสนใจในเรื่อง ที่มาของเนื้อหา (content provenance) ในภาพและวิดีโอก็เพิ่มสูงขึ้น โครงการอย่าง Coalition for Content Provenance and Authenticity (C2PA) และ Content Authenticity Initiative ของ Adobe เสนอวิธีการแนบ “Content Credentials” ที่ตรวจสอบได้ด้วยเทคโนโลยีคริปโตให้กับสื่อ ตั้งแต่ตอนสร้างไปจนถึงตอนแก้ไข ต่อเนื่องไป ซึ่งมีการพูดถึงใน รายงานเกี่ยวกับ C2PA และการติดป้าย deepfake และในเอกสารด้านการสงวนรักษา เช่น ข้อความเกี่ยวกับฟอร์แมตที่พึงประสงค์.
อย่างไรก็ตาม จากการใช้งานระยะแรกพบว่า แพลตฟอร์มต่าง ๆ มักลบหรือซ่อนเมทาดาทาที่บอกที่มาของเนื้อหา และผู้ใช้แทบไม่เห็นป้ายเตือนที่ชัดเจนแม้เมทาดาทาจะมีอยู่แล้วก็ตาม บทความอย่าง บทวิจารณ์ระบบติดป้าย deepfake ของ Sora และ มุมมองด้านนิติดิจิทัลเกี่ยวกับ deepfake เน้นให้เห็นช่องว่างระหว่างศักยภาพทางเทคนิคกับการใช้งานจริง
8. การบีบอัด การเพิ่มประสิทธิภาพ และอาร์ติแฟกต์
8.1. ทำไมเราต้องบีบอัดภาพ
ภาพดิบที่ไม่ผ่านการบีบอัดมีขนาดใหญ่มาก ดังนั้นการบีบอัดจึงเป็นสิ่งจำเป็น เพื่อการจัดเก็บ การส่งผ่าน และการใช้งานแบบโต้ตอบ การบีบอัดแบบไม่สูญเสียข้อมูล (lossless) (เช่น PNG บางโพรไฟล์ของ TIFF, GIF, WebP/AVIF แบบ lossless) ใช้ความซ้ำซ้อนในข้อมูลเพื่อลดขนาดไฟล์โดยไม่เปลี่ยนค่าพิกเซลเลย ตามที่อธิบายใน เอกสารการบีบอัด PNG, เอกสาร TIFFและ คู่มือการบีบอัด GIFส่วน การบีบอัดแบบสูญเสียข้อมูล (lossy) (JPEG, WebP/AVIF แบบ lossy และ TIFF บางโปรไฟล์) จะตัดข้อมูลที่ควรจะมองเห็นต่างออกไม่มากนัก ตามที่เห็นในงานวิเคราะห์ JPEG และฟอร์แมตสมัยใหม่ เช่น การเปรียบเทียบ JPEG กับ WebP กับ AVIF.
การเปรียบเทียบสมัยใหม่แสดงให้เห็นว่า สำหรับหลายกรณีการใช้งาน AVIF และ WebP สามารถให้อัตราส่วนขนาดต่อคุณภาพที่ดีกว่าทั้ง JPEG และ PNG โดยเฉพาะสำหรับการส่งบ นเว็บ ตามที่รายงานใน การทดสอบฟอร์แมตภาพของ CDN ต่าง ๆ และ สถิติเปรียบเทียบฟอร์แมตรูปภาพ.
8.2. อาร์ติแฟกต์จากการบีบอัด
เมื่อผลักการบีบอัดแบบสูญเสียข้อมูลไปไกลเกินไป อาร์ติแฟกต์จะมองเห็นได้ชัด อาร์ติแฟกต์ที่พบได้บ่อยได้แก่ block, ringing, banding และ mosquito noise บทความ compression artifact และ คู่มือการลดอาร์ติแฟกต์จากภาพบีบอัด ให้การจำแนกประเภทอย่างละเอียด ขณะที่ คู่มืออาร์ติแฟกต์ในวิดีโอ แสดงให้เห็นว่าปัญหาคล้ายกันเกิดขึ้นในภาพเคลื่อนไหวอย่างไร
เครื่องมือลดอาร์ติแฟกต์พยายามทำให้ขอบบล็อกเรียบขึ้น ฟื้นฟูแนวขอบ หรือใช้ฟิลเตอร์ deblocking โดยบางครั้งใช้โมเดลแมชชีนเลิร์นนิงเป็นตัวช่วย รากฐานเชิงแนวคิดเชื่อมโยงกลับไปยังวิธีที่ JPEG ควอนไทซ์ค่าสัมประสิทธิ์ DCT ดังที่อธิบายไว้ใน การอธิบายการควอนไทซ์สัมประสิทธิ์ JPEG ของ Stanford และ บันทึกเชิงลึกเกี่ยวกับมาตรฐาน JPEG.
8.3. ประสิทธิภาพเว็บและกลยุทธ์การเพิ่มประสิทธิภาพ
บนเว็บ ภาพมักเป็นองค์ประกอบที่มีน้ำหนักมากที่สุดของหน้าเว็บ การเลือกฟอร์แมตและระดับการบีบอัดที่มีประสิทธิภาพ สามารถลดปริมาณข้อมูลภาพที่ต้องส่งได้อย่างมาก—บางครั้งถึง 50–70% แหล่งข้อมูลที่เน้นประสิทธิภาพอย่าง การเปรียบเทียบ WebP กับ AVIF กับ JPEG และ คู่มือการเพิ่มประสิทธิภาพสมัยใหม่ แสดงให้เห็นว่าการเลือกเหล่านี้ส่งผลมากเพียงใด
เทคนิคเชิงปฏิบัติรวมถึงการเลือกฟอร์แมตที่เหมาะสม (AVIF/WebP สำหรับภาพถ่าย PNG/SVG สำหรับเส้นและลายเส้นคม ๆ GIF ขั้นต่ำหรือวิดีโอสำหรับแอนิเมชัน) การให้บริการไฟล์หลายฟอร์แมตแล้วให้เบราว์เซอร์เลือกเอง และการย่อขนาดภาพให้ตรงกับการแสดงผลด้วยมาร์กอัปแบบ responsive บทความอย่าง คำอธิบายฟอร์แมตไฟล์ภาพ และ คู่มือเปรียบเทียบฟอร์แมตรูปภาพ ให้คำแนะนำเชิงรูปธรรม
การเพิ่มประสิทธิภาพ GIF และ PNG เดิมแบบไม่สูญเสียข้อมูลด้วยเครื่องมือเฉพาะทาง (เช่น flexiGIF หรือเครื่องมือปรับแต่ง PNG โดยเฉพาะ) สามารถลดขนาดไฟล์ได้มากขึ้นโดยไม่เปลี่ยนพิกเซลเลย ตามที่กล่าวถึงใน คู่มือการบีบอัด PNG และ คำอธิบายเครื่องมือเพิ่มประสิทธิภาพ GIF.
9. จริยธรรม Deepfake และวิกฤตความน่าเชื่อถือข องภาพ
เมื่อโมเดลเจเนอเรทีฟสร้างภาพและวิดีโอได้สมจริงมากขึ้น แนวคิดที่ว่า “เห็นกับตาแล้วต้องเชื่อ” ก็เริ่มสั่นคลอน เทคโนโลยี deepfake สามารถสร้างใบหน้าที่สมจริง เปลี่ยนตัวตนของบุคคล และสร้างเหตุการณ์ที่ไม่เคยเกิดขึ้นจริง การวิเคราะห์ด้านจริยธรรมและสังคม เช่น งานศึกษาว่าด้วย deepfake และวิกฤตความแท้จริงของข้อมูลดิจิทัล, จริยธรรมของเทคโนโลยี deepfakeและ การประเมินความเสี่ยงจาก deepfake เน้นประเด็นตั้งแต่ภาพไม่สมัครใจไปจนถึงการบิดเบือนข้อมูลทางการเมือง
งานวิจัยเชิงประจักษ์ชี้ให้เห็นว่า ผู้ใช้จำนวนมากในปัจจุบันมีปัญหาในการแยกแยะสื่อสังเคราะห์ออกจากสื่อจริง ซึ่งสร้างคำถามด้านความยินยอม อัตลักษณ์ และความน่าเชื่อถือของข้อมูล มุมมองด้านนิติดิจิทัลและกฎหมายใน การวิเคราะห์ deepfake กับการดัดแปลงหลักฐาน เน้นว่าปัญหานี้ส่งผลต่อศาลและการสืบสวนอย่างไร
ความพยายามในการตรวจจับหรือระบุป้าย deepfake ยังตามหลังความสามารถในการสร้างอยู่มาก: แม้แต่ระบบที่ฝังเมทาดาทาที่บอกที่มาของเนื้อหาอย่าง C2PA ก็มักไม่แสดงคำเตือนที่ชัดเจน หรือเมทาดาทาอาจถูกลบออกในขั้นตอนการกระจายต่อ ๆ กัน ตามที่บันทึกไว้ใน รายงานเกี่ยวกับความล้มเหลวในการติดป้าย deepfakeสำหรับภาพดิจิทัล เรื่องนี้สร้างมิติใหม่ของความรับผิดชอบให้กับนักเทคโนโลยี แพลตฟอร์ม และผู้กำหนดนโยบาย
10. สรุปภาพรวม: คิดเป็นพิกเซลและฟอร์แมต
ภาพดิจิทัลเป็นหลายสิ่งพร้อมกัน: เป็นสัญญาณที่ถูกสุ่มตัวอย่า งภายใต้ข้อจำกัดของการออกแบบเซ็นเซอร์ และอัตราการสุ่มตัวอย่าง เป็นวัตถุเชิงคณิตศาสตร์ในปริภูมิสี เป็นอินสแตนซ์ของฟอร์แมตไฟล์อย่าง JPEG หรือ PNG และเป็นวัตถุทางวัฒนธรรมที่ถูกกำหนดโดยตัวเลือกด้านสุนทรียะ จริยธรรม นโยบายการสงวนรักษา และกรอบความไว้วางใจ ชั้นต่าง ๆ เหล่านี้อธิบายไว้ตามลำดับใน บทเรียนเรื่องการสุ่มตัวอย่างและการควอนไทซ์, คำจำกัดความเชิงทางการของภาพดิจิทัล, คู่มือเปรียบเทียบฟอร์แมตภาพและ เอกสารด้านการสงวนรักษาและฟอร์แมตที่พึงประสงค์.
การเข้าใจภาพดิจิทัลจึงหมายถึงการเข้าใจว่าชั้นเหล่านี้เชื่อมต่อกันอย่างไร เมื่อคุณมองภาพหนึ่งภาพว่าเป็นอาร์เรย์ของตัวเลขที่ถูกกำหนดด้วยทฤษฎีการสุ่มตัวอย่าง วิทยาศาสตร์สี การบีบอัด เมทาดาทา และบริบททางสังคม คำถามอย่าง “โลโก้นี้ควรใช้ SVG หรือ PNG?” หรือ “JPEG นี้ดีพอสำหรับการเก็บถาวรหรือยัง?” ก็กลายเป็นการตัดสินใจเชิง trade-off ที่มีข้อมูลรองรับแทนการคาดเดา
เมื่อฟอร์แมตต่าง ๆ พัฒนาต่อไป—PNG เพิ่มการรองรับ HDR AVIF และ JPEG XL ท้าทาย JPEG และมาตรฐานด้าน provenance ถูกวางทับลงไปบนฟอร์แมตเดิม—ภูมิทัศน์นี้ก็จะยังคงเปลี่ยนแปลงต่อไป บทความเกี่ยวกับ การอัปเดตสเปก PNG ล่าสุด, ฟอร์แมตรูปภาพรุ่นถัดไปและ แนวทางการสงวนรักษาที่ปรับปรุงล่าสุด แสดงให้เห็นชัดเจนว่าภาพดิจิทัลเป็นเป้าหมายที่เคลื่อนที่อยู่ตลอดเวลา สิ่งที่ไม่เปลี่ยนก็คือ ภาพดิจิทัลจะยังคงเป็นศูนย์กลางของวิธีที่เรามอง จดจำ และถกเถียงเกี่ยวกับโลก ไม่ว่าจะอยู่ในรูปสแกน TIFF ที่เก็บรักษาไว้อย่างดีในหอจดหมายเหตุ หรือมีมชั่วคราวที่ถูกส่งต่อไปมาบนโซเชียลมีเดีย
รูปแบบที่รองรับ
AAI.aai
ภาพ AAI Dune
AI.ai
Adobe Illustrator CS2
AVIF.avif
รูปแบบไฟล์ภาพ AV1
BAYER.bayer
ภาพ Bayer ดิบ
BMP.bmp
ภาพ bitmap ของ Microsoft Windows
CIN.cin
ไฟล์ภาพ Cineon
CLIP.clip
Image Clip Mask
CMYK.cmyk
ตัวอย่างสีฟ้า, สีแม่จัน, สีเหลือง, และสีดำดิบ
CUR.cur
ไอคอนของ Microsoft
DCX.dcx
ZSoft IBM PC multi-page Paintbrush
DDS.dds
Microsoft DirectDraw Surface
DPX.dpx
ภาพ SMTPE 268M-2003 (DPX 2.0)
DXT1.dxt1
Microsoft DirectDraw Surface
EPDF.epdf
รูปแบบเอกสารพกพาที่มีการหุ้มห่อ
EPI.epi
รูปแบบการแลกเปลี่ยน PostScript ที่มีการหุ้มห่อของ Adobe
EPS.eps
Adobe Encapsulated PostScript
EPSF.epsf
Adobe Encapsulated PostScript
EPSI.epsi
รูปแบบการแลกเปลี่ยน PostScript ที่มีการหุ้มห่อของ Adobe
EPT.ept
PostScript ที่มีการหุ้มห่อพร้อมตัวอย่าง TIFF
EPT2.ept2
ระดับ PostScript ที่มีการหุ้มห่อ II พร้อมตัวอย่าง TIFF
EXR.exr
ภาพที่มีช่วงไดนามิกสูง (HDR)
FF.ff
Farbfeld
FITS.fits
ระบบการขนส่งภาพที่ยืดหยุ่น
GIF.gif
รูปแบบการแลกเปลี่ยนกราฟิกของ CompuServe
HDR.hdr
ภาพที่มีช่วงไดนามิกสูง
HEIC.heic
คอนเทนเนอร์ภาพประสิทธิภาพสูง
HRZ.hrz
Slow Scan TeleVision
ICO.ico
ไอคอนของ Microsoft
ICON.icon
ไอคอนของ Microsoft
J2C.j2c
codestream JPEG-2000
J2K.j2k
codestream JPEG-2000
JNG.jng
กราฟิกเครือข่าย JPEG
JP2.jp2
รูปแบบไฟล์ JPEG-2000
JPE.jpe
รูปแบบ JFIF ของกลุ่มผู้เชี่ยวชาญด้านภาพร่วม
JPEG.jpeg
รูปแบบ JFIF ของกลุ่มผู้เชี่ยวชาญด้านภาพร่วม
JPG.jpg
รูปแบบ JFIF ของกลุ่มผู้เชี่ยวชาญด้านภาพร่วม
JPM.jpm
รูปแบบไฟล์ JPEG-2000
JPS.jps
รูปแบบ JPS ของกลุ่มผู้เชี่ยวชาญด้านภาพร่วม
JPT.jpt
รูปแบบไฟล์ JPEG-2000
JXL.jxl
ภาพ JPEG XL
MAP.map
ฐานข้อมูลภาพที่ไม่มีรอยต่อและมีความละเอียดหลายระดับ (MrSID)
MAT.mat
รูปแบบภาพ MATLAB level 5
PAL.pal
พิกซ์แมป Palm
PALM.palm
พิกซ์แมป Palm
PAM.pam
ร ูปแบบบิตแมป 2 มิติทั่วไป
PBM.pbm
รูปแบบบิตแมปพกพา (ขาวและดำ)
PCD.pcd
Photo CD
PCT.pct
Apple Macintosh QuickDraw/PICT
PCX.pcx
ZSoft IBM PC Paintbrush
PDB.pdb
รูปแบบ ImageViewer ฐานข้อมูล Palm
PDF.pdf
รูปแบบเอกสารพกพา
PDFA.pdfa
รูปแบบเอกสารเก็บถาวร
PFM.pfm
รูปแบบลอยพกพา
PGM.pgm
รูปแบบกรายแมปพกพา (สเกลเทา)
PGX.pgx
รูปแบบไม่บีบอัด JPEG 2000
PICT.pict
Apple Macintosh QuickDraw/PICT
PJPEG.pjpeg
รูปแบบ JFIF ของกลุ่มผู้เชี่ยวชาญด้านภาพถ่ายร่วม
PNG.png
กราฟิกเครือข่ายพกพา
PNG00.png00
PNG สืบทอดความลึกบิต, ประเภทสีจากรูปภาพเดิม
PNG24.png24
RGB 24 บิตที่ไม่โปร่งใสหรือโปร่งใสแบบไบนารี (zlib 1.2.11)
PNG32.png32
RGBA 32 บิตที่ไม่โปร่งใสหรือโปร่งใสแบบไบนารี
PNG48.png48
RGB 48 บิตที่ไม่โปร่งใสหรือโปร่งใสแบบไบนารี
PNG64.png64
RGBA 64 บิตที่ไม่โปร่งใสหรือโปร่งใสแบบไบนารี
PNG8.png8
8 บิตที่ไม่โปร่งใสหรือโปร่งใสแบบไบนารี
PNM.pnm
anymap พกพา
PPM.ppm
รูปแบบพิกซ์แมปพกพา (สี)
PS.ps
ไฟล์ Adobe PostScript
PSB.psb
รูปแบบเอกสารขนาดใหญ่ของ Adobe
PSD.psd
บิตแมป Adobe Photoshop
RGB.rgb
ตัวอย่างสีแดง, สีเขียว, และสีน้ำเงินดิบ
RGBA.rgba
ตัวอย่างสีแดง, สีเขียว, สีน้ำเงิน, และสีอัลฟาดิบ
RGBO.rgbo
ตัวอย่างสีแดง, สีเขียว, สีน้ำเงิน, และความทึบดิบ
SIX.six
รูปแบบกราฟิก DEC SIXEL
SUN.sun
Sun Rasterfile
SVG.svg
กราฟิกเวกเตอร์ขนาดยืดหยุ่น
TIFF.tiff
รูปแบบไฟล์ภาพที่มีแท็ก
VDA.vda
ภาพ Truevision Targa
VIPS.vips
ภาพ VIPS
WBMP.wbmp
ภาพ Bitmap ไร้สาย (ระดับ 0)
WEBP.webp
รูปแบบภาพ WebP
YUV.yuv
CCIR 601 4:1:1 หรือ 4:2:2
คำถามที่ถามบ่อย
ทำงานอย่างไร
ตัวแปลงนี้ทำงานอย่างสมบูรณ์ในเบราว์เซอร์ของคุณ เมื่อคุณเลือกไฟล์ ไฟล์จะถูกอ่านเข้าไปในหน่วยความจำและแปลงเป็นรูปแบบที่เลือก จากนั้นคุณสามารถดาวน์โหลดไฟล์ที่แปลงแล้วได้
การแปลงไฟล์ใช้เวลานานเท่าใด
การแปลงจะเริ่มขึ้นทันที และไฟล์ส่วนใหญ่จะถูกแปลงภายในเวลาไม่ถึงหนึ่งวินาที ไฟล์ขนาดใหญ่อาจใช้เวลานานกว่านั้น
จะเกิดอะไรขึ้นกับไฟล์ของฉัน
ไฟล์ของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ของเรา ไฟล์เหล่านั้นจะถูกแปลงในเบราว์เซอร์ของคุณ จาก นั้นไฟล์ที่แปลงแล้วจะถูกดาวน์โหลด เราไม่เคยเห็นไฟล์ของคุณ
ฉันสามารถแปลงไฟล์ประเภทใดได้บ้าง
เรารองรับการแปลงระหว่างรูปแบบภาพทั้งหมด รวมถึง JPEG, PNG, GIF, WebP, SVG, BMP, TIFF และอื่นๆ
ค่าใช้จ่ายเท่าไหร่
ตัวแปลงนี้ฟรีโดยสมบูรณ์ และจะฟรีตลอดไป เนื่องจากทำงานในเบราว์เซอร์ของคุณ เราจึงไม่ต้องจ่ายค่าเซิร์ฟเวอร์ ดังนั้นเราจึงไม่เรียกเก็บเงินจากคุณ
ฉันสามารถแปลงหลายไฟล์พร้อมกันได้หรือไม่
ใช่! คุณสามารถแปลงไฟล์ได้มากเท่าที่คุณต้องการในคราวเดียว เพียงเลือกหลายไฟล์เมื่อคุณเพิ่ม