1993년의 한 인쇄소가 플로피 디스크로 파일을 받았습니다. Microsoft Word 문서였는데, 클립 아트와 인쇄소에 없는 사용자 정의 폰트가 포함되어 있었습니다. 파일을 열자 여백이 무너지고, 글머리 기호가 사각형으로 바뀌며, 로고가 다음 페이지로 밀려났습니다. 고객은 다음 날 작업물을 받고는 비용을 지불하기를 거부했습니다.
이는 일상적인 문제였습니다. PDF 이전의 모든 문서 포맷은 수신자가 발신자와 똑같은 소프트웨어, 폰트, 프린터를 갖고 있다고 가정했습니다. PDF는 페이지를 실제 인쇄될 모습 그대로 기술하고, 폰트와 이미지를 파일 자체에 담아 이 문제를 해결했습니다.
PDF란 무엇인가
PDF는 Portable Document Format의 약자입니다. 핵심적으로는 하나 이상의 페이지에 대한 고정된 기술을 저장하는 컨테이너 파일입니다. 각 페이지는 그리기 명령의 흐름으로 정의됩니다. 여기로 이동, 이 폰트로 이 글리프를 그림, 이 크기로 이 이미지를 배치하는 식입니다. 결과는 LaserWriter, Windows PC, 팩스 기기에서 모두 동일하게 보입니다.
PDF 파일은 자체 폰트, 색상 프로파일, 벡터 그래픽, 래스터 이미지, 메타데이터, 주석, 양식 필드, 디지털 서명, JavaScript를 담을 수 있습니다. 선형화(linearization)를 통해 전체 파일이 다운로드되기 전에 웹 브라우저가 첫 페이지를 보여줄 수도 있습니다. 태그를 추가하면 스크린 리더가 제목과 캡션을 구분할 수 있습니다.
이 포맷은 단순히 고정된 이미지가 아닙니다. Adobe의 초기 페이지 기술 언어인 PostScript와 동일한 이미징 모델을 기반으로 한 구조화된 바이너리 파일입니다.
PDF의 기원
Adobe의 공동 창업자인 John Warnock이 PDF의 시초가 된 프로젝트를 시작했습니다. 1991년 그는 "The Camelot Project"라는 내부 문서를 작성했는데, 어떤 문서라도 모든 기기에서 안정적으로 보고 인쇄할 수 있는 시스템을 기술했습니다. 서로 호환되지 않는 워드 프로세서, 스프레드시트, 데스크톱 출판 도구들이 일으키는 혼란을 해결하려는 아이디어였습니다.
Adobe는 1993년 첫 PDF 사양과 Acrobat 소프트웨어를 출시했습니다. 초기 성장은 더뎠습니다. Acrobat Reader는 처음에는 물료가 아니었고, 웹은 거의 존재하지 않았습니다. Microsoft Office가 PDF를 내보내기 시작한 것은 2007년이었습니다. 오랫동안 PDF는 주로 전문 인쇄 및 출판용 포맷이었습니다.
두 가지 사건이 PDF의 궤적을 바꿨습니다. 2008년 Adobe는 ISO 32000 하에 PDF 사양을 개방 표준으로 공개했습니다. 이는 누구나 Adobe에 비용을 지불하지 않고 PDF를 읽거나 쓰는 소프트웨어를 만들 수 있음을 의미했습니다. 이어 스마트폰과 이메일 첨부 파일이 플랫폼 간 문서 공유를 일상화했고, PDF는 이미 그중에서도 가장 안전한 방법이었습니다.
PDF가 존재하는 이유
PDF 이전에 문서를 보낸다는 것은 약속을 보내는 것과 같았습니다. Word 파일은 수신자가 올바른 폰트, 올바른 버전, 올바른 프린터 드라이버를 갖고 있기를 약속했습니다. PostScript 파일은 수신자가 PostScript 인터프리터를 갖고 있기를 약속했습니다. 일반 텍스트 파일은 수신자가 레이아웃에 관심이 없기를 약속했습니다.
PDF는 그러한 약속을 없앴습니다. 파일은 렌더링에 필요한 모든 것을 스스로 가지고 있습니다. 1998년 Mac에서 만든 PDF도 2026년 Linux 기기에서 여전히 올바르게 열립니다. 그 안정성이 바로 PDF의 핵심입니다.
이 포맷은 아카이빙 문제도 해결했습니다. 종이 기록은 훼손되고, 디지털 기록은 소프트웨어가 바뀌면서 더 빨리 손상됩니다. PDF/A는 PDF의 엄격한 하위 집합으로, 장기 보존을 위해 설계되었습니다. 외부 리소스에 의존하는 기능을 금지하고, 폰트 임베딩을 요구하며, 시각적 모습을 고정하여 미래의 소프트웨어가 레이아웃을 재해석하지 못하게 합니다.
오늘날 PDF가 사용되는 곳
PDF는 어디에서나 동일하게 보여야 하는 모든 것의 기본 컨테이너가 되었습니다.
- 법적 및 정부 서류: 법원, 세무 기관, 계약 워크플로우는 고정 레이아웃 문서에 의존합니다.
- 의료 기록: PDF/A는 환자 파일과 영상 검사 보고서의 일반적인 아카이브 포맷입니다.
- 학술 출판: 대부분의 학술지는 수식과 그림이 그대로 유지되어야 하므로 논문을 PDF로 배포합니다.
- 송장 및 영수증: 기업은 서식이 어긋나지 않도록 템플릿에서 PDF를 생성합니다.
- 양식: PDF는 입력 가능한 필드, 체크박스, 디지털 서명을 지원합니다.
- 전자책: 고정 레이아웃 서적, 교재, 만화는 종종 재배열 가능한 EPUB 대신 PDF를 사용합니다.
- 페이지 추출: PDF의 한 페이지를 이미지로 필요로 할 때, PDF to JPG, PDF to PNG, PDF to WebP 같은 도구는 파일을 업로드하지 않고 로컬에서 변환합니다.
마지막 항목은 프라이버시에 중요합니다. PDF에는 계약서, 신분증, 금융 기록이 자주 포함됩니다. 브라우저에서 변환하면 데이터가 사용자 기기에 남습니다.
다른 문서 포맷과 비교
PDF가 유일한 선택은 아닙니다. 각 포맷은 서로 다른 목적에 최적화되어 있습니다.
| 포맷 | 강점 | 약점 |
|---|---|---|
| DOCX / ODT | 편집이 쉬움 | 버전과 폰트에 따라 레이아웃이 변함 |
| HTML | 어떤 화면에도 재배열 가능 | 인쇄 레이아웃은 예측하기 어려움 |
| EPUB | 전자책 리더용으로 설계됨 | 재배열 텍스트가 고정 디자인을 망침 |
| PostScript | 정밀한 프린터 제어 | 상호작용 불가, 내장 폰트 없음 |
| XPS | Microsoft의 고정 레이아웃 대안 | 널리 채택되지 못함 |
| DjVu | 스캔 문서에 뛰어남 | 틈새 지원, 편집이 어려움 |
| TIFF / PNG 이미지 | 픽셀 단위 완벽한 시각 효과 | 검색 불가, 파일 크기가 큼 |
| 일반 텍스트 | 보편적이고 용량이 작음 | 서식이 전혀 없음 |
PDF는 그중 중간에 위치합니다. 편집 가능한 포맷보다 시각적 충실도를 잘 유지하면서도, 이미지 폴더보다 용량이 작고 유용합니다.
PDF가 업계 표준이 된 이유
여러 요인이 PDF의 위치를 확고히 했습니다.
첫째, Adobe가 물료로 배포했습니다. Acrobat Reader는 1994년에 물료가 되었고, Adobe는 컴퓨터에 사전 설치되고 브라우저와 번들링되도록 적극적으로 추진했습니다. 경쟁자가 나타날 물렙, 사용자들은 이미 PDF를 여는 방법을 알고 있었습니다.
둘째, 운영체제가 채택했습니다. macOS는 PDF를 기본적으로 렌더링합니다. iOS와 Android는 별도 설정 없이 PDF를 열 수 있습니다. Windows도 기본 리더를 추가했습니다. 이 포맷은 보이지 않는 인프라가 되었습니다.
셋째, ISO 표준화가 법적 리스크를 없앴습니다. 기업은 라이선스 협상 없이 제품에 PDF 지원을 내장할 수 있게 되었습니다.
넷째, PDF는 경쟁 포맷이 완전하게 해결하지 못한 실제 문제를 해결했습니다. Word 문서는 변합니다. HTML 페이지는 재배열됩니다. 이미지는 정적입니다. PostScript는 프린터 전용입니다. PDF는 PostScript의 고정 페이지와 독립적 파일의 이식성을 결합했습니다.
PDF의 장단점
| 항목 | 장점 | 단점 |
|---|---|---|
| 충실도 | 거의 모든 기기에서 동일하게 보임 | 작은 화면에 맞추기 어려움 |
| 이식성 | 임베딩된 폰트로 자급자족 | 바이너리 포맷은 리더가 필요함 |
| 아카이빙 | PDF/A가 수십 년간 시각적 모습을 보존 | 유효하려면 엄격한 규칙을 따라야 함 |
| 보안 | 암호화, 교정, 서명 지원 | 비밀번호와 권한은 우회될 수 있음 |
| 검색 | 올바르게 인코딩되면 텍스트 선택 가능 | 스캔한 PDF는 검색하려면 OCR이 필요함 |
| 편집 | 설계상 편집이 어려움 | 최종본에는 좋지만 초안에는 불편함 |
PDF의 불편한 부분
PDF는 완성된 문서에는 훌륭하지만, 그 외의 용도에서는 답답합니다.
PDF를 편집하려면 보통 유료 소프트웨어를 구매하거나 다소 불편한 물료 도구를 감수해야 합니다. 텍스트 추출은 PDF가 문자를 읽기 순서가 아니라 위치별로 저장하기 때문에 자주 깨집니다. 두 단 레이아웃에서 단락을 복사하면 줄들이 뒤섞일 수 있습니다. 표를 추출하면 열들이 하나로 뭉개집니다.
양식은 또 다른 골칫거리입니다. PDF 양식 필드는 단순해 보이지만 리더마다 동작이 일관되지 않습니다. 작성한 PDF 양식을 제출하려면 이메일 클라이언트나 수년 전에 작동을 멈춘 서버 스크립트가 필요할 때도 있습니다.
스캔 PDF는 특히 문제가 많습니다. 문서처럼 보이지만 실제로는 이미지입니다. OCR 없이는 텍스트를 검색하거나 복사하거나 크기를 조정할 수 없습니다. 사용자가 흑백 송장을 컬러로 600 dpi로 스캔하면 파일 크기도 급격히 커집니다.
모바일에서 읽기는 불편합니다. PDF 페이지는 고정된 사각형입니다. 글자를 읽기 위해 확대하면 매 줄마다 가로로 스크롤해야 합니다. 재배열 가능한 포맷이 휴대폰에 더 적합합니다.
PDF의 미래
PDF는 사라지지 않을 것입니다. ISO 32000-2, 즉 PDF 2.0은 2017년에 출판되었으며 현대적인 사용 환경에 맞게 포맷을 업데이트했습니다. 유니코드 처리, 디지털 서명, 접근성 태깅이 개선되었습니다.
더 큰 변화는 PDF를 사용하는 방식입니다. 클라우드 서비스는 이제 브라우저 안에서 PDF를 변환, 병합, 분할, 서명합니다. PDF 파서는 송장 추출, 계약 분석, 자동 데이터 입력을 지원합니다. 머신러닝 시스템은 문서 파이프라인의 일부로 PDF를 읽습니다.
접근성도 개선되고 있습니다. 태그가 달린 PDF, 구조화된 제목, 대체 텍스트는 스크린 리더에 덜 적대적인 포맷을 만듭니다. EU와 미국의 규제 기관은 정부 문서에 접근성이 높은 PDF를 점점 더 요구하고 있습니다.
이 포맷은 아마도 이를 만드는 많은 애플리케이션보다 오래 살아남을 것입니다. 이것이 PDF의 이상한 승리입니다. 1990년대의 문제를 너무 철저하게 해결해서 해결책 자체가 보이지 않게 되었습니다.



