태그 보관물: 문서디자인

[MS Word] 문서디자인 교정기 개발 과정 기록 2

다른 일 때문에 한 달여 손을 놓았었지만, 이 문서와 씨름한 지는 꽤 되었다.
설마 이렇게 문서를 작성하는 사람이 있을까 싶지만, 워드프로세서에서도 표와 글상자를 적극 활용하는 경우도 있을 테고 이 문서 역시 실제 사용되고 있는 서식이다. (다만, 이 문서는 원래 HWP 형식이었으며 DOCX로 변환하면서 더 극악의 상태로 바뀌었다.)
코드를 짜면서 표 변환 및 플로팅 객체(Floating objects)로 구성된 문서에서 생기는 수많은 변수를 경험하는 데 도움이 되긴 했지만, 변환 대상 문서를 수정하지 않고 오류를 잡는 데 한계가 있어서 이 문서 변환은 여기까지 할까 싶다. 수정하고 싶어도 문서 자체에 전혀 손을 못 대겠다. 뭐가 어떻게 꼬인 건지 문서만 봐서는 보이지도 않고.

어느 프로그램이든 마찬가지이겠지만 프로그램은 체계적으로 사용해야 이후 생각지 못한 오류가 발생하지 않는다. 눈으로 보기에는 그럴 듯해도 XML 열어보면 정말 한숨만 나온다. 한컴한글도 그렇지만, MS워드는 특히 플로팅 방식이 아니라 인라인으로 개체를 삽입해야 문서를 작성하고 수정하기에 쉽다. 워드프로세서는 기본적으로 긴 글을 작성하는 용도의 프로그램이어서 그렇지 않을까 싶다.

다음에는 조금 상태가 나은 다른 유형의 문서를 구해서 테스트해 보기로. 기본 서식에 변화를 주는 단계까지 가려면 아직도 머나멀다.

2021.2.14 캡처본

[MS Word] 문서디자인 교정기 개발 과정 기록 1

아무도 요청하지 않았지만, 혼자 궁금해서 하는 프로젝트.
내용을 작성한 뒤 MS Word 파일을 입력하면, 서식을 교정한 MS Word 파일을 생성하는 방식. 신규 ‘디자인’이 아니라 ‘교정’이 목표. ‘교정’의 범위와 정확도를 어느 정도로 넓히고 높힐 수 있을지가 관건.
MS Word의 XML 구조 파악 및 스타일 변환 TEST, TEST, TEST.
테스트용 원고로는 설정한 대로 단순 변환 가능.
다른 이가 배포한 원고로는 ERROR, ERROR, ERROR.
(왜 문서를 이렇게 복잡하게 만드는 걸까 싶지만, 나처럼 문서를 정리하면서 만드는 사람이 얼마나 될까 싶기도 하고…)
변수는 많고 갈 길은 멀다.

2020.12.24 캡처본