[Text Analysis] 사라져 가는 디자인 어휘?

1997~2020년 디자인 학술 말뭉치에서 첫 출현, 마지막 출현 어휘 수 변화 (한 해 출현 어휘 제외)

작년에 박사학위 논문을 쓰면서, 인과관계를 정확히 따지자면 말뭉치(corpus)를 어느 정도 만든 뒤에 학위 논문을 쓰기로 결정한 것이지만, 디자인 분야의 한국연구재단 등재지 중 종합 학술지 3종(디자인학연구, 한국디자인문화학회지, 한국디자인포럼)에 2018년까지 게재된 한글 논문을 말뭉치로 만들었다. 얼마 전에 2020년 게재분까지 업데이트했고, 현 말뭉치를 만드는 데 사용된 논문 수는 총 7,209편이다.
내가 궁금한 건 디자인 분야의 언어 전반이 아닌 한글 용어의 사용 양상이고 용어는 일반적으로 명사형이기 때문에 사전 만드시는 분들처럼 형태소 분석을 정교하게 해 놓은 상태는 아니다. 형태소 분석에는 Mecab-kr을 사용했고, 사용자사전을 만들어서 추가했다. 사실 형태소 분석 할 때 핵심은 이 사용자사전이 아닌가 싶다. 분절어1를 해결하기 위해 두 어절의 연관성을 측정하는 PMI(Pointwise Mutual Information) 방식도 활용하기는 했지만, 애초에 분절어가 적게 나오는 게 가장 좋으니까. 지금 이 사용자사전에 포함된 단어는 약 4,900개이다. (이 사전은 형태소 분석 과정에서 분절어가 나오지 않게 하는 데 주 목적이 있기 때문에 이 자체를 용어집과 같은 용도로 쓸 수는 없다.)
1 이 글에서 ‘분절어’는 한 어절이 임의로 분절되어 생긴 의미 없는 단어를 말한다. 예를 들어 ‘아이디어’가 ‘아+이+디어’로 분절되거나 ‘서비스가’가 ‘서비+스가’로 분절되는 식이다.

개인적으로 이 말뭉치로 기본적인 빈도 분석이나 토픽 분석을 한 뒤 대시보드 형태로 만들어서 살펴 보고 있는데, 가끔 보면 재밌는 현상들이 있다. 이런 걸 ‘재밌다’고 표현하는 게 이상한가 싶지만.ㅎ 이미 학위논문에 실었던 내용이기는 하지만, 디자인 학술 말뭉치에서 출현 어휘 수 동향이 특히 그렇다.
세 종 학술지가 모두 발행되기 시작한 1997년 이후로 그래프를 편집했지만, 첫 출현 어휘는 이미 그 전부터 그 수가 급격히 줄어들고 있었다. 위 그래프에는 한 해만 출현한 어휘는 포함되어 있지 않다. 다시 말해 연속적이지 않더라도 두 해 이상 사용되는 단어들이 출현하는 경우가 디자인 분야 논문에서는 줄어들고 있는 것이다. 반면 특정 해를 마지막으로 출현하지 않는 어휘는 급격하게 증가하고 있다. 그렇다고 전체적으로 어휘 규모가 줄어들었느냐? 그렇지 않다.

디자인 학술 말뭉치의 연도별 어휘 규모

어휘 규모와 어휘 출현 양상 간에 딱히 상관관계는 보이지 않는다. 2009년을 기점으로 마지막 출현 어휘 수는 첫 출현 어휘 수를 넘어섰다. 이 시기는 아이폰이 처음 출시되고 태블릿PC 시장이 급성장하던 시기와 맞물린다. 최근까지 급격히 사라지고 있는 어휘는 디자인 분야에서 지나간 기술에 대한 혹은 시의성이 큰 단어들일 가능성이 높다. 그러나 기술의 발전, 시대적 변화가 그 이전과는 비교할 수 없을 만큼 빠르기에 첫 출현 단어는 계속해서 감소하고 있는 것으로 보인다. 위 그래프에는 표시하지 않았지만 2017년 이후에는 한 해에만 사용되고 사라지는 어휘가 크게 증가했는데 이 역시 이런 추론에 힘을 실어준다.
그렇다면 모든 해에 꾸준히 등장한 어휘는 디자인 분야의 핵심 어휘로 볼 수 있지 않을까 하는 생각이 들 수도 있지만, 단순히 사용 빈도가 높다고 해서 어휘의 중요도가 높아지는 건 아니어서 여러모로 살펴 봐야 한다. 언젠가는 디자인 분야의 기본 어휘를 찾을 수 있을까? ㅎ

[한글 타이포그래피 안내서] 인쇄 감리

2021.10.20. 파주출판도시 2단지. 2012년에 『좋은 문서디자인 기본 원리 29』를 인쇄했던 곳…

그러려니 하긴 하지만 결과물을 보니 인쇄, 제본 모두 품질이 아쉽다.

[덧]
이 책의 표지는 문서디자인 책의 표지와 콘셉트가 크게 다르지 않다. 문서디자인의 경우 그 책의 표지를 응용할 수 있도록 수치를 제시했고, 한글 타이포그래피 안내서는 이 책의 내지를 재현해 볼 수 있도록 수치를 제시했다.
다만 뒤표지의 Y100 영역, 곧 노란색 상자는 내가 화면에서 작업하며 선택한 색이 어떤 인쇄용지를 선택하는지에 따라 인쇄물에서는 전혀 다르게 보일 수 있음을 보여주기 위한 하나의 보기이다. 인쇄물에서 흰색은 ‘백색’이 아니라 ‘종이 색’이기 때문이다. (관련 설명이 본문에 있고 내지를 4도로 인쇄했다면 해당 위치에 보기를 넣었겠지만, 별색 2도로 작업한 탓에 그럴 수가 없었다.)
아니, 그런 의도가 있으면 누구나 알 수 있도록 설명을 넣어야지 왜 넣지 않았느냐고 의문을 가질 분들도 있겠다. 하지만 그런 것까지 설명하는 게 구구절절해 보이기도 하고 사실은 그런 의도가 누군가에게 우연히 발견되길 바라는 어줍잖은 마음도 한켠에 있었다. 표지와 내지를 잇는 면지를 노란 색지로 고르면서 이런 장치가 그런 발견에 조금은 도움이 되지 않을까 싶었지만, 영원히 아무에게도 발견되지 않을지도 모른다… (그래서 이런 기록을 남기는 건가.)
이 책은 재쇄할 때마다 표지 종이를 달리하여 뒤표지의 노란색이 매번 다른 색으로 보이도록 할 예정이다. 과연 몇 쇄나 찍을 수 있으려나?

[예전글] 2019.5.13

사람은 사고나 질병으로, 간절히 노력하지 않으면 살아있을 수 없는 날들을 맞기도 한다. 아프기 전처럼 숨 쉬고, 먹고, 자고, 누고, 걷기 위한 노력들은 생각보다 훨씬 힘겹고 몸의 통증이란 건 무뎌지기는커녕 저보다 더 큰 두려움을 나날이 몸과 마음에 새긴다.

그럼에도 사람이 ‘나는 살아나고 말겠다’는 어려운 선택을 하는 이유는, 살아있을 이유가 있기 때문이다. 이 땅에 아직 자신이 할 일이 남았다고 느끼기 때문이다. 즉 그 일은 이 땅에서 그이에게 가장 중요한 일이자 자신의 존재 가치를 온전히 느끼게 하는 일이다.

그러니 그이를 살리기 위한 과정이 그이에게서 그 일을 멀어지게 한다면 그 살아남이 무슨 의미가 있겠는가.

[OpenCV] 글자 무게중심 찾기

‘대한교과서 50년사'(1998)에서 집자한 대교바탕 ‘따’

OpenCV 패키지를 이용하여 글자 윤곽을 따라 다각형을 그린 뒤 무게중심(붉은색)과 기하중심(푸른색)을 비교했다. 보통 타이포그래피 분야 논문에서는 글자의 윤곽 형태를 비교하는 경우가 많은데, 포토숍 등에서 그리다보면 시간이 많이 걸리기도 하고 수동으로 하다보니 꼭지점을 잡는 기준이 자꾸 바뀌기도 한다. 무엇보다 무게중심을 계산하는 데 시간이 많이 걸린다. 시각중심이 아닌 무게중심을 눈대중으로 찾을 순 없으니까.
이 방식이 활자체의 가독성을 판단하는 데 얼마나 유효한 방식인지는 조금 더 연구해 봐야겠지만, 일단 개인적으로 흥미가 가는 질문들이 여럿 떠오른다. 물질적, 시간적 여유가 없어서 아쉬울 뿐.

이번에 짠 코드로는 낱자가 연결된 글자 형태밖에 분석이 안 된다. 낱자가 분리된 형태까지 분석하려면 코드를 업데이트해야 하는데 그건 다음에. 당장은 귀찮아서 포토숍에서 낱자를 연결한 다음에 입력하는 꼼수 부리기.ㅎ

[타이포그래피] 부리체, 민부리체

[타이포그래피] 부리
≒ 세리프
낱자를 이루는 줄기의 시작과 맺음에 있는 두드러지게 불거진 부분이나 짧은 줄기.
로마자 타이포그래피 용어인 ‘세리프’의 대역어이다. 한글 활자체에서 ‘부리’는 전통적으로 붓자국을 의미했지만, 현재는 그렇지 않으며 다양한 형태의 ‘부리’를 가진 한글 활자체가 공개되어 있다.

[타이포그래피] 부리체
≒ 세리프체
낱자를 이루는 줄기의 시작과 맺음에 두드러지게 불거진 부분이 있거나 짧은 줄기가 붙은 활자체 유형.
로마자 타이포그래피 용어인 ‘세리프’가 ‘세리프가 있는 활자체’를 의미하는 경우의 대역어이다. 부리체에 해당하는 한글 활자체에는 문체부 바탕체, 나눔명조, 본명조, 조선일보 명조체, 고운한글 바탕 등이 있다.

[타이포그래피] 민부리체
≒ 산세리프체
낱자를 이루는 줄기의 시작과 맺음에 두드러지게 불거진 부분이 없으며, 하나의 줄기에서 굵기 변화가 거의 없는 활자체 유형.
로마자 타이포그래피 용어인 ‘산세리프’의 대역어이다. 민부리체에 해당하는 한글 활자체에는 나눔고딕, 본고딕, 아리따 돋움 등이 있다.

2021.4.23 by key



국내외 디자인사전에서 내린 정의

[타이포그래피] 부리 serif
줄기의 처음이나 맺음 부분에 튀어나온 부분(주로 바탕체 계열의 경우). 로마자의 세리프에 해당된다. (동의어: 돌기, 잎사귀)

[타이포그래피] 부리 글자 serif type
줄기의 처음이나 맺음 부분이 튀어 나온 글자체의 종류를 말함. 바탕체가 여기에 해당된다.

[타이포그래피] 부리꼴
부리의 생김새. 글자 줄기의 시작 부분과 맺음 부분이 꺾어 지거나 돌출된 형태

[타이포그래피] 민부리 글자
글자 줄기의 처음이나 맺음 부분에 부리가 없는 글자꼴. 바탕체는 ‘부리글자’에 속하며, 돋움체가 ‘민부리글자’에 속한다. (후략)

[타이포그래피] 민부리꼴
부리가 없는 모양

한글글꼴용어사전, 2000, 세종대왕기념사업회 한글글꼴개발원

[타이포그래피] 부리
글자 줄기의 머리나 맺음에서 꺾이거나 튀어나온 부분 (참조어: 세리프, 동의어: 돌기)

[타이포그래피] 부리글자
부리가 있는 글자꼴 (참조어: 민부리글자, 동의어: 명조체[2])

[타이포그래피] 민부리글자
글자 줄기의 머리나 맺음에 부리가 없는 글자체 (참조어: 부리글자, 동의어: 고딕체[2])

타이포그래피 사전, 한국타이포그라피학회, 2012, 안그라픽스

[타이포그래피] 레터링 lettering
…… 여기에서 서양글자의 각부의 명칭을 설명하면, …… 글자의 선의 시점 또는 종점에 있는 돌출선을 세리프(Serif), (후략)

디자인 用語辞典. 1977. 미진사

[Typography] serif
The short counterstroke or finishing stroke at the end of the main stroke of a type character. (후략)

[Typography] sans serif
Generic description of type designs that lack the small extensions (serifs) at the ends of the main strokes of the letters and that are usually without stroke contrast. (후략)

the designer’s LEXICON. 2000. Chronicle Book

[Typography] SERIF
A small stroke at the end of a character’s main strokes. Serif is also commonly used when referring to a broad range of typefaces with serifs (though they are more correctly called seriffed typefaces), so as to distinguish them from an equally broad category of those without, called sans serif typefaces. (후략)

GRAPHIC DESIGN TRANSLATED. 2010. ROCKPORT


붙임 2021.4.23 by key

  • 한글글꼴용어사전(2000)에서는 ‘부리 글자’와 ‘민부리 글자’가 각기 ‘바탕체(명조체)’와 ‘돋움체(고딕체)’의 상위 개념임을 밝히고 있다. 다만 사전에서 ‘글자체’와 ‘글자꼴’의 의미를 구분하고 있음에도 이를 정의에서 구분하여 사용하지 않고, 두 올림말이 ‘글자체의 종류’를 의미함에도 이를 ‘~글자’로 표기하여 상하위어 간에 개념상 혼란을 일으킨다.
  • 타이포그래피 사전(2012)에서 내용을 살폈을 때 ‘부리글자’의 동의어는 ‘명조체[2]’가 아니라 ‘명조체[3]’이며 편집상의 오류이다. 한글글꼴용어사전(2000)과 마찬가지로 올림말 정의에서 ‘글자체’와 ‘글자꼴’을 정확히 구분하여 사용하지 않고 있다.
  • 일본 디자인사전을 번역한 디자인 用語辞典(1977)은 ‘세리프’를 서양글자의 각부 명칭으로 설명하고 있으며 이에 대응하는 개념이나 용어는 소개되어 있지 않다. ‘우리나라'(로 표기되어 있으나 실제로는 일본을 의미한다.) 활자체 유형으로는 상위 개념 없이 바로 명조체, 고딕체, 궁체, 송조체 등을 소개하고 있다.
  • 해외 디자인사전에서 ‘세리프’는 글자를 이루는 줄기 끝에 붙은 형태라는 점은 ‘부리’와 같으나 돌기가 아닌 줄기(선)으로서 정의된다. 이는 로마자에서 세리프는 돌에 새긴 형태에서 시작되었기 때문이다.
  • 해외 디자인사전에 따르면 ‘세리프’는 줄기 끝에 붙은 형태이자 그런 형태를 가진 활자체를 의미하기도 한다. 반면 한국 사전에 따르면, 한국어 용어인 ‘부리’는 전자의 의미로만 사용되며, 부리를 가진 활자체는 구분하여 ‘부리 글자’로 적는다.
  • 사전에 등재된 용어임에도 아직 한국에서 ‘부리글자’ ‘민부리글자’의 개념은 완전히 자리잡지 못한 것으로 보인다. 특히 명조체, 고딕체의 상위 개념으로 제시된 두 용어를 대체어인 듯 모호하게 사용하고 있는 점도 그에 영향을 미쳤다. ‘부리글자(글꼴)’ ‘민부리글자(글꼴)’를 ‘명조체/바탕체’와 ‘고딕체/돋움체’의 대체어로 사용하는 배경에는 ‘명조체’ ‘고딕체’ 등의 용어가 한글 활자체 유형을 지시하는 용어로서 적절하지 않아 이를 다른 우리말 용어로 대체하려는 욕구가 큰 비중을 차지한다. 그러나 이미 성문화한 상위 위계의 용어를 하위 위계 용어의 대체어로서 사용하는 일은 적절하지 않으며, 각 활자체 유형이 가진 양식이나 개념을 바탕으로 새로운 용어를 제시함이 바람직하다.

2021.4.22

전문가가 자기 분야에서 용어를 제대로 사용하는 일은 중요하다. 글을 적을 때 특히 그러한데, 디자인 분야에서는 용어를 말할 때뿐 아니라 표기할 때도 그 용어의 정의(definition)가 아니라 개인의 직감이나 통찰력에 따라 쓰는 경향이 있다. 그 감각이 틀렸다는 건 아니지만 많은 사람들이 그러다보니 용어 사용이 지나치게 혼란스럽다.

언어는 사회적 약속이고 대다수가 따라야 의사소통이 원활히 이루어진다. 용어 역시 언어이니 그러한데, 이 분야에서는 사전마저도 따라야 할 기준보다는 하나의 제안, 선택사항처럼 받아들여지는 듯 보인다. (이런 태도는 디자이너들의 기본 속성일지도 모르겠다.) 또한 한국어 용어는 한국어의 범주 안에 있으니 한국어 어문규정을 준수해야 하는데, 이에 대해서도 치외법권이 적용되는 듯한 모습이고. (의도인지 무지인지는 판단하기 어렵다.)

그러니 역시 이 분야에서 용어 사전은 ‘이상’일 뿐 현실에서는 용례가 포함된 유의어 사전 정도가 유효한 게 아닌가 싶기도 하다.

[책] How Designers Think (Bryan Lawson)

How Designers Think―The Design Process Demystified
Bryan Lawson (디자인 연구자, 영국 셰필드 대학교 건축학과 명예교수)
1980 초판 발행. 위의 이미지는 2005년 발행된 네 번째 판.
한국에서 ‘디자이너의 사고방법’이라는 제목으로 1996년 11월에 번역 출간되었으나 현재 절판 상태이다. 영어 원서는 지금도 POD(주문형출판) 방식으로 구매할 수 있으며 구글에서 검색하면 도서 전체 PDF파일을 제공하는 사이트도 있다.

[MS Word] 문서디자인 교정기 개발 과정 기록 2

다른 일 때문에 한 달여 손을 놓았었지만, 이 문서와 씨름한 지는 꽤 되었다.
설마 이렇게 문서를 작성하는 사람이 있을까 싶지만, 워드프로세서에서도 표와 글상자를 적극 활용하는 경우도 있을 테고 이 문서 역시 실제 사용되고 있는 서식이다. (다만, 이 문서는 원래 HWP 형식이었으며 DOCX로 변환하면서 더 극악의 상태로 바뀌었다.)
코드를 짜면서 표 변환 및 플로팅 객체(Floating objects)로 구성된 문서에서 생기는 수많은 변수를 경험하는 데 도움이 되긴 했지만, 변환 대상 문서를 수정하지 않고 오류를 잡는 데 한계가 있어서 이 문서 변환은 여기까지 할까 싶다. 수정하고 싶어도 문서 자체에 전혀 손을 못 대겠다. 뭐가 어떻게 꼬인 건지 문서만 봐서는 보이지도 않고.

어느 프로그램이든 마찬가지이겠지만 프로그램은 체계적으로 사용해야 이후 생각지 못한 오류가 발생하지 않는다. 눈으로 보기에는 그럴 듯해도 XML 열어보면 정말 한숨만 나온다. 한컴한글도 그렇지만, MS워드는 특히 플로팅 방식이 아니라 인라인으로 개체를 삽입해야 문서를 작성하고 수정하기에 쉽다. 워드프로세서는 기본적으로 긴 글을 작성하는 용도의 프로그램이어서 그렇지 않을까 싶다.

다음에는 조금 상태가 나은 다른 유형의 문서를 구해서 테스트해 보기로. 기본 서식에 변화를 주는 단계까지 가려면 아직도 머나멀다.

2021.2.14 캡처본

[타이포그래피] 판짜기, 조판

[타이포그래피] 판짜기
영어 대역어: Typesetting
활자의 배열과 관련하여 일정한 규칙을 세우고 그에 맞춰 글을 흘리는 일.
한자어 용어인 ‘조판’의 우리말 용어로 표준국어대사전에도 등재되어 있으나 디자인 분야에서 널리 사용되고 있지는 않다. 여러 디자인 사전에서 두 용어를 동의어로 설명하고 있으나 현재 출판 분야에서 ‘조판’은 ‘판짜기’의 사전적 정의와 조금 다른 의미로 사용되고 있다.

[타이포그래피] 조판
영어 대역어: Composing
① 전자출판(DTP) 이전 시대에 원고에 따라 활자를 고르고 인쇄용 판을 짜던 일.
② 정해진 활자명세와 판짜기 규칙에 맞춰 원고를 흘리는 일.
③ = 판짜기
출판 분야에서 ‘조판’은 주로 ②번 정의, 곧 디자이너가 세운 조판 규칙에 따라 원고를 흘리는 일로서 사용된다. “이번 작업은 시간이 없어서 안에서 디자인만 잡고 ‘조판’은 업체에 맡겨야겠는데?”와 같은 식이다. 디자이너가 조판 규칙을 세우고 직접 그에 따라 원고를 흘리는 과정은, 대개의 경우 ‘조판’으로 통칭하지 않는다.

2021.2.3 by key

[Typography] comp (2)
abb.: compose, composing, composition. The process of setting type.

[Typography] compositor
…… Traditionally called a ‘typographer’ in the U.S., which, now that the designer has total control over typography, is probably a more appropriate description. (후략)

the designer’s LEXICON. 2000. Chronicle Book


붙임 2021.2.3 key / 2021.2.14 modified

  • 한글글꼴용어사전(2000)에서는 ‘조판’과 ‘판짜기’를 동의어로, ‘판짜기’의 원어를 ‘composing’ ‘composition’으로 제시하고 있다.
  • the designer’s LEXICON(2000)에서는 ‘composing’과 ‘typesetting’을 별도의 올림말로 다루고 있으며, 후자를 전자보다 큰 개념으로 다룬다. 전자가 활자를 배열(set)하는 과정에 한정된다면 후자는 활자 배열을 포함한, 원고를 인쇄에 적합한 상태로 변환하는 과정 전체를 이른다.
  • 위 사전에서는 ‘활자를 배열하는 사람’으로서 ‘compositor(조판공)’를 정의하면서 디자이너가 타이포그래피 전반에 권한을 갖게 된 지금은 ‘typographer(타이포그래퍼)’라는 표현이 더 적절해 보인다고 설명하고 있다.
  • ‘판짜기’ ‘조판’과 관련한 한글 타이포그래피 용어로는 ‘문선’ ‘식자’가 있다. 두 용어 모두 현재 실무에서는 사용되지 않으며 활판인쇄 시대부터 전자출판 이전 시대까지 사용되었다. ‘문선’은 원고에 따라 활자를 고르는 일, ‘식자’는 문선된 활자로 인쇄용 판을 짜는 일이며 이들은 ‘조판’의 과정을 둘로 나눈 것이다.