구글의 혁신적인 AI 시스템 '잉크사이트', 손글씨의 디지털 혁명을 이끌다
여러분은 손으로 쓴 메모나 노트를 디지털로 변환하고 싶었던 경험이 있으신가요? 구글이 이런 고민을 해결할 획기적인 AI 시스템을 선보였습니다. 바로 손글씨를 디지털로 완벽하게 변환하는 '잉크사이트(InkSight)'입니다.
단순한 OCR을 넘어선 혁신적인 기술
지금까지 손글씨를 디지털화하는 방식은 주로 OCR(광학문자인식)이었습니다. 하지만 OCR은 단순히 텍스트를 인식할 뿐, 손글씨만의 독특한 특징과 스타일은 사라져버리는 한계가 있었죠.
잉크사이트는 이러한 한계를 뛰어넘었습니다. 이 시스템은 손글씨의 모든 펜 움직임을 '스트로크(stroke)'라는 형태로 포착해, 원본 손글씨의 특징을 그대로 살리면서도 자유롭게 편집할 수 있는 디지털 노트를 만들어냅니다.
![]() |
"이상한 나라의 앨리스"의 한 페이지를 원래 형태(왼쪽)와 잉크사이트가 디지털로 변환한 후(오른쪽)로 보여준다. (사진=구글)출처 : AI타임스(https://www.aitimes.com) |
놀라운 정확도와 성능
잉크사이트의 성능은 실제 테스트에서도 빛을 발했습니다.
- 생성된 샘플의 87%가 실제 사용 가능한 수준으로 평가
- 67%는 인간의 필체와 구분할 수 없을 정도로 정교
- 열악한 조명, 지저분한 배경, 심지어 일부가 가려진 텍스트도 처리 가능
강력한 기술력의 집약체
잉크사이트의 핵심에는 다음과 같은 첨단 기술이 숨어있습니다:
- ViT 인코더와 mT5 인코더/디코더를 활용한 고도화된 처리 시스템
- 손글씨 궤적을 토큰으로 변환하는 특별한 토크나이저
- 3억 4천만 개(스몰 모델)에서 10억 개(라지 모델)에 이르는 방대한 매개변수
누구나 사용할 수 있는 오픈 기술
구글은 이 혁신적인 기술을 모든 사람이 활용할 수 있도록 공개했습니다. 깃허브에서 모델과 코드를 다운로드할 수 있으며, 허깅페이스에서 직접 데모를 체험해볼 수 있죠.
미래의 가능성
구글이 "손글씨 이미지를 디지털 잉크로 변환하는 최초의 접근 방식"이라고 소개한 이 기술은, 디지털 노트테이킹의 새로운 지평을 열 것으로 기대됩니다.
손글씨의 따뜻함과 개성을 그대로 살리면서도 디지털의 편리함을 누릴 수 있게 된 지금, 우리의 필기 문화는 어떻게 변화할까요? 잉크사이트가 가져올 디지털 혁신이 기대되는 이유입니다.